項目案例
PROJECT CASES信息來(lái)源:大數據中心 添加時(shí)間:2022/06/03 瀏覽次數:3045次
建設國家文化大數據體系是新時(shí)代文化建設的重大基礎性工程,也是打通文化事業(yè)和文化產(chǎn)業(yè)、暢通文化生產(chǎn)和文化消費、融通文化和科技、貫通文化門(mén)類(lèi)和業(yè)態(tài),推動(dòng)文化數字化成果走向網(wǎng)絡(luò )化、智能化的重要舉措。中國數字文化集團(以下簡(jiǎn)稱(chēng)集團)充分發(fā)揮在高端設備、專(zhuān)業(yè)技術(shù)和人才以及在文化資源數字化方面積累的豐富經(jīng)驗與優(yōu)勢,積極服務(wù)于文化和旅游系統數字化,致力于文化和旅游行業(yè)的國家文化大數據體系建設,助力文旅行業(yè)數字化高質(zhì)量發(fā)展。集團大力推動(dòng)音視頻等資源數字化,構建數字資源知識圖譜,通過(guò)接入國家文化專(zhuān)網(wǎng)、裝配底層關(guān)聯(lián)集成系統,激活文化資源數據,打牢文化大數據建設的基礎。
集團擁有專(zhuān)業(yè)的從業(yè)人員、先進(jìn)的數字化設備以及豐富的實(shí)戰經(jīng)驗,可提供各類(lèi)數字化采集,大數據生產(chǎn)、研發(fā)、綜合保護、利用的解決方案,提供專(zhuān)業(yè)、優(yōu)質(zhì)、系統、集約化的服務(wù),做好優(yōu)秀文化內容的數字化采集、標注、關(guān)聯(lián)、解構、重構、呈現、轉化、利用等。
集團數字化業(yè)務(wù)涵蓋音頻、視頻、照片、檔案、字畫(huà)掃描等多項類(lèi)目,本次主要介紹紙質(zhì)檔案數字化業(yè)務(wù)。
數字化是指利用計算機技術(shù)將模擬信號轉換為數字信號的處理過(guò)程。紙質(zhì)檔案數字化則是采用掃描儀等設備對紙質(zhì)檔案進(jìn)行數字化加工,使其轉化為存儲在磁盤(pán)、光盤(pán)等載體上的數字圖像,并按照紙質(zhì)檔案的內在聯(lián)系,建立起目錄數據與數字圖像關(guān)聯(lián)關(guān)系的處理過(guò)程。紙質(zhì)檔案數字化應遵循檔案管理的客觀(guān)規律,真實(shí)反映檔案內容,最大程度地展現檔案原貌。加工涉密檔案時(shí),應按照涉密檔案相關(guān)保密要求開(kāi)展工作。
一、紙質(zhì)檔案數字化的必要性
首先,傳統紙質(zhì)檔案往往數量巨大,不同年份及部門(mén)的檔案文件格式存在不統一的情況,歸檔后占用大量的保管空間,后期的檢索、查閱和管理需要消耗極大的人力物力成本,工作效率較低。其次,紙質(zhì)檔案紙張隨著(zhù)時(shí)間的推移質(zhì)地變得脆弱,頻繁的原件借閱調用,會(huì )加速原件的消耗損毀,稍有不慎更會(huì )造成永久性損壞。再者,受制于地域限制,無(wú)法滿(mǎn)足跨區域異地檔案檢索、查閱、調用功能。還有,其中涉密或權限區分的檔案需單獨管理,難以進(jìn)行靈活授權操作,無(wú)法實(shí)現數據共享。因此,紙質(zhì)檔案的數字化是今后檔案管理發(fā)展的必然趨勢。
二、紙質(zhì)檔案數字化的作用
1.檔案數字化能有效降低非常用紙質(zhì)檔案占用的存儲空間,對已完成數字化的文件及時(shí)轉換騰挪,形成的目錄數據庫及數據掛接方便檢索、查閱和管理,大大節省了人力物力成本,提高工作效率。
2.檔案數字化能有效地保護紙質(zhì)檔案原件。
電子文件代替紙質(zhì)原件使用,減少原件翻閱頻次,保護了檔案原件;可使用電子文件制作副本,實(shí)現永久保存;可有效規避自然災害等不可抗力因素導致的原件永久性破壞;可利用圖像處理技術(shù)對紙質(zhì)檔案材料允許修復的污損情況進(jìn)行美化處理等。
3.檔案數字化能改善檔案的利用方式。
數字化后的電子文件能夠擺脫孤本限制,實(shí)現多人共享;不受時(shí)間限制,可以隨時(shí)使用自己需要的文件;可以通過(guò)計算機局域網(wǎng)或者廣域網(wǎng)進(jìn)行異地傳輸,方便異地調閱利用;擴大了紙質(zhì)檔案的利用空間,為在大數據時(shí)代開(kāi)發(fā)檔案動(dòng)能提供基礎等。
4.檔案數字化權限設置靈活,權限管理界定明確、安全。
三、紙質(zhì)檔案數字化的工作流程
紙質(zhì)檔案數字化的基本環(huán)節主要包括:數字化前處理,目錄數據庫建立,檔案掃描,圖像處理,數據掛接,數據抽檢、驗收與移交等。
1.數字化前處理(檔案整理)
(1)確定掃描頁(yè)。原則上應將確定為數字化對象的紙質(zhì)檔案全部掃描,不宜進(jìn)行挑掃。如有不需要掃描的頁(yè)面應加以標注。
(2)編制頁(yè)號。編頁(yè)應在掃描之前對沒(méi)有編頁(yè)或編頁(yè)不規范的檔案重新進(jìn)行編頁(yè),使用2B鉛筆在紙質(zhì)文件頁(yè)面的右下角或左上角編寫(xiě)頁(yè)號,不應壓蓋而是將原頁(yè)號用鉛筆劃去以示區分。
(3)頁(yè)面修整。破損嚴重或其他無(wú)法直接進(jìn)行掃描或影響掃描質(zhì)量的紙質(zhì)檔案,應先對頁(yè)面進(jìn)行專(zhuān)業(yè)處理后再掃描。
(4)填寫(xiě)備考表。在檔案整理過(guò)程中,如對檔案實(shí)體進(jìn)行過(guò)調整并需要在備考表中注明的,應在備考表中注明。
2.目錄數據庫建立
(1)應制定目錄數據庫數據規則,包括數據字段長(cháng)度、字段類(lèi)型、字段內容要求等。數據規則的制定應符合DA/T 18對檔案著(zhù)錄的要求。
(2)數據庫結構的設計應特別注意保持檔案的內在聯(lián)系,有利于紙質(zhì)檔案數字化成果的管理和利用。
(3)將紙質(zhì)檔案數字化前處理工作中對紙質(zhì)檔案目錄進(jìn)行修改、補充的結果錄入數據庫,形成準確、完整的目錄數據。
(4)及時(shí)校對,對目錄數據的質(zhì)量進(jìn)行檢查,包括著(zhù)錄項目的完整性、著(zhù)錄內容的規范性和準確性等,發(fā)現不合格的數據應及時(shí)進(jìn)行修改。
3.檔案掃描
掃描應根據紙質(zhì)檔案原件實(shí)際情況、數字化目的、數字化規模、計算機網(wǎng)絡(luò )和存儲條件選擇相應的掃描設備,進(jìn)行相關(guān)參數的設置和調整。參數的設置和調整應保證掃描后數字圖像清晰、完整、不失真,圖像效果最接近檔案原貌。掃描后的圖像文件命名應和對應紙質(zhì)檔案的檔號信息保持一致。
掃描參數的選擇和確定對紙質(zhì)檔案數字化文件質(zhì)量有著(zhù)較大影響,其中掃描分辨率直接關(guān)系到掃描文件的清晰度和還原效果。分辨率越高掃描文件就越清晰,其相應的掃描時(shí)間和存儲空間就要增加。我們在選擇分辨率時(shí)應根據實(shí)際需要綜合考慮,包括掃描文件的可閱讀性、存儲空間、輸出打印質(zhì)量等做好檔案數字化的全程控制。
集團配置的虹光A3彩色零邊距掃描儀,可根據數字化需求對掃描彩色、黑白及灰度模式進(jìn)行選擇,分辨率設置通常不低于300dpi,需要進(jìn)行高精度仿真復制的檔案掃描分辨率建議不小于600dpi,電子文件存儲格式為JPEG或TIFF。
4.圖像處理
(1)圖像拼接。對分幅掃描形成的多幅數字圖像,應進(jìn)行拼接處理,合并為一個(gè)完整的圖像,保證紙質(zhì)檔案數字圖像的整體性。拼接時(shí)應確保拼接處平滑地融合,拼接后整幅圖像無(wú)明顯拼接痕跡。
(2)旋轉及糾偏。對不符合閱讀方向的數字圖像應進(jìn)行旋轉還原。對出現偏斜的圖像應進(jìn)行糾偏處理,以達到視覺(jué)上基本不感覺(jué)偏斜為準。
(3)裁邊。如需對數字圖像進(jìn)行裁邊處理,應在距頁(yè)邊最外延至少2mm-3mm處裁剪圖像。
(4)去污。如需對數字圖像進(jìn)行去污處理,以去除在掃描過(guò)程中產(chǎn)生的污點(diǎn)、污線(xiàn)、黑邊等影響圖像質(zhì)量的雜質(zhì),應遵循展現檔案原貌的原則,處理過(guò)程中不得去除檔案頁(yè)面原有的紙張褪變斑點(diǎn)、水漬、污點(diǎn)、裝訂孔等痕跡。
(5)圖像質(zhì)量檢查。對數字圖像進(jìn)行檢查,發(fā)現問(wèn)題及時(shí)重掃或修正。
5.數據掛接
應借助相關(guān)軟件對數據庫中的目錄數據和與其對應的紙質(zhì)檔案數字圖像進(jìn)行掛接,以實(shí)現目錄數據與數字圖像的關(guān)聯(lián)。逐條對掛接結果進(jìn)行檢査,包括目錄數據與紙質(zhì)檔案數字圖像對應的準確性、已掛接數字圖像與實(shí)際掃描數量的一致性、數字圖像是否能正常打開(kāi)等,發(fā)現錯誤及時(shí)進(jìn)行糾正。
6.數據抽檢、驗收與移交
以抽檢方式檢查目錄數據庫、圖像文件、數據掛接的質(zhì)量以及數字化工作記錄是否完整等。一個(gè)批次數據抽檢的比率應達到數字化總頁(yè)數的5%以上(含5%)。采用計算機自動(dòng)檢驗與人工檢驗相結合的方式對紙質(zhì)檔案數字化成果進(jìn)行驗收檢驗。驗收合格的數據應按照紙質(zhì)檔案數字化工作方案及時(shí)移交,并履行交接手續。