檔案數字化六個步驟
在檔案數字化加工過程中,想要完成紙質檔案數字轉化,提高檔案查詢效率,實現檔案信息共享,離不開六大核心步驟:
1、檔案整理
檔案工作人員拿到檔案后,首先要對檔案進行分類整理,包括對檔案進行統一編號,核對檔案頁碼,粘貼頁撕開,頁號編寫有誤的重新編號,對可拆訂的做拆訂處理,以便掃描時的批次處理。
如果發現折皺不平影響后期掃描質量的文件,應進行相應處理;如果文件存在破損,應先進行技術修復并做好標注;對于文件破損嚴重不能修復掃描的應做好區分標注。
2、著錄標引
將整理后的檔案,按照國家標準《檔案著錄規則》結合用戶檔案著錄的具體要求,將案卷目錄和卷內目錄的原始數據、主題標引、分類標引錄入到軟件數據庫里。按照原件實體檔案條目,對錯誤檔案目錄數據修改和補充的數據,須填寫更改資料并放入案卷內,卷內目錄不全的需補充完整。
3、檔案掃描
檔案掃描是紙質檔案實現數字轉化的關鍵步驟。原件的掃描與存儲格式應完全按照國家檔案管理的統一標準要求掃描,對實際掃描卷數、每卷的頁數要做好登記。
4、圖像檢查和處理
掃描完成后,應采用自動化處理和人工處理相結合的方式,逐張檢查圖像質量,包括圖像順序與檔案原件是否一致,有無漏掃、重張等情況,圖像有無黑邊、折角以及圖像偏斜度、清晰度、失真度等,發現不符合圖像質量要求時及時進行調整改正,確保圖像順序正確、質量完美。
5、全文OCR識別
如果項目要求實現全文檢索,在掃描圖像處理完成后,需將數字圖像利用專業的識別軟件進行全文OCR。如果用戶對識別成功率有嚴格要求,還需另外進行人工校對,校對結束后將版式還原及轉換成雙層PDF文件格式,可實現無障礙的全文檢索。
6、數據掛接
借助系統軟件對數據庫中的目錄數據與對應的紙質檔案數字圖像進行匹配掛接,并逐條對掛接結果進行檢查,包括目錄數據與紙質檔案數字圖像對應的準確性、已掛接數字圖像與實際掃描數量的一致性、數字圖像是否能正常打開等,以實現目錄數據與數字圖像的準確關聯。掛接到檔案管理系統中后,進行再次的成品驗收并做好還卷及數據備份提交。