檔案數位化加工方案

2021-03-04 01:57:25 字數 4043 閱讀 7358

(三)數位化加工部分 1

6.1. 需求分析與總結 1

6.2. 參考的國家標準及技術規範 2

6.3. 數位化加工實施細則 3

6.9.1. 本項的掃瞄加工流程 3

6.9.2. 生產流程有以下幾個主要的步驟組成: 4

6.9.3. 檔案整理 5

6.9.4. 著錄標引 6

6.9.5. 紙件掃瞄 7

6.9.6. 影象處理 8

6.9.7. 質量檢驗 10

6.9.8. 檔案還原裝訂 10

6.9.9. 資料儲存與備份 12

6.9.10. 檔案電子資料與******菸草檔案系統的無縫掛接 12

6.4. 專案所採用的ocr處理技術介紹 12

6.10.1. ocr(光學字元識別)技術 12

6.10.2. 所採用的ocr及雙層pdf生產流程 13

6.10.3. 生產流程邏輯示意圖 14

6.5. ******檔案數位化服務特點 15

6.11.1. 自動化程度高 15

6.11.2. 標準化程度高 15

6.11.3. 嚴格的質量控制 15

6.11.4. 文件安全性高 15

6.11.5. 標準的格式 15

6.11.6. 方便儲存與管理 16

,紙質檔案的折分整理、掃瞄與影象處理、資料的掛接與光碟備份都將嚴格按照國家檔案局相關標準及******省檔案局相關規定,結合******菸草檔案現狀定製加工技術規範與生產加工流程。

。據上述現狀,具體人員安排,專案實施週期,採用標準及實施細則如下。

《紙質檔案數位化技術規範》(da/t 31—2005)

《連續色調靜態影象的數字壓縮及編碼》(gb/t 17235.1-1998)

《電子檔案歸檔與管理規範》(gb/t 18894-2002)

《**檔案館接收檔案的標準》

《******省檔案接收和收集管理相關規定

《歸檔檔案整理規則》(da/t22-2000)

《檔案著錄規則》(da/t 18-1999)

《無酸檔案捲皮卷盒用紙及紙板》(da/t 24-2000)

《檔案修裱技術規範》(da/t 25-2000)

《************檔案數位化技術規範》

《******菸草檔案數位化技術規範》

紙質檔案的整理

從檔案室進行檔案提卷,並記錄提卷的內容,接著拆卷,並進行去汙、平整化,並依據檔案紙張的大小和厚薄分類。檔案的整理工作主要是為了以後檔案的掃瞄做準備。

根據不同檔案紙張的大小和厚薄,選擇不同的掃瞄器,較為規整的選擇快速掃瞄器,較薄、較厚和不規整的用平板掃瞄器,這樣既能達到保護檔案(高速掃瞄器會發生捲紙,損壞檔案)的目的,也能提高檔案數位化加工的速度。

查重查漏

在掃瞄的過程中,難免會發生重複掃瞄和漏掃的現象,人工的再次校對能夠發現檔案數位化過程中出現的情況,並即使糾正。

資料項錄入

依據檔案著錄規範或者依據客戶檔案的實際著錄項,錄入標題、責任者、歸檔時間、檔號等各種資訊。

對掃瞄影象和著錄的標引資料進行檢驗,影象主要是檢驗其掃瞄和淨化處理質量,資料項的質量檢測主要是檢測其錄入正確率。

完成檔案數位化後,要把原先的檔案原件還原成原樣。

檔案按年度、案卷提檔,提檔時數位化實施方的提卷人員對每卷的所有頁面進行統一的編號,全卷所有檔案頁號編寫完成後,再依據******菸草的要求抽出不需要掃瞄的檔案頁,然後再次按序編寫需要掃瞄的檔案頁號,頁號編寫完成後,按實際檔案頁數填寫詳細的紙質檔案交按清單,並由雙方主管人員簽字。

檔案拆分前要對檔案進行統一的編號,編制總頁號後,要從中選中需要掃瞄的頁面。再一次編制所需掃瞄的頁號,兩個頁號需用鉛筆的顏色或位置區分,以確保檔案還原時能夠清楚區別和核時頁數。

按照《檔案著錄規則》(da/t18)等的要求,規範檔案中的目錄內容。包括確定檔案目錄的著錄項、字段長度和內容要求。如有錯誤或不規範的案卷題名、檔名、責任者、起止頁號和頁數等,應進行修改。

在不去除裝訂物情況下,影響掃瞄工作進行的檔案,應拆除裝訂物。拆除裝訂物時應注意保護檔案不受損害。

按要求把同一案卷中的掃瞄件和非掃瞄件區分開。普發性檔案區分的原則是:無關和重份的檔案要剔除,有正式件的檔案可以不掃瞄原稿。

破損嚴重、無法直接進行掃瞄的檔案,應先進行技術修復,摺皺不平影響掃瞄質量的原件應先進行相應處理(壓平或熨平等)後再進行掃瞄。

製作並填寫紙質檔案數位化加工過程交接登記表單,詳細記錄檔案整理後每份檔案的起始頁號和頁數。

標引著錄為了方便查閱與管理,列印製作檔案目錄及檔案封面,對文字錄入的準確性要求較高,但要錄的文字域並不是完全統一的在某一頁面上,一些文字域要在多個檔案中選擇,所以錄入時需要相關學部專家進行指導,確保文字域錄入的準確率。

對所需錄入的文字進行標引、或對不同類別的檔案錄入特徵製作相應的《文字錄入工作說明書》,供錄入員和校對人員參考。

由於文字型別不一,有印刷體、手寫體、有**內的也有**外的文字資訊,所以採用手工錄入和ocr(光學字元識別)軟體相結合的方式錄入。即手寫體或不清晰的印刷體採用手工錄入,較規整的印刷體採用ocr技術的錄入方式。

校對以軟體校對和列印輸出對比校對相結合的方式,即對手工錄入和ocr自動錄入的文字列印輸出進行對比校對的一校、二校、抽查校對,確保索引資訊達到出版質量萬分之一以下。

原件的掃瞄與儲存格式完全按照國家檔案管理的統一標準和******菸草的相關要求掃瞄。掃瞄人員按照《掃瞄與處理工作說明書》的要求,填寫移交清單(此移交清單是檔案拆分人員和掃瞄人員共同填寫)並簽字領取並進行紙件掃瞄。掃瞄影象使用先進的影象掃瞄處理軟體(快影象系統),掃瞄人員可根據原稿質量,對系統進行定義,如自動傾斜校正、自動去汙、自動分檔案等批處理功能。

在由系統自動處理功能的同時,掃瞄人員根據原件的實際情況做相應的調整,如超大頁面的處理、紙張顏色深淺及薄厚的處理、掃瞄時可根據不同原件的情況,調整影象的解析度、閥值、明亮度以及掃瞄方式和掃瞄速度,確保在掃瞄影象質量清晰的情況下,使原件完好無損。

影象的解析度正常情況下為300dpi,如遇字間距和行行距過密、原件本身是影印件等字跡不清楚的情況,可適當增加掃瞄的解析度但要保正影象清晰的同時,又不影響遠端查詢和遊覽的速度。

根據檔案幅面的大小(a4、a3、a0等)選擇相應規格的掃瞄器或專業掃瞄器(如工程圖紙可採用0號圖紙掃瞄器)進行掃瞄。大幅面檔案可採用大幅面數碼平台,或者縮微拍攝後的膠片數位化轉換裝置等進行掃瞄,也可以採用小幅面掃瞄後的影象拼接方式處理。

紙張狀況較差,以及過薄、過軟或超厚的檔案,應採用平板掃瞄方式;紙張狀況好的檔案可採用高速掃瞄方式以提高工作效率。

掃瞄色彩模式一般有黑白二值、灰度、彩色等。通常採用黑白二值。

頁面為黑白兩色,並且字跡清晰、不帶插圖的檔案.可採用黑白二值模式進行掃瞄。頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可以採用灰度模式掃瞄。頁面中有紅頭、印章或插有黑白**、彩色**、彩色插圖的檔案,可視需要採用彩色模式進行掃瞄。

掃瞄解析度引數大小的選擇,原則上以掃瞄後的影象清晰、完整、不影響影象的利用效果為準。採用黑白二值、灰度、彩色幾種模式對檔案進行掃瞄時,其解析度一般均選擇大於或等於200dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高解析度。

需要進行ocr漢字識別的檔案,掃瞄解析度建議選擇大於或等於300dpi。

認真填寫紙質檔案數位化轉換過程交接登記表單,登記掃瞄的頁數,核對每份檔案的實際掃瞄頁數與檔案整理時填寫的檔案頁數是否一致,不一致時應註明具體原因和處理方法。

************檔案數碼化工廠採用自動化處理和人工處理相結合的方式,確保影象質量的完美。通過校對系統對影象進行校對,確保影象順序正確、去斑點、校驗。,在校對時發現不合格影象及時返回前一工序進行改正。

數位化加工系統會根據原件質量的好壞對汙漬的情況進行自動輕度、中度、高度去汙,對紙質變質或掃瞄時的黑邊完全自動清除、自動進行偏斜校正處理。系統支援區域性去汙、並能對不能夠自動處理的頁面進行單頁多次修正。影象處理人員在發現掃瞄不合格的檔案,進行登記後交掃瞄人員處理,雙方簽字確認後的表單留存備查。

使因掃瞄造成的不合格影象機時返回上一生產流程。

檔案數位化標準

檔案整理數位化加工服務 檔案整理 分類 編號 裝訂 修復等 檔案掃瞄 檔案 資料 圖紙 證照等 文件著錄 檔案 檔案 資料 業務的著錄工作 質量控制與檔案保護 遵循規範 1 中華人民共和國行業標準da t 18 1999 檔案著錄規則 2 歸檔檔案整理規則 會計檔案管理辦法 3 檔案管理軟體功能要求...

檔案數位化知識

一 什麼是檔案數位化?檔案數位化是隨著計算機技術 掃瞄技術 ocr技術 數字攝影技術 錄音 錄影 多 技術 儲存技術的發展而產生的一種新型檔案資訊形態,它把各種載體的檔案資源轉化為數位化的檔案資訊,以數位化的形式儲存,網路化的形式互相連線,利用計算機系統進行管理,形成乙個有序結構的檔案資訊庫,及時提...

檔案數位化思考

芻議檔案數位化的思考研究 摘要 在這個資訊時代,只有當檔案資訊資源在社會主義現代化建設中發揮重要作用時,檔案和檔案工作的意義和價值才能充分地全面地展現出來。加強檔案資訊化建設是檔案事業適應時代和社會發展的必然選擇,是加速檔案管理現代化的客觀要求,是提高檔案服務水平的必由之路,勢在必行。為更好地適應形...