朗读
桐乡市档案局关于印发《桐乡市纸质档案数字化操作规范(试行)》的通知
各镇人民政府、街道办事处,市级机关各部门:
为进一步加强档案信息化工作,加快全市档案信息数据库建设步伐,实现档案信息资源共享,进一步提升各级综合档案馆为各级党委、政府,为社会各界提供档案信息资源服务的能力和水平。根据省有关档案工作业务规范,结合我市实际,特制定《桐乡市纸质档案数字化操作规范(试行)》。现印发给你们,请遵照执行。
附件1:《桐乡市纸质档案数字化操作规范(试行)》
二O一一年五月十六日
附件1:
桐乡市纸质档案数字化操作规范(试行)
1 纸质档案数字化基本要求
1.1 数字化对象的确定原则
应当对所要进行数字化的对象按照一定的原则和利用方法进行确认,属于归档范围且应永久或长期(30年及以上)保存、符合国家有关规定的档案可列入数字化加工的范围。
1.2 基本环节
纸质档案数字化的基本环节主要包括: 目录建库、档案整理、档案扫描、图像处理、图像存储、数据挂接、数据验收与移交等。
2 目录建库
2.1数据格式选择
目录建库应选择通用的数据格式,向市档案馆移交时应转换为DBF或格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。
2.2档案著录
按照《桐乡市综合档案室室电子目录数据库结构与交换格式(试行)》的要求进行著录,建立档案目录数据库。
2.3目录数据质量检查
核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。
按照《桐乡市综合档案室电子目录数据库结构与交换格式》的要求,建立档案目录数据库,规范档案目录内容。
3 档案整理
在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。
3.1 页码修正
扫描前应对档案情况进行检查,如发现缺页、漏页等情况,应及时对页码进行修整,如已录入电子文件目录,则应同时修正电子目录。
如检查中发现整卷(件)缺张页号的,按有字的一页补打张页号;如中间有跳号的,则从跳号开始页重打张页号;如发现卷内遗漏个别页号,一般以前一页码加“_1”、“_2” 等流水号处理。例如,遗漏页的前一页页码为“008”,则遗漏页的页号标注为“008_1”,并在卷内备考表中注明。如有需要,同时修改电子目录中的张页号(录入电子目录时下划线“_”为半角字符或在英文输入方式下输入)。
3.2 拆除装订
在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。
3.3 区分扫描件和非扫描件
按要求把同一案卷中的扫描件和非扫描件区分开。扫描文件区分的原则是:无关和重复的文件,以及文件形成过程中所产生的最后稿本外的其他各种稿本、参考资料、文件处理单等要剔除。
3.4 页面修整
破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。
3.5 档案整理登记
填写档案数字化加工流程处理单(见附件1),登记需要扫描和不需要扫描案卷的相关情况。
3.6 装订
扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,案卷不掉页、左边和底边整齐,做到安全、准确、无遗漏。
4 档案扫描
4.1 扫描方式
4.1.1 根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。大幅面档案可采用专用数码平台进行扫描或者采用图像拼接方式处理。同一页面有两个以上文件,需分别扫描。
4.1.2 纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
4.2 扫描色彩模式
4.2.1 普通文件、档案可采用黑白或灰度模式扫描。
4.2.2 需永久或长期保存、向市档案馆移交的档案,一般应采用彩色模式进行扫描。
4.3 扫描分辨率
4.3.1 扫描分辨率一般建议选择≥150dpi。特殊情况下,如需要进行OCR汉字识别、文字偏小、密集、清晰度较差等,可适当提高分辨率。
4.3.2需要进行OCR汉字识别、向市档案馆移交的档案以及图纸类文件,扫描分辨率建议选择≥200dpi。
4.4 其他扫描参数
根据纸张颜色、字迹深浅等情况,随时调整亮度、对比度等扫描参数,确保扫描图像清晰可辨,采用彩色扫描模式时扫描图像颜色应尽量接近原件。
4.5 扫描登记
填写档案数字化加工流程处理单(见附件1),登记扫描的件数和页数等信息。
5 图像处理
5.1 图像数据质量检验
5.1.1 对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。
5.1.2 发现文件漏扫时,应及时补扫并正确插入图像。
5.1.3 发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
5.2 纠偏
对出现偏斜的图像应进行纠偏处理,图像偏度不得大于3度。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
5.3 去污
去除数字图像中影响可懂度的杂质。档案数字化图像的去污,应遵循在不影响可懂度的前提下展现原貌的原则。
5.4 图像拼接
对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
6 图像存储
6.1 存储格式
6.1.1 用于代替原件保存和需要移交至市档案馆的档案,采用多页TIFF格式存储。存储时的压缩模式的选择,应以保证图像清晰的前提下,尽量减小存储容量为准则,黑白图像建议采用CCITT组4压缩模式,灰度和彩色图像建议选择JPEG压缩模式。
6.1.2 用于提供网络查询的扫描图像,也可存储为JPEG、CEB、PDF等其他格式。
6.2 图像文件的命名
6.2.1 命名原则
以纸质档案目录数据库为依据,将每一份图像文件命名为档案目录数据库中该份文件的档号。通过档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
6.2.2 命名格式
6.2.2.1 命名格式(一)
对立卷改革之前的纸质档案进行扫描,其图像文件命名格式按照《浙江省省直单位档案室电子目录数据库结构与交换格式》规定执行,由全宗号、目录号、案卷号、起始张(页)号所组成,各字段间用“-”连接,即以XXXX-XXX-XXX-XXX.tif表示(“-”为半角字符或在英文输入方式下录入)。对于全宗下不设目录号而分年度整理的案卷,图像名由全宗号、年度、案卷号、起始张(页)号所组成,各字段间用“-”连接,即以XXXX-XXXX-XXX-XXX .tif表示(“-”为半角字符或在英文输入方式下录入),数据结构见下表:
|
字段名称 |
字段类型 |
字段长度 |
|
全宗号 |
字符 |
4 |
|
目录号 |
字符 |
3 |
|
年度 |
字符 |
4 |
|
案卷号 |
字符 |
3 |
|
起始张(页)号 |
字符 |
3 |
全宗号用四位代码标识,其中第一位用汉语拼音字母标识全宗属性,建国后档案用“J”;后三位用阿拉伯数字标识某一属类全宗的顺序号。如“J002”表示建国后2号全宗。
年度以四位阿拉伯数字标注公元纪年,如“2002”表示2002年。
起始张(页)号是案卷内某份文件首页所在的页码。以三位阿拉伯数字标识,如个别文件起始张(页)号采用本文3.1章节所述方法,即以前一页页码加下划线加流水号进行页码修正的,则图像命名时起始张(页)号也采用上述方法标识(下划线“_”为半角字符或在英文输入方式下输入),此时起始张(页)号共五位字符。
6.2.2.2 命名格式(二)
立卷改革后形成的纸质档案的扫描,文书档案的图像文件命名由全宗号、年度、保管期限、室编件号等四部分组成,各字段间用“-”连接,即以XXXX-XXXX-X-XXXX .tif表示(“-”为半角字符或在英文输入方式下录入)。业务档案的图像文件命名由全宗号、分类号、年度、保管期限、室编件号等五部分组成,各字段间用“-”连接,即以XXXX-XXX-XXXX-X-XXXX .tif表示(“-”为半角字符或在英文输入方式下录入)。数据结构见下表:
|
字段名称 |
字段类型 |
字段长度 |
字段值 |
|
全宗号 |
字符 |
4 |
|
|
分类号 |
字符 |
3 |
|
|
年度 |
字符 |
4 |
|
|
保管期限 |
字符 |
1 |
0、1、2、3 |
|
室编件号 |
字符 |
4 |
|
全宗号用四位代码标识,其中第一位用汉语拼音字母标识全宗属性,建国后档案用“J”;后三位用阿拉伯数字标识某一属类全宗的顺序号。如“J002”表示建国后2号全宗。
分类号是指一个全宗内档案的分类编号,根据实际分类编号进行标注。
年度以四位阿拉伯数字标注公元纪年,如“2002”表示2002年。
保管期限用一位阿拉伯数字标识。其中,“0”表示无该项内容,“1”表示短期(10年),“2”表示长期(30年及以上),“3”表示永久。
室编件号是归档文件的流水号,用四位阿拉伯数字标识,如“0034”表示第34个文件。
7 数据挂接
7.1汇总挂接
档案数字化转换过程中形成的目录数据库与图像数据,通过质检环节确认为“合格”后,通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的批量、快速挂接。
8 数据验收与移交
8.1 数据验收
8.1.1 目录数据验收
以全宗的一个或多个目录为单元,随机抽查5%的数据,对条目数量及其著录项目内容的准确性进行逐条检查。其中,档号的合格率要求达到100%,其他项目抽检合格率要求达到95%以上(含95%)。合格率=抽检合格文件数/抽检文件总数×100%
8.1.2 图像数据验收
以全宗的一个或多个目录为单位,随机抽查5%的条目数据相对应的图像数据,对图像数量及其图像内容的准确性进行检查。图像应符合本规范中所规定的分辨率、文件格式及色彩模式。图像文件的命名必须与条目档号相一致,一致率要100%;扫描图像完整性要求100%正确,完整性包括不准缺页、漏页。图像的倾斜度、清晰度、整洁度等技术指标,要求抽检合格率达到95%以上(含95%)。合格率=抽检合格文件数/抽检文件总数×100%。
8.2 数据移交
8.2.1目录数据移交
电子目录数据交换文件的组织方式是以.dbf为扩展名的关系型数据库文件或以.mdb为扩展名的Access数据库文件。
8.2.2全文数据
全文数据移交文件格式选用多页TIF文件格式,若文件只有一页,可用JPG格式。
8.2.3数据移交载体
8.2.3.1 载体类型及数量
档案数字化成果向市档案馆移交一般采用CD、DVD光盘作为数据载体。光盘应同时刻录两套,一套本单位保存,一套移交市档案馆。
8.2.3.2 光盘组织结构
一般以一个年度或几个年度的数字档案为单位刻录一张光盘,数据在光盘中以一定的组织结构存放。在光盘根目录下分别存放目录数据库、全文数据文件夹和说明文件三项内容。案卷目录数据库以AJML.dbf命名,文件目录以WJML.dbf命名,全文数据文件夹以DATA命名,说明文件以SM.txt命名。说明文件为txt文本文件,说明文件包括全宗号、全宗名称、起止目录号、起止年度、案卷目录数量(条)、文件目录数量(条)、全文数量、文件类型、光盘号、光盘类型、刻录时间、刻录人、审核人等信息,文件内容及格式如下:
全宗号:
全宗名称:
起止目录号:
起止年度:
案卷目录数量:( )条
文件目录数量:( )条
全文数量:( )件,( )页
文件类型:
光盘号:
光盘类型:
刻录时间:
刻录人:
审核人:
8.2.3.3 光盘标注格式
刻录完成后应将光盘装入光盘盒中保存,并在光盘上标注全宗号、光盘号、光盘内容等信息,在光盘上标注应使用软质记号笔,不得使用刚笔、签字笔等硬质书写用具,以免损坏光盘。光盘盒封面标注格式详见附件2《档案存储移交光盘封面格式(1)》和附件3《档案存储移交光盘封面格式(2)》。附件2《档案存储移交光盘封面格式(1)》适用于文书立卷改革前的档案,附件3《档案存储移交光盘封面格式(2)》适用于文书立卷改革后的档案。
附件1:
档案数字化加工流程处理单
|
全宗名称 |
|
全 宗 号 |
| |||||||
|
新方法填写 |
年度 |
|
起 止 件 号 |
永久 |
|
件数 |
| |||
|
30年 |
|
件数 |
| |||||||
|
老方法填写 |
目录号 |
|
起止案卷号 |
|
所属年度 |
| ||||
|
不扫描案卷 |
|
不扫描 原 因 |
| |||||||
|
说明 环 节 |
是 否 处 理 |
经手人 签 字 |
说 明 |
完 成 日 期 | ||||||
|
鉴 定 |
□ |
|
|
| ||||||
|
目录输入 |
□ |
|
文件目录 数量 |
|
案卷目录数量 |
|
| |||
|
| ||||||||||
|
目录较对 |
□ |
|
|
| ||||||
|
案卷整理 |
□ |
|
|
| ||||||
|
扫 描 |
□ |
|
扫描页数 |
|
扫描件数 |
|
| |||
|
| ||||||||||
|
原文较对 |
□ |
|
|
| ||||||
|
总(抽)捡 |
□ |
|
|
| ||||||
|
装订还原 |
□ |
|
|
| ||||||
|
数据备份 |
□ |
|
|
| ||||||
|
备 注 |
| |||||||||
附件2: 档案存储移交光盘封面格式(1)
|
|
|
背 景 信 息 |
全宗号: 起止年度: 光盘号: | ||||||||
|
|
光盘类型 |
□CD-R □DVD-R |
全文数据容量 |
|
| |||||
|
文件类别 |
□TIF □JPG □MP3 □WAV □MPG 其他___________ | |||||||||
|
刻录人 |
|
刻录时间 |
| |||||||
|
内容信息: | ||||||||||
|
目录号 (年度) |
起止案卷号 |
案卷目录数量(条) |
文件目录数量(条) |
全文数量 (件) | ||||||
|
|
|
|
|
| ||||||
|
|
|
|
|
| ||||||
|
|
|
|
|
| ||||||
|
|
|
|
|
| ||||||
|
| ||||||||||
附件3:档案存储移交光盘封面格式(2)
|
|
|
背 景 信 息 |
全宗号: 起止年度: 光盘号: | ||||||
|
|
光盘类型 |
□CD-R □DVD-R |
全文数据容量 |
|
| |||
|
文件类别 |
□TIF □JPG □MP3 □WAV □MPG 其他___________ | |||||||
|
刻录人 |
|
刻录时间 |
| |||||
|
内容信息: | ||||||||
|
年度 |
保管期限 |
起止件号 |
目录数量(条) |
全文数量(件) | ||||
|
|
永久 |
|
|
| ||||
|
30年 |
|
|
| |||||
|
|
永久 |
|
|
| ||||
|
30年 |
|
|
| |||||
|
| ||||||||
主题词:档案数字化 操作规范 通知
抄送:嘉兴市档案局。
桐乡市档案局办公室 2011年5月16日印发
