第一篇:DA/T31-2005纸质档案数字化技术规范
纸质档案数字化技术规范DA/T31-2005 1 范围
本标准规定了纸质档案数字化的主要技术要求。
本标准适用于用扫描仪对各种纸质档案的数字化加工处理。2 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1 连续色调静态图像的数字压缩编码 GB/T 17235.2 连续色调静态图像的数字压缩编码 GB/T 18894?2002 电子文件归档与管理规范 ITU(CCITT)G3 二值图像压缩算法 ITU(CCITT)G4 二值图像压缩算法 DA/T18?1999 档案著录规则
档案管理软件功能要求暂行规定国家档案局档发[2001]6号 3 术语和定义
下列术语和定义适用于本标准。3.1 数字化 Digitization 用计算机技术将模拟图像转换为数字图像的处理过程。3.2 纸质档案数字 化Digitization of Paper?Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。3.3 数字图像 Digital Image 表示景物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。
3.4 黑白二值图像 Binary Image 只有黑白两级灰度的数字图像。它对应于黑和白的两种状态文字稿、线条图、指纹图等。
3.5 连续色调静态图像 Continuous?tone Still Image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字 图像。3.6 失真度 Distortion Measure 对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原 件色彩、几何、压缩算法等差值。3.7 可懂度 intelligibility 表示数字图像向人或机器提供信息的能力。3.8 清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现。
3.9
分辨率 Resolution 指单位长度内图像包含的点数或像素数。3.10 TIFF Tagged Tmage File Format 标记图像文件格式。一种基于标记的无损(不丢失信息)压缩格式,用于在应用程序之间和计算机平台之间交换文件。因为它存储图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原件为黑白档案的复制储存。
3.11
JPEG Joint photographic Experts Group 联合照片专家组。一种丢失少量信息的压缩格式,尤其适用于屏幕和打印显示,支持所有主要计算机平台和Web浏览器。JPEG格式文件小,影像质量多数情况下均可接受。考虑储存空间及传输效率,原件为彩色的档案可迁此格式复制储存。数字化基本流程
纸质档案数字化的基本流程主要包括案卷整理、目录建库、批量扫描、数据处理、信息存储、检索利用等工序。
4.1 案卷整理
对需要扫描的案卷进行适当整理,做出标识。4.2 目录建库
为数字化的档案检索而建立必要的目录数据库。4.3 批量扫描
按照档案数字化具体任务的整体安排按计划分批次进行扫描。4.4 数据处理
4.4.1 对扫描图像进行校对,确保图像完整无误,并视需要对有问题的扫描图像进行纠偏、去污、拼接等技术处理。
4.4.2 对裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件,以及数据的挂接、检验、上载、质量检查和备份。
4.5 信息存储 根据不同的扫描图像选择适当数据格式、编码方式和存储介质对信息进行保存。
4.6 检索利用
按用户需求提供检索利用。5 案卷整理
在批量扫描之前,按下述步骤对案卷进行整理,确保档案数字化质量。5.1 分件
5.1.1 把同一案卷中的扫描件和非扫描件分开。
5.1.2 在扫描件中将大图、照片插入指示页,便于扫描工序批量扫描,实际图像放在图像处理时进行重扫,替换指示页。
5.1.3 填写《数据加工过程处理单》(见附录A),对需要特殊处理的页,标识清楚。
5.2 分页
对批量扫描前的档案进行页号、件号的标注。如在标注中与原档案中的件数、页号不一致,应以此为准。
5.3 拆卷
去除档案中原来的装订物,以便后续扫描工作的进行。5.4 装卷
按档案保管要求恢复原装订。6 建目录库 6.1 目录著录
根据DA/T18确定档案著录项,并进行著录。6.2 数据格式选择
所选定的数据格式通用,应能直接或间接与DBF文件格式或通过XML文 档进行数据交换。6.3 目录输入
将著录好的目录输入计算机内,建立机读目录数据库。7 批量扫描 7.1 扫描方式
纸质档案扫描可采用黑白二值图像和连续色调图像两种方式。
7.1.1 页面为单色文字的纸质档案,宜采用黑白二值图像扫描;页面为多色文字图像的档案文件,可采用连续色调图像扫描。
7.1.2 字迹清晰、不带图片的档案材料,采用黑白二值图像扫描;清晰度较差或带有图片的档案材料,可采用连续色调图像扫描。
7.2 分辨率选择
7.2.1 单色页面档案文件,扫描分辨率一般建议选择100~200dpi。7.2.2 彩色页面档案文件,扫描分辨率可选择100dpi以上参数值进行。7.2.3 大幅面档案文件,如工程图纸、报纸等尺寸超过A3的,可选用大幅面图像扫描仪(如A0)、大幅面数码平台、缩微照像后胶片数字转换,也可以采用小幅面扫描后的图像拼接。扫描分辨率应选择1OOdpi以上。
7.2.4 需要时可根据原件的清晰度适当调整扫描分辨率。如原件质量较差且尺寸较小,可适当提高分辨率;反之也可相应减少分辨率,增减的多少以扫描后图像按原尺寸显示后是否清晰为准。
7.3 特殊页面的扫描 7.3.1 粘贴页与表格
对于粘贴折页,可用大幅面扫描仪扫描,或先分部扫描后拼接;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决;对字迹与表格颜色深度不同的,采用局部淡化技术解决
7.3.2 一般文本流程图
采用适当的分辨率扫描及局部深化技术,确保文本流程图清晰。同时采用不同设备满足文本流程图的扫描工作。
7.3.3 插图 采用高分辨率灰度或彩色扫描技术将插图与文字一起扫描,保证原来的页面布局和插图清晰。
7.3.4照片
对于页面中有黑白或彩色照片的文件,采用JPEG格式扫描,确保照片清晰度,同时可避免图像存储空间过大。
7.4 文件命名方式 7.4.1 建立文件夹
扫描时文件夹的建立应按档案实体分级建立,其中的每一份文件也需要单独建立文件夹。
7.4.2 文件夹命名方法,以档案实体中的档号命名,一般为3位数,不足3 位数的左边补“0”。8 数据处理 8.1 图像处理 8.1.1 纠偏
对扫描过程中出现的偏斜图像进行整体纠正,保证数字图像的偏斜角度小于1度。(图像偏斜不超过页面内半个文字)。
8.1.2 去污
去除数字图像中影响可懂度的杂质。档案数字化图像的去污,应遵循在不影响可懂度的前提下展现原貌的原则。
8.1.2.1 局部去污,如去除黑边、污点。8.1.2.2 整体去污,可一次性去除页面上的污渍。8.1.3 拼接
为保证档案数字化图像的整体性,对幅面分离的数字图像进行拼接。8.1.4 校对
8.1.4.1 一次校对,检查扫描完的图像质量情况,对不合格的图像进行标记退回重新扫描。8.1.4.2 纠错处理,根据一次校对中提出的诸如污渍、黑边、偏斜、图像质
量等问题,结合《数据加工过程处理单》(见附录A)情况,对每份图像进行相应的处理。
8.1.4.3 二次校对,对一次校对及数据处理后的数字图像再次进行检查,并
标记图像处理过程中不清晰的页面。不合格的退回重新处理。8.2 数据质量检查 8.2.1 文字录入质量
对录入域清单上所标明的各著录项的文字录入进行正确率控制,保证错误率低于3‰。
8.2.2 图像质量
对纸质文件扫描后形成的图像文件进行清晰度、污渍、黑边、偏斜等问题的控制,以达到要求的图像质量。
保证扫描后的数字图像清晰,便于清楚阅读,适应各种纸张和手写、印刷字的情况。
8.3 数据挂接
档案条目数据与图像文件的对应准确程度的控制。
在生成裸数据光盘之前,根据资料整理信息、扫描前的标引信息及卷内文件页号信息核查图像文件总数是否与实际文件数相等,如不相等则不能生成裸数据光盘,可打印出清单,回退给图像处理人员补扫。
8.4 数据检验
8.4.1 将裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件。
8.4.2 对数据进行检验,给出合格或不合格结论。
8.4.3 将数字加工后的数据转换为裸数据光盘格式,拷贝到活动硬盘上。8.4.4 系统应自动记录检验进度。8.5 数据上载 档案数字化各工序的数据通过网络及时上载到数据服务器端汇总,其中数字图像自动搜索对应的目录数据,加入对应的电子地址数字图像文件名,建立起一一对应的关系。
8.6 数据备份
定期对服务器的各类数据进行备份,防止数据丢失。9 信息存储
以JPEG数字压缩编码或TIFF国际通用标准格式。采用国际标准的传真文档压缩格式压缩后,分别按页编号后分页存储。
数字图像的存储管理应保持原纸质档案的保管模式对应存储。9.1 压缩存储格式
档案数字图像格式采用TIFF和JPEG数字压缩编码。9.1.1 黑白二值图像
黑白二值扫描图像文件采用TIFF(CCITT G3)格式二值图像压缩算法,压缩率就绪(Cr)为15:1。也可采用TIFF(CCIFF G4)格式二值图像压缩算法,压缩率(Cr)为3 O:1。
9.1.2 连续色调静态图像
连续色调静态图像采用JPEG数字压缩编码,平均压缩率(cr)为15:1。9.2 编码方式
应尽是采用实时操作性强的编码方式。失真度编码,用较少的比特率获得较好的图像质量;无失真编码,以低压缩保持信息的不失真。一般情况下
宜采用国际通用编解码算法。9.3 存储方式与载体
可选用在线和离线、不同载体进行存储。10 检索利用 10.1 检索利用方式
档案数字图像检索利用可采用单机、局域网和互联网三种方式。局域网中传输利用,应保证数据在内部局域网10Base?T带宽下,平均1秒内显示响应完成。互联网中传输利用,互联网56Kbit/s带宽下,平均5秒内显示响应完成。为此要求一般每页档案数字图像的存储容量为50K以内。
10.2 检索软件配置
检索软件应符合国家档案局制定的《档案管理软件功能要求暂行规定》的各项要求。检索软件应具备目录检索与档案数字图像方便调阅的基本功能。
第二篇:13、纸质档案数字化技术规范
纸质档案数字化技术规范
中华人民共和国档案行业标准 DA/T 31—2005
1范围
本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1—1998信息技术连续色调静态图像的数字压缩及编码第1部分:要求和指南
GB/T 17235.2—1998信息技术连续色调静态图像的数字压缩及编码第2部分:一致性测试
GB/T 18894-2002电子文件归档与管理规范
3术语和定义
下列术语和定义适用于本标准。3.1数字化digitization
用计算机技术将模拟信号转换为数字信号的处理过程 3.2纸质档案数字化digitization 0fpapeI喃ased records
采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。3.3数字图像digital image
表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。3.4黑白二值图像binary image
只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。
3.5连续色调静态图像continuous—tone 8till image
以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。3.6分辨率resolution
单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。
3.7失真度distortion measure
对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。3.8可值度intelligibility
数字图像向人或机器提供信息的能力。3.9 图像压缩image compression
清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。纸质档案数字化过程中,较常见的有TIFF(G4)、JPEG等压缩格式。
4纸质档案数字化基本要求 4.1基本原则
纸质档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。
4.2数字化对象的确定原则
应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。4.2.1符合国家法律法规的原则
纸质档案的数字化,必须符合国家档案开放规定以及有关规定。4.2.2价值性原则
属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围。4.3基本环节
纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、成果管理等。4.4过程管理
4.4.1应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。
4.4.2纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。
5档案整理
在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。5.1目录数据准备
按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。5.2拆除装订
在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。5.3区分扫描件和非扫描件
按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关和重份的文件要剔除,有正式件的文件可以不扫描原稿。5.4页面修整
破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。5.5档案整理登记
制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。5.6装订
扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。
6档案扫描 6.1扫描方式
6.1.1根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。6.1.2纸张状况较差,以及过薄、过软或超厚的档案,应案,以及页面为多色文字的档案,可采用灰度模式扫描。方式以提高工作效率。6.2扫描色彩模式
6.2.1扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。
6.2.2页面为黑白两色,并且字迹清晰、不带插图的档案.可采用黑白二值模式进行扫描。
6.2.3页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可以采用灰度模式扫描。
6.2.4页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。6.3扫描分辨率
6.3.1扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。
6.3.2采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择大于或等于100dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。
6.3.3需要进行OCR汉字识别的档案,扫描分辨率建议选择大于或等于200dpi。6.4扫描登记
认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。7图像处理
7.1图像数据质量检查
7.1.1对图像偏斜度、清晰度、失真度等进行检查。发现 不符合图像质量要求时,应重新进行图像的处理。
7.1.2由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。
7.1.3发现文件漏扫时,应及时补扫并正确插入图像。
7.1-4发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
7.1.5认真填写相关表单,记录质检结果和处理意见。7.2纠偏
对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。7.3去污
对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。7.4图像拼接
对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。7.5裁边处理
采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
8图像存储 8.1存储格式
8.1.1采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储。存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。
8.1.2提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式。
8.2图像文件的命名
8.2.1纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。8.2.2多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。
9目录建库 9.1数据格式选择
目录建库应选择通用的数据格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。9.2档案著录
按照《档案著录规则》(DA/T18)的要求进行著录,建立档案目录数据库。
9.3目录数据质量检查
采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。
10数据挂接 10.1汇总挂接
档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。10.2数据关联
以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,要认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。10.3交接登记
认真填写纸质档案数字化转换过程交接登记表单,记录数据关联后的页数,核对每一份文件关联后的页数与档案整理、扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法。
11数据验收 11.1数据抽检
11.1.1以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。
11.1.2一个全宗的档案,数据验收时抽检的比率不得低于5%。11.2验收指标
11.2.1目录数据库与图像文件挂接错误,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为“不合格”。
11.2.2一个全宗的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,予以验收“通过”。
合格率=抽检合格的文件数/抽检文件总数x100% 11.3验收审核
验收“通过”的结论,必须经分管领导审核、签字后方有效。11.4验收登记
认真填写纸质档案数字化验收登记表单。
12数据备份 12.1备份范围
经验收合格的完整数据应及时进行备份。12.2备份方式
为保证数据安全,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并注意异地保存。12.3数据检验
备份数据也应进行检验。备份数据的检验内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。12.4备份标签
数据备份后应在相应的备份介质上做好标签,以便查找和管理。12.5备份登记
填写纸质档案数字化备份管理登记表单。
13数字化成果管理
13.1应加强对纸质档案数字化成果的管理,确保其安全、完整和长期可用。
13.2纸质档案数字化成果提供网上检索利用时,应有制作单位的电子标识,并根据具体情况分别采用可下载或不可下载的数据格式。
第三篇:纸质档案数字化规范DAT31-2017
纸质档案数字化规范DA/T31—2017 分享 / 打印 / 放大字体 / 缩小字体
发布机构:万源市档案局
发布日期:2018-04-16
纸质档案数字化规范DA/T31—2017
前言
本标准按照GB/T 1.1-2009给出的规则起草。本标准替代DA/T 31-2005《纸质档案数字化技术规范》。
本标准与DA/T 31-2005相比,主要技术变化如下: ——标题进行了修改;
——增强组织与管理部分的内容,完善数字化工作中管理相关要求; ——增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求;
——增加数字化过程中元数据采集的要求; ——修改了档案扫描部分参数要求;
——修改了图像处理部分内容,更加强调保持档案原貌的要求; ——细化了数字化成果验收的内容;
——删除原标准数据备份和数字化成果管理相关内容。本标准由国家档案局提出并归口。本标准起草单位:国家档案局档案科学技术研究所、国家档案局信息管理中心、国家档案局技术部。
本标准主要起草人:王良城、马淑桂、郝晨辉、程春雨、杜琳琳、蔡伟、宋涌、王大众、田军、曹燕、李华峰。本标准所代替标准的历次版本发布情况为: ——DA/T 31—2005。
引
言
DA/T 31-2005的发布实施,从技术标准方面对纸质档案数字化工作提出了要求,很好的促进了纸质档案数字化工作向科学化、规范化的方向发展,在档案信息化工作中发挥了重要作用。
由于纸质档案数字化工作所依赖的信息技术发展迅速,经过10年的时间,数字化设备、存储、网络等技术条件都发生了较大变化,同时,纸质档案数字化工作管理方法和管理理念等都在不断更新、发展。因此,及时对本标准进行修订,适时调整相关要求,从档案行业层面科学规范纸质档案数字化工作,具有重要的现实意义。
标准本次修订更加注重我国纸质档案数字化工作自身的特点,结合目前信息技术发展的水平,提出适用于档案行业的纸质档案数字化工作的规范性要求。
纸质档案数字化规范 范围 本标准规定了纸质档案数字化技术和管理要求。本标准适用于采用扫描设备对纸质档案的数字化加工过程的管理。规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 20530-2006 文献档案资料数字化工作导则 DA/T 1 档案工作基本术语 DA/T 18 档案著录规则
ISO/TR 13028 信息与文献 档案数字化实施指南(Information and Documentation — Implementation guidelines for digitization of records)术语和定义
GB/T 20530-2006、DA/T
1、DA/T 18界定的以及下列术语和定义适用于本文件。
3.1数字化 digitization
利用计算机技术将模拟信号转换为数字信号的处理过程。3.2数字图像digital image
表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
3.3纸质档案数字化digitization of paper-based records 采用扫描仪等设备对纸质档案进行数字化加工,使其转化为存储在磁带、磁盘、光盘等载体上的数字图像,并按照纸质档案的内在联系,建立起目录数据与数字图像关联关系的处理过程。
3.4分辨率resolution
单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。总则
4.1 各单位应根据档案的珍贵程度、开放程度、利用率、亟待抢救程度、数字化资金情况等因素统筹规划、科学开展纸质档案数字化工作。纸质档案数字化工作的开展应遵循ISO/TR 13028和GB/T 20530提出的要求和建议。
4.2 纸质档案数字化的基本环节主要包括:数字化前处理、目录数据库建立、档案扫描、图像处理、数据挂接、数字化成果验收与移交等。
4.3 应采取有效的管理和技术手段,确保纸质档案数字化成果质量。纸质档案数字化应遵循档案管理的客观规律,真实反映档案内容,最大程度地展现档案原貌。
4.4 纸质档案数字化过程中,应保存数字化项目信息、技术环境、数字化各类技术参数等方面的元数据。元数据元素的确定应符合ISO/TR 13028提出的要求。4.5 应加强纸质档案数字化各环节的安全管理,确保档案实体和档案信息的安全。
4.6 加工涉密档案时,应按照涉密档案相关保密要求开展工作。
5.组织与管理
5.1 机构及人员
5.1.1 应建立纸质档案数字化工作组织,对数字化工作进行统筹规划、组织实施、协调管理、安全保障、技术保障、监督检查、成果验收等,确保数字化工作的顺利开展。
5.1.2 应配备具有相应能力的工作人员,包括熟悉档案业务并具有较高的调查研究水平和良好的组织领导能力的管理人员,熟悉相关标准规范并能够为纸质档案数字化工作各环节提供技术支持的技术人员,掌握一定数字化基础知识并熟悉本职工作的操作人员等。应通过科学规范的管理制度,对工作人员进行规范化管理。为强化数字化工作的安全性,应加强对外聘工作人员的审核。
5.2 基础设施
5.2.1 应配备专用加工场地,并进行合理布局,形成档案存放、数字化前处理、档案著录、档案扫描、图像处理、质量检查等工作区域。5.2.2 加工场地的选择及温湿度等环境的控制不应不利于档案实体的保护。场地内应配备可覆盖全部场地的防火、防水、防有害生物、防盗报警、视频监控等安全管理的设施设备。
5.2.3 应合理规划、配备和管理纸质档案数字化设施设备,确保设施设备安全、先进,能够满足数字化工作的需要。
5.3 工作方案
5.3.1 应在充分调研的基础上,制定科学合理的工作方案,确保纸质档案数字化工作达到预期目标。
5.3.2 纸质档案数字化工作方案应包括数字化对象、工作目标、工作内容、成本核算、数字化技术方法和主要技术指标、验收依据、人员安排、责任分工、进度安排、安全管理措施等内容。数字化对象的确定应综合考虑档案的珍贵程度、开放程度、利用率、亟待抢救程度、数字化资金情况等因素。
5.3.3 宜对纸质档案数字化工作方案进行专家论证,确保其科学、规范、合理。
5.3.4 纸质档案数字化工作方案应经审批后严格执行。工作方案审批结果应与数字化工作过程中形成的其他文件一并保存。
5.4 管理制度
5.4.1 应制定科学化、规范化的管理制度,并在工作过程中严格执行,以有效保障档案安全和纸质档案数字化成果质量。5.4.2 纸质档案数字化管理制度应包含岗位管理、人员管理、场地管理、设备管理、数据管理、档案实体管理等方面的制度。
岗位管理制度主要规定数字化工作各岗位的工作目标和职责,形成明确的岗位业务流程规范、考核标准、奖惩办法等;人员管理制度主要对人员的安全责任、日常行为、外聘人员信息审核及管理、非工作人员来访登记等进行规范;场地管理制度主要对人员出入和工作场地内基础设施、环境、网络、监控设施、现场物品、证件等的管理进行规范;设备管理制度主要对数字化工作各环节涉及的全部设备的管理进行规范;数据管理制度主要对数字化各环节所产生的数据的管理进行规范;档案实体管理制度主要对档案实体在数字化过程中的交接、管理、存放等工作进行规范。
5.5 工作流程控制
5.5.1 应依据相关的法律法规和各类技术标准,制定相关的工作流程和各环节操作规范等,对纸质档案数字化全过程进行有效的控制,确保数字化成果质量。纸质档案数字化流程示例参见附录A。
5.5.2 应加强对纸质档案数字化工作的全流程安全管理。5.5.3 应建立完善的问题反馈机制,对纸质档案数字化工作过程中后端环节发现前端环节中产生的问题进行及时反馈和修正。
5.6 工作文件管理 5.6.1 应根据情况制定符合实际要求的纸质档案数字化工作文件,以此加强对数字化工作的管理。主要包括纸质档案数字化工作方案、纸质档案数字化审批书、纸质档案数字化流程单、数据验收单、项目验收报告、纸质档案数字化成果移交清单等,采取外包方式实施时,还应包括项目招标文件、投标文件、中标通知书、项目合同、保密协议等。部分工作单示例参见附录B。
5.6.2 应加强对纸质档案数字化工作文件的管理,明确数字化工作过程中形成的工作文件的整理、归档、移交等管理要求。
5.7 档案数字化外包
5.7.1 纸质档案数字化工作如需外包,档案部门应从企业性质、股东组成、安全保密、企业规模、注册资金情况等方面严格审查数字化加工企业的相关资质;按照GB/T 20530-2006第5章的要求评估数字化加工企业的技术能力;从规章制度的建立健全程度等方面考查加工企业的管理能力。
5.7.2 在项目实施过程中,应依据《档案数字化外包安全管理规范》(档办发[2014]7号),从档案部门、数字化服务机构、数字化场所、数字化加工设备、档案实体、数字化成果移交接收与设备处理等层面执行严格的安全管理要求。
5.7.3 档案部门应指派专门人员参与纸质档案数字化外包业务的监督、指导,完成质量监控、进度监控、投资监控、安全监控和协调沟通等方面的工作。档案出库
6.1 档案保管部门应按照纸质档案数字化工作方案确定的数字化对象开展档案调取、清点、登记等前期准备工作,并提交档案出库申请,经相关责任人批准后,严格按照档案库房管理规定为数字化对象办理出库相关手续,并与数字化部门共同清点无误后,对档案进行交接出库。
6.2 纸质档案数字化过程中,应设置距离数字化加工场所较近的保管库用以临时存放纸质档案,并对纸质档案的领取与归还进行严格管理,认真做好检查、清点、登记等工作,确保纸质档案的安全。数字化前处理
7.1 确定扫描页
原则上应将确定为数字化对象的纸质档案全部扫描,不宜进行挑扫。如有不需要扫描的页面应加以标注。
7.2 编制页号
7.2.1 应对没有页号或页号不正确的档案重新编制页号。7.2.2 重新编制页号时,应在统一位置书写页号,且不压盖档案内容。
7.2.3 书写页号所使用的笔、墨等不应破坏档案原件 或对档案长期保存造成影响。
7.2.4 应将破损页面、缺页等特殊情况进行登记。
7.3 目录数据准备
7.3.1 按照目录数据库建立时制定的数据规则,对照档案原件内容,规范档案中的目录内容。
7.3.2 对需在目录数据库中进行标记的情况进行标记。
7.4 拆除装订
应以对纸质档案的保护为原则确定是否拆除装订。如需拆除装订物,应注意保护档案不受损害,并对排列顺序不准确的档案进行重排。特殊装订且拆除装订后需恢复的档案,在拆除装订物时应采用拍照等方式记录档案原貌,以便于恢复。
7.5 技术修复
7.5.1 破损严重或其他无法直接进行扫描的纸质档案,应先由专业技术人员进行技术修复。
7.5.2 折皱不平影响扫描质量的纸质档案应先进行压平等相应技术处理。目录数据库建立
8.1 应制定目录数据库数据规则,包括数据字段长度、字段类型、字段内容要求等。目录数据库数据规则的制定应符合DA/T 18对档案著录的要求。在纸质档案目录准备与目录数据库建立工作中均应严格遵守。
8.2 数据库选择应考虑可转换为通用数据格式,以便于数据交换。8.3 数据库结构的设计应特别注意保持档案的内在联系,有利于纸质档案数字化成果的管理和利用。
8.4 将纸质档案数字化前处理工作中对纸质档案目录进行修改、补充的结果录入数据库,形成准确、完整的目录数据。
8.5 可采用计算机自动校对与人工校对相结合的方式,对目录数据的质量进行检查,包括著录项目的完整性、著录内容的规范性和准确性等。发现不合格的数据应及时进行修改。档案扫描
9.1 基本要求
档案扫描应根据纸质档案原件实际情况、数字化目的、数字化规模、计算机网络和存储条件等选择相应的扫描设备,和进行相关参数的设置和调整。参数的设置和调整应保证扫描后数字图像清晰、完整、不失真,图像效果最接近档案原貌。
9.2 扫描设备 9.2.1 扫描设备的选择应特别注意对档案实体的保护,尽量采用对档案实体破坏性小的扫描设备进行数字化。9.2.2 超出所使用扫描仪扫描尺寸的档案可采用更大幅面扫描仪进行扫描,也可以采用小幅面扫描仪分幅扫描后进行图像拼接的方式处理。分幅扫描时,相邻图像之间应留有足够的重叠,并且采用标版等方式明确说明分幅方法;若后期采用软件自动拼接的方式,重叠尺寸建议不小于单幅图像对应原件尺寸的1/3。
9.2.3 应遵循相关设备的使用规律进行定期维护、保养。
9.3 扫描色彩模式
9.3.1 为最大限度保留档案原件信息,便于多种方式的利用,宜全部采用彩色模式进行扫描。
9.3.2 页面中有红头、印章或插有照片、彩色插图、多色彩文字等的档案,应采用彩色模式进行扫描。
9.3.3 页面为黑白两色,并且字迹清晰、不带插图的档案,也可采用黑白二值模式进行扫描。
9.3.4 页面为黑白两色,但字迹清晰度差或带有插图的档案,也可采用灰度模式扫描。
9.4 扫描分辨率
9.4.1 扫描分辨率的选择,应保证扫描后图像清晰、完整,并综合考虑数字图像后期利用方式等因素。9.4.2 扫描分辨率应不小于200dpi。如文字偏小、密集、清晰度较差时,建议扫描分辨率不小于300dpi。
9.4.3 如有COM输出、仿真复制、印刷出版等其他用途时,可根据需要调整扫描分辨率。需要进行COM输出的档案,扫描分辨率建议不小于于300 dpi;需要进行高精度仿真复制的档案,扫描分辨率建议不小于600 dpi;需要进行印刷出版的档案,可结合档案幅面、印刷出版幅面、印刷精度要求等选择合适的分辨率。
9.5 存储格式
9.5.1 纸质档案数字图像长期保存格式为TIFF、JPEG或JPEG2000等通用格式,图像压缩率的选择可根据实际应用的需求而定。
9.5.2 纸质档案数字图像利用时,也可从网络浏览速度、易操作性、存储空间占用等方面进行综合考虑,将图像转换为PDF等其他格式。
9.5.3 同一批档案应采用相同的存储格式。
9.6 图像命名
9.6.1 应以档号为基础对数字图像命名。图像命名方式的选择应确保图像命名的唯一性。
9.6.2 建议将数字图像存储为单页文件,并按档号与图像流水号的组合对图像命名。
9.6.3 数字图像确需存储为多页文件时,可采用该档案的档号对图像命名。
9.6.4 应科学建立纸质档案数字图像的存储路径,确保数据挂接的准确性。图像处理
10.1 图像拼接
对分幅扫描形成的多幅数字图像,应进行拼接处理,合并为一个完整的图像,以保证纸质档案数字图像的整体性。拼接时应确保拼接处平滑地融合,拼接后整幅图像无明显拼接痕迹。
10.2 旋转及纠偏
对不符合阅读方向的数字图像应进行旋转还原。对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。
10.3 裁边
如需对数字图像进行裁边处理,应在距页边最外延至少2至3毫米处裁剪图像。
10.4 去污
如需对数字图像进行去污处理,以去除在扫描过程中产生的污点、污线、黑边等影响图像质量的杂质,应遵循展现档案原貌的原则,处理过程中不得去除档案页面原有的纸张褪变斑点、水渍、污点、装订孔等痕迹。
10.5 图像质量检查
10.5.1 数字图像不完整、无法清晰识别或图像失真度较大时,应重新扫描。
10.5.2 对于漏扫、重扫、多扫等情况,应及时改正。
10.5.3 数字图像的排列顺序与档案原件不一致时,应及时进行调整。
10.5.4 对数字图像拼接、旋转及纠偏、裁边、去污等处理情况进行检查,发现不符合图像质量要求时,应重新进行图像处理。数据挂接
11.1 应借助相关软件对数据库中的目录数据与其对
应的纸质档案数字图像进行挂接,以实现目录数据与数字图像的关联。
11.2 逐条对挂接结果进行检查,包括目录数据与纸质档案数字图像对应的准确性、已挂接数字图像与实际扫描数量的一致性、数字图像是否能正常打开等,发现错误及时进行纠正。数字化成果验收与移交
12.1 验收方式
12.1.1 建议档案部门成立专门的验收组对纸质档案数字化成果进行验收。
12.1.2 应采用计算机自动检验与人工检验相结合的方式对纸质档案数字化成果进行验收检验。
12.2 验收内容
12.2.1 纸质档案数字化成果包括数字图像、档案目录数据、元数据、数字化工作中产生的工作文件、存储载体等。
12.2.2 应对目录数据进行验收,主要包括数据库中各条目的内容、格式等的准确程度、必填项是否填写等。
12.2.3 应对元数据进行验收,主要包括元数据元素的完整性和赋值规范性等。
12.2.4 应对数字图像进行验收,主要包括数字化参
数、存储路径、命名的准确性、图像的完整性、排列顺序的准确性、图像质量等。
12.2.5 应对数据挂接进行验收,主要包括目录数据与其对应的数字图像的挂接的准确性等。
12.2.6 应对工作文件进行验收,主要包括工作文件的完整性、规范性等。
12.2.7 应对存储载体进行验收,主要包括载体的可用性、有无病毒等。
12.3 验收指标
能够采用计算机自动检验的项目应采用计算机自动检验的方式进行100%检验,检验合格率应为100%。对于无法用计算机自动检验的项目,可根据情况以件或卷为单位采用抽检的方式进行人工检验。抽检比率不得低于5%,对于数据库条目与数字图像内容对应的准确性,抽检合格率应为100%,其他内容的抽检合格率应不低于95%。
12.4 验收结论
12.4.1 每批纸质档案数字化成果质量检验达到本标准12.2和12.3的要求,予以验收“通过”。验收未通过应视情况进行返工或修改后,重新进行验收。
12.4.2 验收完成后须经验收组成员签字。验收“通过”的结论,必须经相关领导审核、签字后方有效。
12.5 移交
验收合格的数据应按照纸质档案数字化工作方案及时移交,并履行交接手续。移交单示例参见附录B。档案归还入库
13.1 档案装订 纸质档案数字化工作完成后,拆除过装订物的档案如需装订,应注意保持档案原貌,做到安全、准确、无遗漏。
13.2 档案归还入库
按照档案入库相关要求对纸质档案进行处理和清点,并履行档案入库手续。
第四篇:广西壮族自治区纸质档案数字化技术要求
广西壮族自治区纸质档案数字化技术要求
(试行)
本规定对纸质档案数字化的工作流程提出具体的技术要求,适用于档案馆(室)纸质档案的数字化加工、验收及数据管理。
本规定依据国家行业标准 DA/T 31—2005《纸质档案数字化技术规范》而制定。纸质档案数字化基本要求 1.1 加工范围
档案数字化加工的范围为永久或长期保存的、社会利用价值高的档案。1.2 基本环节
纸质档案数字化的基本环节为:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、数据管理等。1.3 过程管理
1.31 建立档案数字化加工安全保密管理制度,确保档案原件和数字化档案信息的安全。
1.32 建立档案数字化的台帐制度,在档案数字化各环节均进行详细登记,以备查考。2 档案整理
在档案进行数字化扫描前,应对档案进行整理,确保档案数字化质量。2.1 目录审核
目录审核是根据档案的实际情况,按照《档案著录规则》(DA/T 18)等要求,规范档案目录著录内容,核实目录的准确性。如有不规范或错误的文件题名、责任者、档号、起止页号和页数等,应对目录进行修改,为建立目录数据库做准备;已建立目录数据库的,则依据档案实体对目录数据进行检查核实和修改。2.2 鉴定扫描件和非扫描件
制定扫描件和非扫描件的范围,按要求把同一案卷中的扫描件和非扫描件区分开。原则上重份文件、有正文的底稿或档案经过鉴定后不列入扫描范围的属于非扫描件。2.3 拆件和装订
以不损伤档案原件为前提,尽量拆除档案装订物,以免影响扫描质量。如拆除装订物可能会对档案原件造成损伤的,应保持原装订。扫描工作完成后,应进行档案清点,做到准确、无遗漏;拆除过装订物的档案应按原档案卷内文件的排列顺序进行排列,恢复装订,或根据工作需要改变原装订方法。2.4 页面修整
对已确定扫描的档案进行页面情况检查,页面破损严重,无法直接进行扫描的,应先进行页面修复;页面折皱不平,影响扫描质量的,应先压平或熨平后再进行扫描。
2.5 档案整理登记
制作档案整理工作登记表,对档案整理的过程一一进行登记,包括目录审核修改情况,扫描件和非扫描件鉴定情况,页面修整情况等,作为数字化其他工作环节的依据(登记表格参见附表A)。3 档案扫描 3.1 扫描方式
3.1.1 根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。大幅面档案可采用大幅面平板直接扫描,或采用缩微拍摄后胶片转数字化。没相应设备的一般采用小幅面扫描后进行图像拼接的方式处理。
3.1.2 纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式。3.1.3 扫描方式的选择以不损伤档案原件为原则。3.2 扫描色彩模式
3.2.1 扫描色彩模式有黑白二值、灰度、彩色等。
3.2.2 用黑白二值模式扫描,形成的图像文件所占用的空间较小,适用于页面为黑白两色,字迹清晰,不带插图的档案。
3.2.3 灰度模式适用于页面为黑白两色,但字迹清晰度差,或带有插图的档案,以及页面为多色文字的档案。
3.2.4 彩色模式扫描形成的图像文件所占用的空间较大,但能直接反映档案的原貌,用途广泛,并且可根据需要把彩色图像转换成黑白二值或灰度。页面有红头、印章或有照片、彩色插图的档案应采用彩色模式。3.3 扫描分辨率
3.3.1 扫描分辨率参数大小的选择,应以扫描后的图像清晰、完整,不影响图像的利用效果为准。
3.3.2 不论采用何种色彩模式,一般情况下,扫描分辨率大于或等于100dpi即可。如果档案文字偏小、密集、清晰度差等,可适当提高分辨率。
3.3.3 需要进行OCR汉字识别的档案,扫描分辨率应大于或等于200dpi。3.4 扫描登记
登记扫描档案的页数、色彩模式、分辨率等,如需要进行OCR识别的档案应注明。在登记的同时应注意核对每份文件的实际扫描页数与档案整理登记单填写扫描件的页数是否一致,发现漏扫或错扫时应及时补扫,并在登记表上注明原因和处理方法(登记表格参见附表A)。4.图像处理 4.1 图像质量检查
4.1.1 图像质量应达到以下要求:图像完整、清晰,无影响图片美观的黑边和污点,图像不偏斜或倒置,符合正常阅读习惯。
4.1.2 检查图像的偏斜度、清晰度以及完整性,发现不符合图像质量要求的应进行图像处理;因操作不当造成图像不完整或无法清晰识别时,应重新进行扫描。
4.1.3 扫描图像的排列顺序与档案原件一致,发现不一致时应进行调整;发现文件漏扫时,应及时补扫并正确插入图像。4.2 纠偏
对出现偏斜的图像应进行纠偏处理,以达到视觉上不感觉偏斜为准。对方向不正确的图像进行旋转还原,以符合阅读习惯。4.3 去污
对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理,在不影响文字可懂度的前提下展现档案原貌。4.4 图像拼接
对大幅面档案采用分区小幅面扫描后,形成的多幅图像,应进行拼接处理,合成为一个完整的图像,拼接后应与档案原件核实,确保拼接无误,保证数字化图像的整体性。4.5 裁边
为缩小图像文件容量,节省存储空间,扫描的图像应去除图像无内容、多余的边。5 图像存储 5.1 图像存储格式
5.1.1 图像存储格式一般应选择TIFF(G4)或JPEG格式。这两种图像格式存储文件小,通用性强,不使用专门图像编辑和浏览软件也能在WINDOWS系统平台上进行浏览和管理。
5.1.2 采用黑白二值模式扫描的图像文件,应采用TIFF(G4)格式存储;采用灰度或彩色模式扫描的图像文件,应采用JPFG格式存储。5.1.3 提供网络查询的图像,可把原TIFF或JPEG图像文件转换为CEB、PDF、海蓝或其他格式。5.2 图像文件的命名
5.2.1 每一份文件应以该文件相对应的唯一档号来为扫描后的图像文件命名。为了便于管理和数据挂接,图像文件命名的档号格式应与其目录数据库中的档号格式相一致。
5.2.1.1 传统以卷为保管单位的文书档案,档号格式为:全宗号—目录号—案卷号—文件所在页号(或文件顺序号)或全宗号——保管期限代码—类别(机构)代码—归档号—文件所在页号(或文件顺序号)。
5.2.1.1.1 保管期限代码为永久为
1、长期为
2、短期为3、30年为4、10年为5。
5.2.1.1.2 类别(机构)代码由各单位根据实际情况进行编制,固定使用,没进行分类的则以“0”替之。
5.2.1.2 立卷改革后以件为保管单位的档案,根据档案类型的不同其档号格式有所区别。
5.2.1.2.1 文书档案档号格式为:全宗号——保管期限代码—机构(问题)代码—件号。
5.2.1.2.2 会计档案图像档号格式为:全宗号——类别—件号。5.2.1.2.3 基建档案档号格式为:全宗号——项目代号(代码)—保管期限代码—类别号代码—件号。
5.2.1.2.3.1 类别号代码:基建文字为
1、基建图纸为2。5.2.1.2.3.2 项目代号(代码)由各单位自行编制,固定使用。5.2.1.3 企事业档案的图像文件以档号及件号来命名,具体格式为:全宗号—类号—案卷号—件号(或文件所在页号)。企事业档案类号的编制应遵循国家档案局制定的《工业企业档案分类试行规则》,与类目号以及不同级类目号之间用“.”分隔;
5.2.1.4 如有行业规定的档号命名格式,则应按行业标准来命名其图像文件。
5.2.2 档号中的各号(代码)固定位数,不足前补“0”。具体如下: 全宗号3位、目录号3位、案卷号4位、文件所在页号4位、文件顺序号(件号)4位、4位、类别(机构)代码2位、归档号4位、一级类目代号1位、二级以上类目代号2位。
档号中空缺或没有进行编制的号(代码),如全宗号、类别(机构)代码等,则以“0”替之。
5.2.3 多页文件应建立相应的文件夹,并按档号加上页码顺序对图像文件命名。5.2.3.1 以卷为保管单位的档案,每卷建立一个文件夹并以其档号来命名。
5.2.3.2 以件为保管单位的档案,每件建立一个文件夹并以其档号来命名。6 目录建库 6.1 数据格式
选择通用的数据格式(DBF、TXT、MDB),能直接或间接地通过XML文档进行数据交换。6.2 档案著录
按照《档案著录规则》(DA/T 18)、《广西文件级档案目录数据采集方案》等要求进行著录,建立规范档案目录数据库。6.3 目录数据质量检查
质量检查可采用人工抽查或软件自动校对等方式,核对著录项目是否完整、著录内容是否规范、准确。为了保证目录数据与图像文件能够正确挂接,检查时要重点检查档号是否准确、录入的数据条目数与档案的实际数量是否一致,发现数据错录、漏录应及时进行修改、补录。7 数据挂接 7.1 汇总挂接
档案数字化后形成的图像数据库,经过质量检查确认合格后,通过相应的软件与档案文件目录数据库进行批量挂接。
7.2 检查挂接
数据挂接后,以档案文件级目录数据库为依据,对挂接的图像文件进行检查,核对图像文件的命名格式是否符合要求,发现错误及时作出修正。7.3 挂接登记
对汇总挂接及检查挂接的情况进行登记,对挂接错误的注明错误原因、处理办法及修正结果(登记表格参见附表B)。8 数据验收 8.1 数据抽查
8.1.1 以抽查的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。
8.1.2 同一批验收的档案,抽查的比率不得低于15%。8.2 验收指标
8.2.1 目录数据库与图像文件挂接错误,图像文件不完整、不清晰、有错误等,为“不合格”。
8.2.2 同一批验收的档案,质量抽查合格率达到95%以上(含95%)时,可以验收“通过”。
合格率=抽查合格的文件数/抽查文件总数×100%。8.3 验收审核
验收“通过”的结论,必须经过分管领导审核、签字后才有效。8.4 验收登记
对验收过程进行详细登记,以备查考(登记表格参见附表B)。9 数据备份 9.1 备份要求
9.1.1 在档案数字化的过程中,要求把每天形成的图像文件数据备份到计算机的硬盘上。
每星期形成的图像文件数据,除备份在计算机硬盘外,并采用一次性写入光盘刻录一套数据保存。
9.1.2 数据挂接并验收合格后,应及时进行备份。采用多套备份方式,备份介质为一次性写入光盘,至少备份3套,并注意异地保存。9.2 数据检验
备份的数据应进行检验,检查备份数据是否能被计算机正确读取、数据信息是否完整、文件数量是否准确等。9.3 备份标签
数据备份后应在相应的备份介质上做好标签,并简略说明备份内容和备份时间,以便查找和管理。9.4 备份登记
对每次备份的内容、数据大小、备份时间、备份套数及数据存放位置等进行记录(登记表格参见附表C)。10 数据管理 10.1 管理要求
加强对纸质档案数字化成果的管理,制定相应的管理制度,对备份数据定期检查,确保数据的安全、完整和长期可用。10.2 保管环境
10.2.1 数据光盘不得擦洗、划痕、触摸其裸露处以及弯曲、挤压、摔打盘片。
10.2.2 数据光盘保管环境温度为14℃—24℃,相对湿度为45%—60%。
10.2.2 防止数据光盘沾染灰尘和污垢,避免阳光直接照射,远离热源、酸碱等有害气体和强磁场。10.3 检测与维护
10.3.1 备份数据光盘每年进行一次有效性、安全性检查,并每4至5年重新刻录、备份数据。
10.3.2 如原数据运行的软、硬件平台发生改变,应及时对数据进行转换,并做好备份。
10.3.3 做好数据检测与维护过程的登记,数据转换时应说明数据转换的原因及采取的转换措施、转换数据数量等。
第五篇:完成室藏纸质档案数字化工作
纪检委率先完成
室藏纸质档案数字化工作
按照《关于进一步加强立档单位室藏纸质档案数字化扫描工作的实施方案》的文件精神,纪委认真清点室藏档案,合理安排工作进度,科学制定工作方案。于近日全部完成了2001-2013室藏应进馆档案的数字化扫描工作,共计1507件14347页。此项工作的开展,提高了纪委档案室的服务效率,为机关档案室现代化管理打下了坚实的基础。