第一篇:档案馆数字化、数字化档案馆、数字档案馆
关于档案馆数字化建设的思考
2006-11-9 网友评论 0 条 点击进入论坛
当二十世纪的尼葛洛庞帝(Nicholas Negroponte)在《数字化生存》(Being Digital)一书中,向人们描述着数字时代对我们的生活方式、工作方式甚至思维方式带来的各种冲击时,人类文明已经真实地迈进了二十一世纪,数字化信息时代的大潮朝着我们扑面而来。档案管理和利用如何应对及适应数字化信息时代的需求,是我们档案工作者要思考的。
一、传统档案馆的数字之路
2000年12月,国家档案局、中央档案馆印发的《全国档案事业发展“十五”计划》,把“加快档案信息化建设”、“加快现有档案的数字化进程”列入其中,同月国家档案局在中国档案管理现代化建设研讨会上宣布:十五期间,我国将加快数字化档案馆的建设。由此,传统档案馆数字化建设的问题引起了人们的关注,并且有一些档案馆已经开始对此投资建设。我们认为,传统档案馆的数字之路并非一蹴而就,而是一个循序渐进的过程,对这个过程的各个环节进行深入的分析研究是十分必要的,只有在有了清楚认识的基础上,才能规划和解决好档案馆的数字化之路,为今后的数字化档案馆进而是数字档案馆、虚拟档案馆的建设打好基础。
传统档案馆的数字之路由三个相互联系的阶段组成:
(一)档案馆数字化。档案馆的数字化包含着以下三层含义,其一是随着计算机技术的引入,建立档案馆的自动化系统,实现档案馆自动化管理,完成档案管理的数字化;其二是馆藏信息数字化,数字化的馆藏档案信息能直接被计算机识别和处理,建成完备的信息数据库;其三是构建平滑高效的档案信息数字化传输平台,实现档案的统一管理和资源共享。
(二)数字化档案馆。在档案馆数字化基础上,形成以数字化信息为馆藏内容,以计算机为管理手段,以网络传递为利用方式的一种新型档案馆,是采用现代高新技术的数字信息资源系统。
(三)数字档案馆。通过国家信息基础工程联合数字化档案馆,运用网络互联技术,将个体数字化档案馆联合起来,进行扩张、伸展,组成完全意义的数字档案馆,遵循共同协议,实现数字化信息共享,是超大规模的、便于使用的、没有时空限制的知识信息中心。用户可以通过网络计算机终端提出需求,由数字档案馆系统完成查找和调阅档案信息,完全不受时间和地理条件的限制。如果说运用虚拟技术,建立虚拟档案馆的话,那么,档案馆发展到第三个阶段,才真正可以称得上是虚拟档案馆。
二、档案馆数字化——数字化的起点
档案馆的数字化建设作为传统档案馆数字之路的起点,如何走好这首要一步,就显得至关重要。为此我们就着重于这一点来谈一下我们的观点。
计算机技术的普及,为档案馆数字化建设奠定了良好的基础。档案馆数字化建设包含以下几个方面:
(一)档案管理的数字化。档案管理自动化是对档案馆自身管理行为现代化的确定,而这种现代化是建立在计算机数字化管理基础上的。这个特征是基础性的,有普遍意义的,是开展其他数字化工作的前提条件。现在许多文章在探讨数字档案馆或虚拟档案馆时,较多是对档案馆美好前景的预测与憧憬,很少涉及传统档案馆的现代化管理问题,忽视档案管理具体业务环节的计算机数字化管理问题,如档案自动编目和自动检索、档案自动全文存储与检索、档案业务工作辅助管理、计算机辅助立卷、档案自动标引、文档一体化管理、档案馆办公自动化、档案库房保护技术现代化、档案数据库设计与建立等。而这些不仅是档案管理基本的业务环节,也是档案管理自动化的具体体现,更是档案管理数字化全面实现的基础。这些问题不解决,档案馆数字化建设就是“空中楼阁”,无从谈起。
20世纪90年代以来,我国各级各类档案馆开始进行档案管理数字化的实践与探索,大致可以归纳为三方面的发展方向。
1、建立著录档案信息检索系统。著录档案信息检索系统,应该说是计算机技术与档案工作的最早结合点。由于档案馆的馆藏量巨大,档案的信息资源又是如此丰富多样,为了方便利用者,提高查询效率,档案馆利用计算机技术进行档案目录或专题文件级目录著录,以达到快速检索的目的,检索工具的数字化带来的优势尽显无遗。
2、“文档一体化”管理。1992年国家档案局提出“文档一体化”管理思路,许多档案部门纷纷尝试利用计算机技术实现文件与档案的一体化管理,从文件形成之时到文件办结归档乃至档案管理成为一条流水线的操作过程。“文档一体化”操作管理软件与传统手工操作相比,避免应归档的文件材料人为遗漏,提高了文件归档的完整性和准确性,提高了文件立卷的效率,提高了档案的质量。但它也只是利用计算机技术来模拟传统手工操作流程,不是真正意义上的文档管理数字化。
3、档案馆数字化管理系统的建设。我国档案工作数字化管理起步时间较晚,目前还是以针对上述档案信息检索系统和文档一体化数据库系统的管理为主,停留在档案工作数字化管理的初级阶段,数字化管理的优势和潜能并未充分发掘出来。档案工作数字化管理系统实际上是一个可以涵盖档案馆行政管理和业务管理、档案信息开发利用工作等诸方面的大型的系统工程。档案馆数字化管理应该以此为契入点,朝着这个方向积极发展。
(二)馆藏信息的数字化。根据《档案法》的规定,综合性档案馆作为党和国家的科学文化事业机构,是永久集中保存档案的基地,与国家历史同在。综合性档案馆通常都有数量庞大的馆藏,内容及形式也是丰富多样的。就传统的档案载体而言,其记录信息都是平面的,文字、图像、声音等不同载体的信息难以有机地结合起来。通过运用计算机技术与多媒体技术,所有的馆藏信息都能以数字化的形式存储,做到图、文、声并茂,档案信息的记录功能与显示功能得到了极大的强化;而且更有前景的是数字化后的档案信息能随心所欲地从一种媒介转换到另一种媒介,给长期以来沉闷、形式单一的档案信息贴上吸引人的“标签”。馆藏信息的数字化是档案馆数字化建设的核心,其数字化建设的工程量巨大,各级档案部门应根据自身特点采取不同的建设模式:
1、大型综合性档案馆,它们的馆藏基础一般都较好,馆藏信息的利用也较频繁,在建设经费充足的情况下,可以采取技术优先的原则,划出专项经费,成立馆藏信息数字化部门,专门负责档案信息数字化工作。这种模式见效快,但投入高,需要很强的经济支持和技术支持。
2、中小型综合档案馆,在建设经费不够充足的情况下,可以采取资源优先的原则,购置少量的设备,对重要的档案资源先期进行数字化处理,循序渐进逐步扩大数字化规模。这种模式见效慢,投入较少,对技术要求也不高。馆藏档案信息经数字化后转化为数字信息,以数据库的形式存在。
目前大部分档案馆馆藏档案载体仍然是以纸质为主,纸质档案数字化制作方式一般有二种:第一种是通过计算机人工录入或通过扫描仪扫描由字符识别软件(OCR)识别,制成文本文件;第二种是将档案文件的每一页看成是一张图片,不管上面具体是什么内容,由扫描仪按页扫入计算机制成图形文件。第一种方式占据空间小,是一种真正意义上的全文数字化,但纸质档案信息的记录方式是多种多样的,有的是手写体、繁体字,有的字迹褪化及非文字形式等,此时采用第一种方式就会暴露出如下致命弱点:用OCR字符识别的准确率低;若采用人工录入,不但需要大量的录入人员,而且一时还不能马上胜任此项工作,差错率大且核对困难,投入大,收效慢。而第二种方式实现容易,一般档案工作人员只要稍加培训,即可操作机器,且工作可以定量化,差错率相对较低,即便有一些错扫、漏扫等,也能很快被发现。至于图形文件占空间大的问题,在计算机技术日新月异的今天,相信适合的软件很快就会被开发出来,如果能采用先进的高速扫描机,那么对档案信息数字化无疑是如虎添翼。另外,还因为图像扫描保持了档案原件本来面目,可以使利用者在看到文字内容的同时,也能看到纸质档案的其它一些特征,如原件的纸色、墨迹、印章、圈点、批注等各种原貌,使利用者可以获得更多的线索,开展一些更深入的研究。
(三)档案信息传输平台数字化。档案信息只有在传递过程中才能体现出它应有的价值,以往信息存在于一次文献即档案原件或经过处理的二次文献范畴内,人们需要档案信息,往往需要亲临档案馆,通过阅览摘录、静电复制或拍摄等形式来获取需要的信息。但档案信息在完成数字化后以数字形式存在时,数字网络系统就将成为其主要的传输平台,为档案信息的快速流动提供可能。数字化了的档案信息在传递过程中可以同时进行多向传递,形成传递网络,而且通过因特网可以方便地进行远程传递,不受时间与空间的限制,利用者不必亲临档案馆,就可以在任何时间任何地点通过计算机方便地利用档案信息。
如果把档案馆数字化建设比作一个人体的话,那么档案管理数字化和馆藏信息数字化的建设就是这个人体的骨架和血肉,数字网络系统就是它的神经网络。档案馆信息传输平台应首先构建的是档案馆局域网也可称为内网,一般的要求是在遵循统一的通信协议前提下,通过网络连线将各个部门的计算机资源整合在一起。可根据不同的应用设置服务器,部门的个体计算机通过网络共享网络信息资源,为档案馆核心数据库提供档案信息,也可以得到权限范围内的档案信息。其次是构建外网、公众网等,可使档案信息通过数字网络系统进入信息交流的大动脉----互联网,实现档案资源的共享。
三、档案馆数字化建设需要注意的几个方面
(一)建立标准化的规范体系。《中华人民共和国标准化管理条例》指出:“标准化是组织现代化生产的重要手段,是科学管理的重要组成部分,在社会主义建设中推行标准化,是国家的一项重要技术经济政策。”这充分阐明了标准化的地位和作用。现在各地的档案馆对数字化建设还都处在试验和探索阶段,采用的方式方法也不尽相同,因此在档案馆数字化建设中,标准化的规范体系的确立就显得尤为重要,它是档案馆数字化建设高质量的坚实基础。如浙江省档案局指出数据库建设要本着保证质量、规范标准的精神,并决定在2002年正式出台统一的《浙江省综合档案馆电子目录数据库结构与交换格式》相关标准,对全省各级档案馆现有的数据库与软件进行修改、规范,提高数据质量,完善软件功能,特别是数据标准接口功能。在建立标准化的规范体系方面我们应遵循以下原则:
1、以标准化管理为主,制度管理为辅。标准化适合于技术工作领域的规范化管理,可操作性强,而且与管理体制的关系较为超脱,因此在不与法律相冲突的情况下,标准化管理更有利于不同部门之间的协调。制度通常以法规形式出现,特别是约束力强,但管理范围有限,所以在标准化管理的基础上,配合制度可以形成档案馆数字化工作所需的严密的规范化管理体系。
2、首先考虑采用国际标准,其次才是国家、行业及地方标准。由于档案信息的范围和种类处于不断扩展和变化之中,因此即使在档案馆数字化阶段也应优先采用适用范围尽可能广泛的标准,尽量做到一次到位。档案馆数字化建设中确定标准的原则是:面向计算机和网络及信息平台的处理,直接采用国际和国家标准;面向综合性信息的处理优先采用国家标准;面向档案信息的处理以借鉴为主进行补充,由此形成标准化的规范体系。
(二)建设高质量的档案信息数据库。早在1992年就有学者指出档案工作现代化的核心是建设高质量的数据库,这个认识到今天仍然具有指导意义。现在我们档案馆数字化建设的核心依然是建设档案信息数据库,并通过网络平台进行信息传递和信息交流。
档案馆计算机数据库类型以检索性数据库和文件性数据库两种较为常见,检索性数据库主要用于揭示馆藏内容,介绍开放档案的范围、目录和提供网上检索途径;文件性数据库,主要用于完整地载入档案文件,使人们可以通过网络获得档案信息。档案信息数字化后以数据形式集合成数据库,档案信息组织形式就发生了本质上的变化,从原先纸张上顺序的、线形的方式转变为计算机的直接的、网状的方式,索引文件、超文本技术可以使信息按本身的逻辑关系组织成相互联系的网状结构,依赖先进的智能化信息管理技术,以人工语言或自然语言进行搜索,为用户提供方便、高效的服务。一个高质量的数据库中的数字信息要达到以下质量标准:第一、数据的准确性;第二、数据项目和内容的完整性;第三、数据的规范性;第四、数据的稳定性。
(三)档案信息安全问题。安全是档案馆数字化建设不可忽视的一个重要方面。档案馆与图书馆最根本的不同在于图书信息基本上是面对普通公众,而档案信息则对安全保密有严格的要求,有相当一部分档案信息是需要控制使用的,所以档案馆数字化建设中必须采取一系列措施保证档案信息的保密和安全。通常采取的措施可以分为制度管理和技术保证两类,档案馆在数字化建设中对此应该形成一套管理制度体系,此外还需要有相应的技术措施进行自动控制,才能做到更加严密。如中国第二历史档案馆在进行民国档案数字化建设的探索时就十分重视数据的安全问题。他们认为在黑客猖獗和网络安全保护手段不健全的情况下,为了确保档案信息的保密和安全,可以有计划、有步骤、分阶段地进行数字化民国档案网络化服务。他们首先对已有的档案信息系统进行改进分化,对馆内不同用户根据权限提供全文档案信息,使馆藏信息首先在馆内达到资源共享。当馆内数据库接入Internet网时,除尽最大可能保证网络安全外,将那些有机密性的、不开放的档案不存放在网络服务器上。在当前的技术条件下,为了解决档案信息的安全问题,也可以使用Intranet技术,提供授权的档案信息服务。
(四)加快相关人才的培养和使用。人才问题是关系到档案馆数字化建设成败的另一关键。档案馆数字化建设的过程是与新知识、新技术的普及密不可分的,所以各类相关人才的引进和培养必须引起高度的重视。档案馆数字化建设过程中必须考虑培养的人员有以下几类:系统开发与维护、数字化加工与管理、标准化建设、数据库运行管理等。
目前我国的档案专业教育,无论是高等教育,还是各种专业知识培训,都显得知识陈旧,内容更新慢,缺乏计算机技术与档案及档案工作关系的内容,其结果也就使得档案界严重缺乏既具有档案专业知识又具有计算机等相关知识的复合性人才,阻碍了计算机等现代化技术在档案事业上的运用。对此,档案教育界必须引起高度重视,奋起直追,加大培训力度。
同时档案馆也必须重视对在职人员的培训工作,重视引进相关的专业人才,以适应档案馆数字化建设的需要。在相关的岗位培训及人才引进时应该遵守以下原则:
1、做到有提前量,使有关人员对新技术新设备提前了解。
2、针对不同对象分层次培养,要求知识技能与岗位相适应。
3、充分依靠社会支持,引进人才但不浪费人才,做到人员结构合理。
以上是我们对档案馆数字化建设的一些浅见。现在各地档案部门都很重视这方面的信息,有些单位已将此摆上了议事日程,但相对于图书馆部门,档案部门的动作已经滞后。中国数字图书馆工程现已进入了实质性操作阶段,其在数字图书馆的总体结构、标准规范、技术线路等方面已经积累了相当的经验。1999年3月成立的“国家图书馆文献数字化中心”年生产规模已经达到5000万至6000万页全文影像数据,它的网络可以提供1000G存储量的网上信息服务。档案馆如果还不重视档案馆的数字化建设,不能在网络上有效地传递档案信息,就无法融入信息时代的快车道,最终将被信息社会淘汰。因此,为适应社会发展的需要,档案馆数字化建设不仅仅是一项具有前瞻性的举措,它还具有更深刻的战略意义。
第二篇:档案馆数字化管理解决方案(定稿)
中晶档案馆电子化管理解决方案
档案馆是收集、保管档案的机构,负责接收、征集、管理档案和开展档案利用等。档案馆的资料可分为纸质档案、照片档案、录音档案、录像档案、实物等。由于档案馆是存放重要信息和有历史或存储价值信息的机构,且其保管的资料量十分庞大,故将其保管的档案资料安全电子化就显得尤为重要。而档案电子化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。
传统人工管理流程存在的弊端:
档案馆档案扫描除了对高品质、高效率的需求外,信息管理也非常重要。由于资料扫描量巨大,传统方案在扫描后需要人工进行管理,所以经常会出现信息错乱的现象,需要花费大量的时间在整个档案库中寻找遗漏的信息,费时费力。
档案馆日常业务需求: ● 纸质档案录入:
√ 高速扫描,将各种纸质档案等转换成电子档案
√ 高精度的彩色图片档案扫描
√ 可承受批量性连续扫描
√ 操作便捷,稳定耐用
√ 重张检测,不能漏扫 ● 电子档案预处理:
√ 影像清晰,便于识别
√ 识别条码对文件进行自动分类
√ 纸质档案和电子录像档案关联,比对审阅
√ 不同资料按需分类,归整管理 ● 档案管理:
√ 资料在线审核 √ 分权限进行档案管理 √ 多平台档案查阅 √ 档案安全管理 √ 档案备份
中晶档案馆电子化管理解决方案
● 档案馆电子化管理系统,对于已有的各种载体形式的档案采用数字化处理技术进行加工处理,以实现不同载体形式档案的数字化管理和档案信息资源的数字化共享。● 由于实施了电子化管理,电子档案存放占用的空间比纸质档案存放占用的空间大幅地减少,并能有效避免资料重复提交。同时,在网络环境下,档案馆电子化管理系统将纸质档案和电子录像档案紧密关联起来。通过扫描方式生成电子档案,经过分级授权,不同部门的档案馆人员可在线查阅相关等级的档案信息,缩短档案信息传递时间,提高工作效率。● 利用档案编号对每份档案进行唯一标识,让每个档案都拥有一个属于自己的文档,实现快速编辑、管理、索引的功能。通过扫描端进行自动识别分类,自动完成同个档案编号下全部档案资料分类的绑定,减少了人工干预。并强化其他上传通道,保证档案资源的电子数据与录音档案、录像档案等的结合,有效地确保档案原件和数字化档案信息的一致性。● 采用软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。
● 同时,档案馆电子化管理系统也同步加强了纸质档案数字化各环节的安全保密管理机制,有效地确保档案原件和数字化档案信息的安全性。本系统针对纸质档案数字化的各个环节均进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录索引。
中晶档案馆电子化管理解决方案优势
标准的扫描设备,高效快捷、耐用稳定、精准呈现:
√ 快速连续扫描:可将纸质较好的A4纸质档案资料通过批量性快速扫描转化成电子化档案资料,既节省扫描等待时间,又便于已扫档案的整理归档,彻底提高工作效率。
√ 完美精确扫描:可将画册、照片等纸质较厚的档案资料通过平板扫描的方式转化成电子化档案资料,有效地保证原档案资料的高精度信息。
√ 一次采购,多年使用:维护保养操作简单,维护成本低,坚固耐用,达成长时间的日常使用需求。
完美的影像采集及识别技术,让影像更清晰、美观
√ 支援自动节选纠偏、背景平滑、黑边补白、二值化、去污渍、去装订孔、亮度对比度等影像调整功能,确保扫描影像接近原稿甚至优于原稿。
√ 支持删除空白页、智能拆页、空白页分割、指定扫描页数、折叠扫描、插入扫描、导入页面等更多人性化功能,让扫描不再是枯燥的作业。
√ 支持重张检测功能可有效减少档案信息遗漏,有助于提升档案信息的完整性。
√ 支持PDF文档加密,把自动归档后的档案进行加密,可有效的防止信息的泄漏。
智能人性化档案归整功能,为管理服务
对于已扫描的影像,可以做当前扫描批次的排序、替换、追加、删减、二值化、裁剪影像、亮度对比度的调整,确认调整完毕后再行上传。
第三篇:档案馆档案数字化和信息化工作制度
档案馆档案数字化和信息化工作制度
为确保国家秘密安全,促进档案信息化工作健康发展,杜绝档案数字化和档案信息化过程中的失泄密隐患,加强档案整理和数字化管理工作,现结合本馆实际特制定如下制度:
第一条
标有密级且未经解密的涉密档案,不得数字化和信息化。
第二条
对聘用工作人员的家庭背景情况进行审核,工作人员户籍必须为中国大陆公民。
第三条
与数字化和信息化工作人员签订安全保密协议,规定其不得下载、留存、持有和使用任何档案信息,违者承担法律责任并予严厉经济处罚。
第四条
所有数字化和信息化工作必须在我馆自备档案数字化场地进行,所有数字化设备和软件须进行安全保密技术检测,有安全保密隐患的一律不得使用。数字化工作中使用的软件必须是正版软件。对工作中使用到的计算机的输出接口采用物理和软件的方式进行屏蔽处理,防止数据外拷,计算机局域网与互联网等外网物理隔离,加工数据由专人负责管理,其他人员未经授权无权访问。
第五条
数字化场地必须安装视频监控设备,做到凡是有档案实体的地方都有视频监控。视频监控录像由专人保管,无关人员不得使用。
第六条
明确本馆负责档案数字化和信息化安全管理工作的分管领导,落实责任科室和人员,责任人员定期对所有数字化设备和软件进行保密技术检测。建立安全值班制度,每天定时由责任人员对工作现场进行监督,及时解决工作中出现的问题,消除安全隐患。
第七条
禁止非本项目人员进入数字化场地,如因特殊情况需向局(馆)分管领导报告,获得批准后方能进入。
第八条
严禁在工作室进行任何形式的有线或无线互联网连接,严禁采取手抄、拍摄、复印、打印、发短信或电子邮件等手段复制或摘录档案内容外传。
第九条
不得在工作室私自使用计算机、打印机、扫描仪、复印机、通信工具、摄录器材等设备;禁止使用外来的磁盘、U盘、MP3或光盘等存储载体。
第十条
工作人员上班时按规定穿工作服,禁止携带任何食物、流质等进入工作间;禁止喧哗、聊天、随意走动等与工作无关的事情;禁止私自乱拆、乱放、乱换办公设备,禁止私自改变计算机的硬件、软件程序;禁止携带易燃、易爆、有毒、有害等物品进入工作间。
第十一条
工作人员下班后必须迅速离开,禁止将办公物品、纸张等带出工作间外。
第十二条
工作人员每天下班后做好数字化场地环境保洁,负责检查灯、电脑及空调的电源关闭情况,并将门窗关好,注意防火防盗,做好安全防范工作。
第十三条
数字化整理过程中所产生的废纸必须存放在指定地点,每星期集中清理一次。清理时需安排专人对废弃纸张进行检查,确保其中没有夹带任何档案文件方能清出工作场地。
第十四条
档案数字化任务完成后,必须清除设备中的所有信息并作安全技术处理。
第四篇:综合性档案馆馆藏档案数字化鉴定探讨
【正文】
近年来,随着信息技术的广泛应用,一些档案馆开始实施数字档案馆计划,或开始对部分馆藏档案进行数字化处理,以便为今后实现档案全文信息络化查阅作准备,但馆藏数量较大的单位很快都遇到了一个棘手问题:挑选什么档案进行数字化?在确定将某一全宗档案进行数字化时,又面临是否将所有档案部进行数字化的难题?在对馆藏档案进行数字化时,面对着庞杂纷繁甚至“鱼龙混杂”的档案,大家不约而同地感觉到面临一个新的课题:档案在进行数字化前的鉴定。当今之际,档案数字化,虽同高科技、高投入相伴随,但一旦形成共识,摆上日程,其经费和设备等问题似不难解决,然数字化鉴定,却不那么容易,它政策性强,又是劳动和知识密集型工作,至今尚缺乏明确的指导理念,弄得不好即成为数字化的“瓶颈”,拖了档案数字化进程的后腿。因此,从某种意义上来说,档案数字化鉴定能否顺利开展,关系到档案数字化的进程,并最终影响档案信息社会化的实现。现笔者根据近来对此问题的研究和思考。提出一些管见,与档案界同行探讨。
一、数字化鉴定的目的馆藏档案数字化,是近年来随着信息技术的飞速发展,档案界为实现档案数字化管理和建立数字档案馆而提出,主要在馆藏档案数量具有一定规模,其档案利用具有较大发展空间,物质基础和技术条件又较好的省、市一级国家综合档案馆,以及一些发达地区区、县一级档案馆进行。这是一部分国家综合性档案馆顺应社会信息化的发展趋势,在实行档案资源信息化过程中采取的一项有力措施,其意义十分深远,它不仅能使通过计算机终端查阅档案全文成为现实,也将使档案馆在不久的将来通过现代计算机络向不同层次的和利用者提供远程档案信息查阅服务成为可能,由此根本性地改变传统的档案查阅方式,为档案信息资源广泛方便地为社会所用开辟一个十分广阔的空间。由于数字化档案从实体档案经过数字化处理到能够以数字方式提供利用,特别是远程利用,其中包含较高的制作和运营成本,因此要求提供利用的数字化档案具有相当的“质量”,也就是说被提供的数字化档案不能停留在原始和粗框状态。为了解决提供利用的数字化档案的“质量”问题,档案在进行数字化之前需要进行鉴定的问题很自然地被提上议事日程。与此同时,公开和通过络远程提供利用的数字化档案,要求其内容必须是适合向社会公开的,因此在档案进行数字化前进行划控鉴定也是必然之题(已经经过开放鉴定的例外)。一般来说,国家综合档案馆馆藏档案的基础状况,包括每个全宗内档案构成的合理程度,每个案卷的组合质量,参差不齐,有一部分档案组卷质量很高,十分精练简洁,卷内每份文件都具有实质性内容,很说明问题,如果从中剔除任何一份文件,都会感到整个案卷会产生缺陷,对于具有这样质量的档案,除了是否适合向社会开放的因素需要考虑外,显然对其进行数字化是无需再进行鉴定的,但实际上在馆藏档案中能够达到这种标准的档案很少,特别是上个世纪70年代以前形成的档案,由于历史的原因,这些档案的基础状况多数很不理想,常常是“鱼龙混杂”,有价值的文件和毫无价值的文件夹杂在一起,对于这样的档案进行数字化,必须在事前进行鉴定,通过鉴定,剔除那些无关紧要或毫无价值的文件,留下反映历史过程本质的材料,从而使数字化的档案是“货真价实”,真正具有参考和研究价值,能够派用处的档案,从数字化档案主要着眼于提供“精品”档案的要求出发,档案在数字化之前进行的鉴定有别于传统的档案价值鉴定。也不是单纯为了解决开放而进行的开放与否的划控鉴定,它是一种综合性鉴定,既包含对开放鉴定做拾遗补缺的工作,更承担着“去粗取精”、存真留实的责任,其目的就是通过鉴定,提供组合精练、内容充实、没有“水分”的原始档案进行数字化,从而保证了对档案进行数字化处理的高投入能够得到高效率的应用。
二、数字化鉴定的原则
为了确保能够将容量密集、基础状况良好、组合科学的馆藏档案进行数字化,必须对馆藏原始档案进行鉴定,在此基础上筛选出可以和应该进行数字化的档案,根据目前已经开展的数字化鉴定的实践,一般而言,在具体进行档案数字化鉴定时应该遵循以下几个原则:
1.精炼原则 数字化档案从档案的原始状态到能够远程提供查阅的数码状态,期间要经过数字化扫描、数据存储整理和相应检索关系的建立等一系列工作,需要一定的人力物力投入和技术支撑,在此情况下,为了使这些工作更具有价值和体现效益,要求提供数字化的档案必须有比较密集的容量,精炼原则即从这一目标出发,要求鉴定人员在进行鉴定时贯彻精炼思想,剔除重复件和无价值的文件,挤掉案卷的水分,特别是对于那些原来臃肿庞杂的案卷,更要舍得下狠心,剔除那些无关紧要和可有可无的文件,使经过鉴定后的档案组合非常精炼,最集中地反映历史活动的真貌。从挤掉案卷的水分来说,剔除某些正本文件的草稿、修改稿等是最为典型的例子。当然如果从深层次的专题研究需要出发,某些利用者会认为一个文本的草稿、修改稿、打印稿和正式颁发稿虽然主体内容相同,但在细节上存在差异,因而都具有重要的价值,因为它们从不同的侧面记录和反映了某份文件的最后形成过程。我们并不完全否认这样的看法,但是认为在通常的档案利用群体中,像这样很专业的利用者毕竟是少数,如果都按照这样的要求来进行数字化,则数字化档案的数据库容量将因此扩大几倍,其制作和运营成本也相应提高,而在大多数情况下,仅仅利用正本即能满足利用者的需要,因为文件的正本反映了最基本最主要的历史状况。从进行数字化投入产出的策略考虑,我们显然不能为了个别利用者的特别需求而作几倍的投入,何况原始实体档案依然存在,如果确有需要,利用者还可以专门查阅原始实体档案,以解决其特殊的问题。由此可见,精炼原则主要是从减少数字化成本出发,同时也是从绝大多数利用者的利用需求出发,并不包括满足个别利用者的特殊需求,2.存史原则 提出和要求贯彻精炼原则,其目的是为了使经过数字化的档案消除臃肿,去除水分,构成精炼,而并非为了单纯地达到精炼而将一些有价值的文件也抛弃,为此提出存史原则。这一原则的含义,可以理解为剔除文件时应以是否违背存史作衡量,也就是说,当如果剔除某份文件,是在剔除某种重要的历史记录,从而使某一重要历史情况或细节由此消失,那么对这种剔除必须作慎重考虑。我们在数字化鉴定的实践中遇到过这样的情况:在鉴定某一市级机关档案时,有人将区级机关上报的区情甚至基层情况的文件认为是“水分”,主张将其剔除,其理由一是此类文件在相应的区级机关的档案中会有保存,二是区情乃至基层情况不属于市级机关档案应反映的重点。但是按照存史原则,上述文件恰恰十分真实地记录和反映了当时特定背景下基层所发生的一段生动的历史,对于利用者直接了解这一历史时期的相关历史是很重要的材料,尽管此类文件在区级机关的档案里很可能也保存着。存史原则要求在进行数字化鉴定时不能一味地为精炼而精炼,还必须谨慎考虑不能将那些记录和反映生动的历史过程和历史真实的文件作为“水分”挤掉,从某种意义上说,存史原则也是对精炼原则的制约,贯彻存史原则能够防止因贯彻精炼原则的过头而把那些确实反映历史真实的文件也精炼掉。
3.利用优先原则 这一原则在很大程度上适用于数
字化鉴定的组织实施工作,但其核心思想也适用于数字化鉴定的具体操作。所谓“利用优先”,即将利用者的要求和想法放在首位,用通常的话来说,就是“急利用者所急,想利用者所想”,在进行数字化鉴定时,也必须贯彻这一原则。数字化鉴定,从某种意义上说,是按照一定的原则和要求,对原始档案进行一番筛选,利用优先原则要求在进行这种筛选时必须从利用者出发,充分考虑利用者的需要,也就是说,应该设身处地地从利用者角度出发。来进行这种筛选,保留对利用者切实有用的文件,剔除对利用者无用的文件,按照这样的要求,由数字化鉴定进行的筛选,其结果既减少了投入,降低了成本,同时丝毫不会损害利用者的利益,反而因为提供了浓缩的档案而节省了利用者的查阅时间,当然这里所说的利用者利益,是普通的和一般的利益,并不包括个别的特殊的要求。由于档案实现数字化所需要的巨大投入,决定了其考虑能够满足的利用者的需求只能是普遍的和一般的。
以上三项原则,可以说是三位一体,密不可分,即在贯彻精炼原则时不可不兼顾存史原则和利用优先原则,而在贯彻存史原则时也不能舍弃精炼原则,在考虑利用优先原则时当然也不能违背精炼原则。在数字化鉴定的实际操作中,只有对此三项原则作通盘考虑和综合应用,才能确保数字化鉴定具有相当的质量,达到预期的效果。反之,则可能顾此失彼,或重精炼而忽视存史,或重存史重利用优先而达不到精炼的结果。
三、数字化鉴定工作的策划和组织
由于馆藏档案数字化鉴定是一项新的业务,技术要求高,难度大,又缺乏实践经验,除了上述鉴定原则的切实贯彻,其策划和组织工作十分重要,在某种程度上,科学策划和周全组织,是保证数字化鉴定能够按照预定的目标进行并取得成效的关键。
1.数字化鉴定工作的策划 数字化鉴定工作的策划主要包括对首选拟进行数字化档案的考虑和确定、拟进行数字化鉴定档案基础状况的调查、鉴定重点的把握等方面。由于档案数字化进度按页计算,一个综合性档案馆在馆藏档案数字化方面要达到规模效应.哪怕是占馆藏档案的10%或20%,都需要经历一个复杂而漫长的过程,因此在实施馆藏档案数字化时必须在对馆藏档案进行调查的基础上制订出数字化计划,挑选出急需进行数字化的全宗。
第五篇:浙江省档案馆数字化加工验收办法
浙江省档案馆数字化加工验收办法
一、总则
档案扫描后形成影像数据及档案条目、全文数据的质量检查,采用人工校对的方式,对数据质量进行检查。核对图像是否按照《纸质档案前处理工作流程单》、《缩微档案前处理工作流程单》进行扫描,扫描页码是否完整、是否有漏扫;图像是否去污、纠偏;图像与目录的挂接是否准确;条目数据是否符合著录格式等,数据质量达不到标准要求的,应退回加工部门要求进行修改或重录。
二、条目数据
1、视档案及其条目数量的具体情况,以抽检的方式,以全宗内的目录为单元进行检查验收。
2、在一个单元内随机抽查5%的数据,对条目数量及其著录项目内容的准确性对照档案实体或前处理工作单,进行逐条检查。
3、核对的文件目录主要有档号、题名、责任者、时间、文号。
4、根据上述标准进行严格检查,其中,档号(数据编号)、选择扫描的页码、与电子目录的张页号是否一致的准确率要求达到100%,如发现一条错误,全部数据退回重检。其他数据项允许差错率控制在5%以内。
5、其他项目抽检合格率达到95%以上(含95%)时,予以验收通过。如合格率在95%以下,要求录入方对此单元内所有条目进行逐条对照核对,同时停止档案发放,我方不提供错误数据。合格率=抽检合格文件数/抽检文件总数×100%
6、对检查情况认真填写《档案数字化质量检验工作单》。
三、图像数据
1、视图像数量的具体情况,以抽检的方式,对该全宗内的图像进行检查验收。
2、在一个单元内视数量情况,随机抽查5%的图像数据,对图像数量及其图像内容的准确性对照档案(照片)实体或前处理工作单,进行逐条检查。
3、图像应按规定的分辨率进行扫描,并以TIFF格式保存。图像色彩应符合规定要求。
4、对图像偏斜度、去污、失真度、图像方向等进行检查。图像倾斜度小于3度;图像方向端正(A3图像应旋转后保存),以符合阅读习惯。
5、图像黑边裁剪内边,居中保存。图像拼接后,原分散图像不保存。
6、文件夹的命名必须与条目档号(数据编号)相一致,准确率100%;扫描图像完整性(具体参照第7条)要求100%正确。以上二项项目如发现一条错误,退回重检,我方不提供错误数据。其他数据项允许差错率控制在5%以内。
7、图像完整性:不准缺页、漏页。由于操作不当,造成扫描的图像无法清晰识别或文件不完整、有小字条遮盖等,造成信息丢失,均视为废页,要求重扫。大幅面图像扫描后的拼接处理,以不遗失档案内容为准则,确保图像的整体性,拼接后的画幅应基本无痕迹。
8、图像排序要求:扫描图像的排列顺序与档案原件排序要求一致,对于原件排序错误,扫描中作出正确的调整,应在处理单上注明,否则作排序错误处理,退回调整。
9、其他项目抽检合格率达到95%以上(含95%)时,予以验收通过。如合格率在95%以下,要求录入方对此单元内所有图像进行逐条对照核对,同时停止图片档案发放。合格率=抽检合格文件数/抽检文件总数×100%。
四、全文数据
全文录入以扫描或直接录入为主。需要扫描后识别的全文,分辨率必须大于300dpi,扫描识别软件必须是“清华紫光”、“尚书等先进的文字识别软件。全文数据库的抽检率为5%,合格率为95%。如识别后文字用于后台检索用,合格率为90%。文字识别后以TXT格式保存,并进行粗校对。
五、档案整理
档案整理:扫描之前,应在保护档案不受损害的前提下,拆除装订物(资料及档案内的成册材料不能拆),按浙江省档案馆所提供的《纸质档案前处理工作流程单》的要求区分 扫描件和非扫描件,并对折皱不平影响扫描质量的原件先进行相应处理(压平或熨平等);扫描完成后,拆除过装订物的档案应按原档案保管单位重新装订,并保持每页档案原有的排列顺序不变,案卷不掉页、右边和底边整齐。所有的档案卷内目录均进行打印,并装订到案卷最前面。卷皮破损严重的,需要调换卷皮,并按原卷皮上内容,抄写在新卷皮上。旧卷皮需全部交还档案馆。
档案验收:档案实体验收必须逐卷清点,按档案数量、文件状况、卷内文件页数与顺序、装订要求等进行检查,如发现档案丢失、损坏、圈划或涂改等将追究法律责任;顺序错误、装订不符要求、掉页、卷间文件颠倒等作为差错,合格率达到95%以上(含95%)予以验收通过。
六、光盘刻录
光盘刻录前,由信息科技处进行数据的技术检验,并出具检验报告。光盘必须确保在无病毒的条件下进行刻录。刻录前必须先对每盘光盘质量进行检验,光盘自检数据超过90%以上,此光盘才能刻录数据;数据刻录后必须封口,制作成只读光盘,不允许以后添加文件;光盘刻录后必须进行数据校验。光盘品牌应为优质产品,且在省档案馆认可之下才能刻录。
七、光盘移交与接收
检验合格后的光盘,按甲方提供的光盘号编号,同一案 卷和同一份文件,不得跨越二片DVD片号。光盘封面与封底需使用浙江省档案局提供的专用页面,并在相应的页面注明光盘内数据的信息。光盘交接时必须出具光盘流程单。
光盘移交档案馆后,接收人员必须对每盘光盘进行严格检查。检查内容包括:光盘病毒的检查;对光盘内的文件夹进行抽查,确保文件夹能打开;光盘刻录后必须封口,确定光盘不能再添加数据;最后检查光盘的外观,不能有划痕、磨损等现象。
八、检验人员职责
1、质检人员必须由省馆在职干部或聘任人员担任。
2、质检人员必须做到坚持原则、认真负责、秉公办事、耐心细致。
3、质检时要严格按照前处理工作单和质量标准进行检查。认真详细地填写质检记录,并签名负责。
4、验收必须严格登记,验收人员签名确认。所有验收单都需归档,同时作为省馆发放档案、接收数据和经费结算的凭证。
质量检查工作程序
一、目录数据质检
1、目录排序:根据档号(数据编号)进行排序,确定档号100%正确。
2、核对页数:扫描页数是否符合《纸质档前处理工作流程单》注明的页数。
3、目录补录:对照档案实体与《档案前处理目录补录单》,核查题名、责任者、时间、文号、张页号等的正确性。
4、核查是否根据《纸质档案前处理工作流程单》、《缩微档案前处理工作流程单》进行全文OCR识别。
二、图像数据质检
1、数据编号排序:根据数据编号进行排序,确定数据编号100%正确。
2、图像的完整性:包括缺页、漏页、不完整等,确定图像100%完整。
3、根据《档案数字化质量检验工作单》对图像的检验项目,逐项填写。
三、缩微
1、数据编号排序:根据数据编号进行排序,确定档号100%正确。
2、图像的完整性:包括缺页、漏页、不完整等,确定 图像100%完整。
3、对照《缩微档案前处理工作流程单》的要求,核查缩微号的正确性。
4、扫描页数是否与《缩微档案前处理工作流程单》相符,不需要扫描的页数是否删除。
5、补拍内容是否插入正文;OCR有无识别。
6、其它项目按《缩微胶片扫描质检单》逐条填写。
四、纸质档案验收
1、以案卷为单位进行清点,案卷应如数收回,不许缺卷。
2、检查案卷装订整齐,案卷内文件是否完整、准确;核查文件是否漏页、倒装、破损、顺序错误、脱页等情况。
3、双方签字确认。
附:《档案数字化质量检验工作单》
《目 录 补 录 检 验 单》
2006年5月25日