清华紫光TH-AMS2013电子档案管理系统技术白皮书
置完毕,点击保存,提示成功保存记录。
? 统计年报
提供符合国家档案局标准的年报格式,支持导出、导入和自动汇总功能。同时支持自定义年报功能,用户可以通过字定义年报建立年度统计表格。 ? 档案编研
? 创建编研库
根据编研需要创建不同类型的编研库。 ? 档案编研
设置字段对应关系
设置档案库与编研库字段对应关系,使源数据与目的数据可以正确转换。 编研
进入源数据(提供编研数据的档案类型库),选中数据,然后选择加入专题功能,将选择的数据直接加入专题,此时进入档案编研中已经可以看到新增数据。
? 光盘制作
利用光盘制作功能可以把档案系统中选定的数据及这些数据对应的电子文件按一定组织格式制作成档案数据光盘,从而达到安全备份的目的。 ? 工作量统计
利用工作量统计功能档案管理员可以解清楚的了解某段时间内各个部门的档案录入人员增加、删除、挂接档案文件的数量。
32
清华紫光TH-AMS2013电子档案管理系统技术白皮书
3.6、信息服务子系统
档案信息服务子系统是面向全体用户的,因此采用B/S的方式,通过应用服务器处理查询请求。用户通过档案信息服务网站,可以了解各项规章制度、通知、大事记、查询档案,浏览和下载档案原文等。
网站首页主要组成:
网站首页规章、制度公共信息编研成果档案查询登录档案网站首页
网站首页示意图
规章制度:发布各项规章制度,并及时更新,供全员浏览。 通知:随时发布各项通知,用简便快捷的方式让全体人员得到通知。 大事记:记录历年来发展过程中发生的重大事件,并不断增加更新。 查询登陆:通过用户名和密码的认证,登陆到查询档案主界面。
档案信息服务网站主要具有如下特点:B/S结构,客户端无须安装任何软件,便于维护和升级;可将档案的编研成果、公用信息随时在网页上发布。例如:组织沿革、大事记、专题内容、史料汇编、政策法规、规章制度、工作流程等;可与电子档案数据库连接,进行档案信息的查询和利用;对档案检索查询的权限完全受档案管理软件中权限设置的控制,充分保证档案的安全性;模糊检索功能;可支持200多种图形图像等电子文件的浏览和显示,并支持多媒体文件的播放,完全解决了IE浏览器显示文件格式有限的问题;可外挂浏览器和汉字库。
其中档案信息查询是信息服务网站的最主要的功能。
档案信息查询网页由档案检索、在线收集、档案编研、个人借阅信息、预约信息、赋权申请处理结果、档案员审批、领导审批、系统设置等模块组成。
其中档案检索包含:条件检索、分类检索、跨类检索和全文检索四种检索方式。条件检索就是先选
择档案类型,然后根据输入的条件组合进行检索,可以很精确地查询到所需档案信息;分类检索则可以根据档案的分类表进行检索查询;跨类检索则可以允许用户随便输入条件,在所有档案类型中进行检索查询;而全文检索则可以根据文件的正文内容进行检索和查询,全文检索依赖于清华紫光全文检索系统。
检索到的档案信息可以根据权限提供用户浏览和下载,如果用户需要下载电子档案原文,则可以通
过数字水印系统将电子档案原文嵌入水印,并通过网上认证服务器的认证,提供用户使用。
33
清华紫光TH-AMS2013电子档案管理系统技术白皮书
在线收集功能提供用户通过BS方式进行电子文件归档功能,支持对归档前库中的档案数据的项目、案卷、文件级数据的增加、删除和修改;对归档文件提供卷内目录和移交目录供打印。在线收集的功能为用户可选功能,对于不需要此功能的用户可以不赋予其权限,在数据权限级别上,可按部门来控制用户能操作的数据范围。
档案编研提供档案编研结果在网上的发布功能。
个人借阅信息查询则可以显示出用户借阅档案的情况。
预约信息则允许用户将检索查询到的所需档案提出借阅申请,借阅申请可以反应到档案管理人员的
借阅管理系统中,由档案管理人员打印借阅单,等待用户去借阅实体。
当用户需要浏览、下载或借阅超出自身权限范围的档案资料时,可以提出赋权申请,由单位档案员或领导对其进行临时赋权,使其在一段时间、或在有限次数的范围内可以浏览、下载或借阅该档案。 档案员审批和领导审批提供对用户赋权申请信息的响应处理,档案员可以批准或否决用户的赋权申请信息、当需要由领导进行权限审批时,可以通过转领导审批的方式,将审批权交由领导决定。
系统设置主要提供口令修改功能及查询首选项功能,查询首选项主要用来设置检索用户进入网
页后首先使用的检索方式。
档案信息查询功能如下图所示:
Oracle数据库全文检索数据库电子档案数据赋权申请档案信息查询个人借阅查询网上借阅预约条件检索分类检索跨类检索全文检索档案信息查询浏览下载数字水印利用认证服务
34
清华紫光TH-AMS2013电子档案管理系统技术白皮书
第四章 扩展功能
第一节 数字化加工管理子系统
在收集整编功能中,已提供了功能较强的档案扫描、图像处理、OCR识别及挂接功能,适合于具体工作人员进行小批量档案扫描输入。但对于大量的历史存量档案或新产生的大量档案,需要借助专门的数字化加工管理系统,由多人进行批量加工。为此,专门开发了与档案管理信息系统配套的档案数字化加工管理子系统。
档案数字化加工管理子系统利用各种专业扫描仪、数码设备、流媒体采集工作站等,将纸质档案、照片档案、影像档案等实体档案或模拟信号的档案转换成数字档案,并将数字化信息的存储到海量存储载体中。对纸质文件档案,扫描成影像档案后,可采用OCR技术,实现扫描结果的文本转化。并对档案进行相应的著录标引工作。
数字化加工是本子系统的核心部分,实现了整个过程中的功能和流程的控制管理,由扫描、图像处理、OCR识别、著录标引和校对五部分组成。
数字加工及著录标引主流程如下图所示:
原始磁介质数据采集设备
项目经理建立案卷,确定加工流程和分配工作任务。
针对用户不同的档案来源,选择不同的数据加工方式。其中原始磁介质可以通过系统的数据采集接
35
清华紫光TH-AMS2013电子档案管理系统技术白皮书
口驱动原始磁介质的数据采集设备实现原始数据的采集录入;纸介质文件则可通过高速图像扫描仪进行扫描录入;电子文件则可以通过辅助工具提供的数据转换功能转成标准的图像或文本文件。
上述过程需要对图像文件格式制定规范和标准。
扫描后的图像可以转入图像处理系统,对扫描图像进行处理和优化。
处理好的图像根据图像的质量和用户的需求,可以通过图像档案形成流程、双层PDF档案形成流程或纯数字化档案形成流程进行著录标引,分别形成图像档案、双层PDF档案和纯数字还原档案。
其中图像档案主要针对手写、无法识别或不需要形成纯文本的档案,最终通过著录加工可以形成图像(TIF或JPG)、PDF文件及XML文件。
纯数字化档案可以通过OCR识别、手工录入、校对等手段,形成标准的文本。优点是全文信息全,便于检索和利用;缺点是工作量巨大。最终通过识别、著录加工可以形成图像(TIF或JPG)、文本TXT文件、PDF文件及XML文件。
双层PDF档案是清华紫光特有的存储格式,综合了纯数字化档案的有点,同时又克服了工作量大的缺点,是一个理想的档案存储方式。双层PDF就是通过OCR的快速识别,形成文本,将文本和图像一起形成双层PDF文件。这样文件中既有图像,又有识别后的文本,完全满足上述纯数字化档案的所有优点,又是在自动快速识别的基础上完成的,不会带来巨大的工作量。最终通过识别、著录加工可以形成图像(TIF或JPG)、双层PDF文件及XML文件。
第二节 数据一体化归档接口
清华紫光TH-AMS2013电子档案管理系统不是一个孤立的系统,而是一个由底至上的全面开放的系统。亦即,可与各类信息系统进行一体化数据对接,将各个数据产生系统产生的待归档数据通过数据一体化归档流程进行归档,实现数据的有序流动和共享。
各数据产生系统产生的待归档数据,先归档到档案系统中责任部门的整编库中,由责任部门的档案管理人员进行归档鉴定和补全,最终归档到档案数据库中,同时建立全文检索的索引。
在规划数据一体化归档流程时,需开发相应的接口程序和有效的数据处理过程,以保证电子文件的真实性、可靠性、完整性和可用性。数据一体化归档流程需要注重以下几个方面:
? 业务数据转换标准:规定从数据产生系统导出的档案数据目录(属性)结构要求和原文(正文)
要求。同时,给出数据转换业务规范,如文件名转换成题名等。
? 数据结构转换标准:规定了业务数据的数据结构及字段项转换对应关系和要求,如字段类型、
长度等。
? 数据产生系统归档操作要求:规定哪些信息内容必须归档,归档时需补录的内容、检查校验的
36