信息资源电子文档库、信息资源数据交换共享和统一信息检索完整解决方案
目录技术构建服务功能完善、信息内容规范、技术结构合理、安全措施可靠的信息资源库系 统,提高信息资源整合、共享能力和信息综合利用率,实现数据挖掘和知识发现,为领导决 策、业务工作和办公提供支持。
4.1.2.1 决策和领导服务
主要包括领导决策支持,为领导全面、及时、准确掌握各方面信息,进而做出决策提供 信息化支撑。促进领导决策科学化,为党总揽全局、协调各方提供支持。
4.1.2.2 办公业务应用
主要包括职能管理、业务办公、机关工作等办公业务的信息化实现,为办公厅内部的日 常办公和业务管理提供信息化支撑。充分利用信息汇聚中心的数据,支撑办公业务工作的进 一步开展。
4.1.2.3 信息共享与交换
主要包括决策支持辅助信息、突发事件信息、决策督查信息、公文信息、综合保障信息 等的跨层级、跨部门信息共享交换,为各单位履行法定职能提供支持。
4.1.2.4 资源深化利用
主要包括信息查询、统计汇总、专题分析等,为各单位充分利用信息汇聚中心的各类数 据进行资源深化利用提供信息化支撑,为各单位做好领导服务工作提供支持。
4.1.2.5 统一网站内容管理
为多个门户网站提供通用的内容管理,多个门户网站共享一个信息资源库
4.1.2.6 信息资源共享交换和统一信息检索平台
通过信息资源库管理平台,实现信息的统一搜索和信息资源库的服务查询。 提供 SOA 实现信息资源库之间的信息交换。
- 7 -
信息资源电子文档库、信息资源数据交换共享和统一信息检索完整解决方案
4.1.3 实施方案
信息资源库需结合网站内容管理和全文检索系统来进行建设,充分考虑信息资源库与网 站系统之间的数据共享与整合及与市和横向厅局的信息资源库实现对接。
信息资源库分类目录和及所属信息资源库由各部门根据相关信息资源分类细目和权限 负责建立、提供、维护并指定信息资源访问权限。信息资源库投入运行后,可为用户提供信 息共享、信息综合查询与利用等服务。
4.1.3.1 资源整合
提供统一格式的转换与规范化的文献转换及编辑工具,采用全文数据库进行非结构化、 结构化信息资源的统一分类管理,实现文本、图片、音频、视频等信息内容的关联管理。
4.1.3.2 资源管理与发布
1、信息采集要求
? 对于大量以纸介质存在的资源,如文件、批示、文电、督查专报、会议资料、
档案资料等,通过数字化加工与处理,批量生成电子化文档,通过人工辅助标 引,形成规范化的电子资源,上载到建成的相关信息资源库。
? 对于互联网信息资源,通过智能采集工具进行分类收集与内容自动过滤,批量
加载入库。
? 对于上报和下发的文件资料,直接标引入库。
2、信息分类要求 实现信息资源目录及分类结构的建立、归类和管理,根据信息分类和访问控制权限提供
信息资源目录检索结构,并可以对所有数据的灵活多样的全文检索方式,满足不同用户查询 各类信息资源库的需要。
3、信息发布要求 各类信息资源库的信息内容可以实时动态地发布到指定的网站相关栏目上,用户可以方 便的编辑和修改发布模板。
- 8 -
信息资源电子文档库、信息资源数据交换共享和统一信息检索完整解决方案
4.1.3.3 信息资源安全检索
实现信息分类查询、全文检索和统一信息搜索服务。
1、实现一致的、可控制的分类原则,用户可按照分类原则进行浏览和检索。
2、用户可以进行任意词检索、多字段复合检索、二次检索、历史检索并对检索结果进 行统计和排序。
3、检索操作的平均响应时间不超过 5 秒,并且检全、检准率高。
4、检索根据权限进行,从而避免信息泄密。
5、通过统一信息搜索平台实现对各共享信息资源库的检索
4.1.3.4 知识库和信息挖掘
1、利用信息资源库提供强大的知识管理工具和信息挖掘工具,系统可对数据库数据进 行整理、抽取和转换,构建起知识库,并利用信息资源库基于内容的查询挖掘技术,综合各 个应用领域的需求,建立数据挖掘系统。
2、辅助领导决策支持。通过对信息资源库数据信息进行挖掘、综合分析,协同模型库 管理系统,进行人机交互式领导决策支持系统运作,为领导决策提供科学的决策依据。
4.1.3.5 信息资源库信息的共享交换
1、支持关系数据库数据及记录式数据以及文本格式数据等的手工及自动批量导入并转 换为信息库标准格式。
2、信息库数据支持按照 XML 格式的批量导出能力,基于 XML 标准交换协议,保证系统 具有良好的兼容性与开放性,便于与其它系统交换信息。
3、通过与标准的关系数据库接口,系统实现对 Lotus 和流行的关系数据库系统中非结 构化信息内容进行批量迁移与信息同步,实现对其他应用系统中异构数据库的统一查询和访 问,最终实现异构数据库之间的平滑接入。
4、通过 SOA 数据交换接口,查询信息资源库管理平台,获得共享信息资源库服务信息, 向信息资源库发出服务请求,获得信息资源库的信息
- 9 -
信息资源电子文档库、信息资源数据交换共享和统一信息检索完整解决方案
4.1.3.6 访问控制与授权
实现独立于操作系统的用户权限管理、用户操作审计、分析与统计等功能,能有效地保 证各类信息资源库的安全。
基于 CA 身份认证系统,实现访问安全认证;通过用户和授权管理系统实现基于角色的 信息资源访问控制,每个工作人员根据自己的职务和权限,访问不同的业务信息系统和电子 信息资源;通过安全审计跟踪用户操作。
4.1.4 系统功能设计
经过对需求进行分析,系统功能概括如下:
1. 集成统一用户:实现信息资源库系统集成统一用户管理功能。
2. 集成单点登录:在信息资源库系统上集成单点登录功能。
3. 集成全文检索:上载文件(密文,但要同时上传明文)时调用全文检索的接口创
建索引。进行全文检索时,调用全文检索的接口进行检索查询,返回检索结果。 4. 资源库的创建:按照系统提供的向导,实现用户自定义资源库的创建。包括资源
库的属性以及资源库的结构。
5. 资源库授权:根据资源库的用途和使用权限,对创建的资源库进行授权管理。
6. 页面展示:管理员对资源库的数据维护页面进行定制展示,使之满足资源库的业
务逻辑要求。
7. 目录授权:对资源库中所建各级目录进行授权维护和管理。
8. 元数据维护:根据访问的权限可以对元数据进行维护和管理。
9. 元数据权限:元数据维护过程中要根据人员、处室和角色指定进行授权。
10. 文件格式转换:对上传的带密级的文档转换为标准的 PDF 文件格式保存,便于借
阅控制。
11. 借阅权限:通过文档在服务器端的加密实现借阅权限的控制。
12. 全文检索:实现安全的、基于授权访问的全文检索和查看功能。
13. 日志审计:实现包括构建日志、编目日志、元数据管理日志、查询检索日志。
14. 统计分析:实现统计生成报表,并可进行分析。
15. 标准的导入接口:制定了标准的导入权限和导入数据的要求及接口说明。
- 10 -
信息资源电子文档库、信息资源数据交换共享和统一信息检索完整解决方案
16. 标准的导出接口:制定了标准的数据访问权限和接口说明以及数据导出接口标
准。
17. 文本挖掘:提供自动提取关键词,自动建立摘要和自动进行分类,生成统计分析
数据,为领导决策提供支持。
18. 信息推送服务:应用系统的信息和电子文档进行集中统一管理,信息资源库的信
息和电子文档推送到可信任的、需要使用该资源的系统中,如门户网站、各应用 系统。
19. 在统一的信息检索平台,进行共享信息的检索和信息资源库服务的查询,实现异
构信息资源库的信息共享和交换
4.1.5 系统特点
1. 集成能力强:根据标准的数据导入接口,并经信息资源库允许就可以将数据无缝
导入到信息资源库中。
2. 信息共享:由于信息唯一的存储在信息资源库中,在为其他应用系统提供信息服
务的同时,保证信息的唯一性。
3. 个性化服务:信息的属性是唯一存储。但为其他应用系统提供服务时,可根据各
应用系统的情况进行个性化管理并利用。
4. 完善的授权体系:从可以创建资源库到信息发布,所有的环节都进行授权管理和
访问,形成一套完善的、清晰的管理和访问授权体系。
5. 方便、快捷的创建资源库:系统默认必须的结构外,用户可以根据业务的特点,
自行定义该库的结构。
6. 分布式部署:可实现分布式部署的方式,最大可能的实现信息资源的共享。
4.2 互联网信息采集系统
4.2.1 概述
互联网信息采集系统需要集成网页搜索、内容智能提取与过滤、自动分类、自动去重等
- 11 -