www.myzhiku.com 培训管理资料大全 《商务智库》整理
信息技术的发展为信息的传播提供了条件,特别是Internet的迅速发展,整个世界连通起来,并缩小为“一个村”。这就使信息的发布更加容易,但这也带来了一些问题,如虚假片面信息充斥信息市场,给用户的利用带来了因难。政府通过制订相应的信息政策、法规等可以规范社会的信息发布,遏制虚假信息对信息市场的污染,打击利用不完全信息进行的不法行为,促进公平竞争。逐渐培育起一个与市场经济相适应的、有利于信息共享的信息资源体系和信息市场,从而更有效地规范社会经济行为和促进社会经济发展。
目前,一方面要通过立法确立政府信息资源上网共享的地位、原则和保障措施,以保证在安全保密范围之外的政府信息资源的公开利用。另一方面,为解决政府信息资源的人为限制和封锁,应采取信息资源市场化的方式:首先,由于信息部门各自虽然都拥有局部的信息资源优势,但无法满足市场高质量信息服务的需求,因此,应采用股份合作制,用利益共享、风险共担的方法来解决人为的限制和封锁问题;其次,双方只出可以重新搭配的信息资源,合作开发新的网络信息产品,使其与各自原有的信息产品和市场层面不发生冲突。
以上所介绍的一些措施有利于政务信息资源的开发、利用和共享,但是要让政务信息资源发挥更大的作用,创造更大的价值,彻底解决我国政务信息资源建设中的问题,必须进行政务信息资源的整合。
www.myzhiku.com 培训管理资料大全 《商务智库》整理 21
www.myzhiku.com 培训管理资料大全 《商务智库》整理
2.3政务信息资源建设的相关技术
2.3.1
信息集成技术
电子政务工程的建设,不仅仅是软硬件等基础平台的建设,更重要的时信息资源的建设,否则是有路无车。政府部门的信息内容可以大致分成两类:来自公文系统的文档型信息和来自数据处理系统的结构化数据信息。当前电子政务系统建设经验总结结果是:融合信息集成的思想,以元数据管理和XML作为数据交换标准为核心的政府信息资源建设方案。
以元数据管理为核心:自上而下贯穿各级行业行政部门,从元数据管理的角度,为行业的行政管理和行业信息资源的整合提供技术基础。采用分布式的数据存储形式,通过元数据实现了各级部门之间的信息检索和内容调用。元数据管理采用科学的分类编目管理结构,对电子政务系统中的各类信息进行分类组织,从而达到知识管理和决策支持目标。
以XML作为数据交换的标准:在数据交换和共享的层面上,基于XML和统一信息平台技术,实现不同系统的联合与互联。它覆盖了信息处理的整个流程(从数据采集、处理和传输,到信息管理、分析和共享),将多年来常见的管理信息系统延伸到数据分析、共享系统中,从信息中挖掘和提炼知识,为决策提供了充足的信息和决策支持。
信息集成的目的是要使得分布在网络环境下的不同应用系统之间实现数据共享。实现信息集成就是要实现数据的转换(不同数据格式和存储方式之间的转换)、数据源的统一(同一个数据仅有一个数据入口)、数据一致性的维护和异构环境下不同应用系统之间的数据传送。信息集成的理想目标是五个“正确”的实现,即“在正确的时间,将正确的信息以正确的方式传送给正确的人(或机器),以做出正确的决策或操作”。目前信息集成主要是以先进制造企业系统中的CAD、CAPP、CAM和MIS集成为对象加以研究的,不过其研究思路可以扩展到电子政务中来。如果是对一个崭新的政府来说,利用信息工程的方法对数据进行统一规划是较好的集成方法,但是,目前大部分政府各部门已经形成了信息孤岛,数据库系统是异构异质的,这种情况下,集成通常有以下一些方法:
①直接数据交换方式:即在两个相互关联的系统之间通过开发一对一的专用集成接口实现数据交互和集成。该方法的特点是接口模块设计易于实现,针对性强,运行效率高,但是接口的数目随不同应用系统的增加而成倍的增多,开发量大,系统可维护性差,任何一个应用系统的修改都会导致一大批相关应用系统的修改,从而大大增加了系统的复杂性。
www.myzhiku.com 培训管理资料大全 《商务智库》整理 22
www.myzhiku.com 培训管理资料大全 《商务智库》整理
②间接数据交换方式:这是一种使用标准数据格式的交换方法,它将相互关联的所有系统的数据转换成中间格式存储,建立中性丈件或标准数据库,这种格式独立于任何一个具体的应用系统,各系统只需提供两个翻译程序:前处理程序和后处理程序。其特点是通用性和适应性强,因而得到广泛应用。
③采用集成平台支持的中间件、智能代理(Agent)方式:这种方式可以实现应用对数据的透明访问,解决应用对于操作系统和数据存储方式的依赖性,是当今最先进的应用系统集成方式之一。
此外,还有采用ODBC技术、JDBC技术、DDE机制、QELIB技术、OLE技术和DBA技术实现异构数据库间的连接、数据交换和数据共享,采用元数据方法解决数据结构冲突和数据语义不一的问题等。
2.3.2 大规模数据库资源深入开发的技术
数据仓库技术
传统数据库系统作为数据管理手段,从它的诞生开始,就主要用于事务处理,经过数十年的发展,在这些数据库中已保存了大量的日常业务数据。对这些数据仅仅进行简单的统计报表、检索查询类的浅层面处理已经远远不能满足需要,必须把分析型数据从事务处理环境中提取出来,按照决策支持系统处理的需要进行重新组织,建立单独的分析处理环境。数据仓库正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术,它的目标是达到有效的决策支持。在美国,数据仓库已成为仅次于Internet之后的又一技术热点,许多数据库厂商也纷纷推出自己的数据仓库软件。
数据仓库是支持管理决策过程、面向主题、集成的、稳定的数据集合,它将大量用于事务处理的传统数据库进行清理、抽取和转换,并按决策主题的需要进行更新组织,数据仓库的逻辑结构可分为近期基本数据层、历史数据层和综合数据层(其中综合数据是为决策服务的)。数据仓库中数据的物理存储形式有多维数据库组织形式和基于关系数据库组织形式两种。前者的数据组织以空间超立方体形式存在,后者由关系型事实表和维表组成。这种高度集中的数据为各种不同决策需求提供了有用的分析基础。
联机分析处理(OLAP)技术
随着数据仓库的发展,OLAP也得到迅速发展。OLAP是在联机事务处理(OLTP)基础上
www.myzhiku.com 培训管理资料大全 《商务智库》整理 23
www.myzhiku.com 培训管理资料大全 《商务智库》整理
发展起来的一种共享多维信息的快速分析技术,这与数据库中多维数据组织正好形成相互结合、相互补充的关系。数据仓库侧重于存储和管理面向决策主题的数据,而OLAP则侧重于数据仓库中数据分析,并将其转换成辅助决策信息,二者相辅构成,共同完成决策支持或满 足特定的查询以及报表需求。其典型的应用有对银行信用卡风险的分所与预测、公司市场营销策略的制定等。
OLAP技术中比较典型的应用是对多维数据进行交互式查询和数据分析,交互式操作有多种,主要包括对多维数据的切片和切块、钻取、旋转等,它便于使用者从不同角度提取有关数据。OLAP技术还能够利用分析过程对数据进行深人分析和加工。例如,关键指标数据常常用代数方程进行处理,更复杂的分析则需要建立模型进行计算。
数据挖掘(DM)和知识发现(KDD)
DM和KDD也是为解决数据库数据量的爆炸性增长与开发利用困难的矛盾应运而生的信息技术。KDD是从数据库大量的数据中通过分析提取出隐含的、新颖的、有效的并能被人理解的规则或模式的高级处理过程。这里的规则或模式即是我们平常所说的知识。它给出数据的某些特性或数据之间的关系,是对数据处理后获取的更深层次的可供决策支持的信息。实际上从逻辑关系上讲,DM和KDD是包含关系,DM是KDD中的一个步骤,它主要是利用某些特定的知识发现算法。在一定的运算效率的限制内,从数据中发现出有关的知识,但DM是KDD中最重要的一步。因此,往往可以不加区别地使用KDD和DM。
例如,美国一家超级市场的技术人员利用KDD从售货的数据记录分析中发现,购买婴儿纸尿布的顾客经常同时购买啤酒,而平常在超级市场中这两种商品的摆放相隔是很远的。当利用KDD得到买纸尿布的人可能买啤酒的知识后,该超市立即调整了这两种商品的摆放位置。从而该家超市的连锁店很快吸引了很多在下班回家路上帮太大买纸尿布的丈夫成为他们的顾客。
用数据库管理系统来存储数据、用机器学习(机器学习是用计算机模拟人类学习的一门科学,比较成熟的算法有神经网络、遗传算法等)的方法来分折数据,挖掘大量数据背后的知识。这两者的结合促成了数据库中KDD的产生。实际上,数据库中的KDD是一门交叉性学科,涉及到机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等多个领域。从数据库中发现出来的知识可以用在信息管理、过程控制、科学研究、决策支持等许多方面。
www.myzhiku.com 培训管理资料大全 《商务智库》整理 24
www.myzhiku.com 培训管理资料大全 《商务智库》整理
2.3.3 网上信息资源开发利用的技术——搜索引擎的使用及技术动向
搜索引擎
搜索引擎是指因持网上专门提供查询服务的一类网站,这些网站通过网络搜索软件(又称为网络搜索机器人)或网站登录等方式,收集因特网大量网站的页面,经过加工处理后建库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息。用户的查询途径主要包括关键词、全文检索、主题词检索、分类检索及其它特殊信息的检索(企业、人名、电话黄页等)。从1995年开始逐步发展起来的搜索引擎是—个技术含量很高的电脑应用系统。它包括信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术。据统计,搜索引擎的使用已经成为当前第二大互联网应用,仅次于收发E—Mail,搜索引擎成为网站建设的重要功能。
一个搜索引擎由搜索器、索引器、检索器和用户接口四个部分组成。
(1)搜索器:搜索器的功能是在互联网中漫游,发现和搜集信息,它常常是一个计算机程序日夜不停地运行。它要尽可能多、尽可能快地搜集各种类型的新信息和定期更新已经搜集过的旧信息,以避免死连接和无效连接。搜索器的实现常常采用分布式、并行计算技术、以提高信息发现和更新的速度。商业搜索引擎的信息发现可以达到每天几百万网页。 (2)索引器:索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文挡库的索引表。索引器可以使用集中式索引算法或分布式索引算法。索引算法对索引器的性能(如大规模峰值查询时的响应速度)有很大的影响:
(3)检索器:检索器的功能是根据用户的查询在索引库中快速检出文档、进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制,检索器常用的信息检索模型有集合理论模型、代数模型、概率模型和混合模型四种。
(4)用户接口:用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。用户输入接口可以分为简单接口和复杂接口两种。简单接口只提供用户输人查询串的文本框,复杂接口可以让用户对查询进行限制。
www.myzhiku.com 培训管理资料大全 《商务智库》整理 25