2.5.2 面向服务的语义知识发现模型
(1)面向服务的语义知识发现模型构建的技术框架
语义知识发现的模型结构技术框架图2-所示,在这个模型结构中,采用了分布式的组件架构和自适应的分布技术,在知识发现的整个过程中,用户不必关心资源的访问接口、存储管理方式和物理存储位置,在很大程度上简化和方便了用户的使用。从图2可以看出,分布式的、异质异构的、海量的企业信息资源可通过语义注册成为有语义支持的数据资源服务,并通过UDDI对外提供统一的访问接El,供数据控制子服务调用;同时,系统将算法提供者提供的知识发现算法封装为算法服务,通过UDDI对外提供统一的访问接口,供算法控制子服务调用。知识发现服务包括目标控制子服务、数据控制子服务和算法控制子服务,其中目标控制子服务负责知识发现目标(如聚类分析、关联分析等)的设定和结果的管理;数据控制子服务负责与数据资源服务进行交互,完成对数据的选择以及数据的预处理工作;算法控制子服务负责与算法服务进行交互,完成对算法的选择和相关参数的设定。具体的语义知识发现过程如图3所示,用户通过语义知识发现服务接口发出一个知识发现请求任务,知识发现目标控制子服务负责提供常用的知识发现目标(如聚类分析、关联分析等)供知识发现用户选择,当知
第 13 页 共 15 页
知识发现与管理 2 知识发现
识发现用户选定目标类型后,知识发现目标控制子服务调用算法控制子服务,读取当前已注册的算法服务资源列表,并根据选定的目标类型自动推荐或人为选择合适的算法服务,知识发现目标控制子服务根据该算法服务的类型,让知识发现用户根据需求对算法的参数进行配置,并设定结果的满意阀值。同时,知识发现目标控制子服务调用数据控制子服务,读取当前已语义注册的数据服务资源列表,按用户需求选择数据资源,并对数据进行清洗、转换等预处理工作,数据资源和算法确定后,就町以执行知识发现任务,从而获取所需要的知识。
图 2-7 面向服务的语义知识发现模型图
(2)面向服务的语义知识发现的特点
面向服务的语义知识发现是建立在SOA等相关技术的基础上,在浩如烟海的企业信息资源中发现知识,在这一体系架构下,知识发现具有以下特点:
① 知识发现算法的动态加入与扩展。知识发现算法被封装成算法服务,通过服务注册、服务查询等机制可实现知识发现算法的动态发布/JJn人,以及算法的查找,实现了知识发现算法的动态性、开放性和可扩展性。
② 异质异构的企业信息资源的透明集成。企业中的信息资源往往具有不同的格式和访问接口,通过SOA和语义Web技术实现对这些分布式、异质异构的企业信息资源的透明集成和统一封装。用户不必关心这些企业信息资源的物理位置、具体的访问接口,就可以对他们进行
第 14 页 共 15 页
知识发现与管理 2 知识发现
访问,在很大程度上简化和方便了用户的使用。
③ 知识的不断精化。面向服务的语义知识发现模型中运用了本体技术,本体的建立是一个不断完善的过程,这一背景下语义集成的异质异构的企业信息资源,作为知识发现的源数据,其知识发现的输出本身也包含一定语义的知识。通过上一轮知识发现的结果,可以为本体的不断修正与完善提供参考,因此,下一轮知识发现,由于不同的企业信息资源是基于修正后的语义本体所集成的,知识发现的有效性相应地就会有一定程度的提高,从而实现知识的不断精化。
(3)面向服务的语义知识发现的过程
图 2-8 面向服务的语义知识发现的过程示意图
第 15 页 共 15 页