国内外主要本体库比较分析研究(8)

2018-11-28 17:57

OWL版本的UMLS Semantic Network通过对源文件的语法解析用个性化的OWL构造器创建[20],可详细解析源文件的语义类型、关系的基本信息及网络的结构信息。

Enterprise Ontology领域本体的本体编辑和管理工具有Tucana、Protégé、OILed、SWOOP。分析工作类似于构建一个概念企业数据模型,并且包括一些技巧如:形成好的抽象的能力、通过谈话从用户中提取信息、通过现存的文档和数据发现信息线索。

OBO-Edit是由GOC开发和维护的开源资源,是一个独立的平台,用于查看和编辑OBO格式的本体,它是一个基于图表的工具,重点是为生物学家提供一个友好的基于本体的全局图表架构,能使OBO-Edit快速地产生类别相对简单地以关系为重点的大本体[19]。

(5)应用领域

TMO是一个高级的、以患者为中心的本体,它架构了现存的开源领域本体,并为关联、集成和全部转化机构内以患者为中心的数据提供了框架。

UMLS词表已成为词典标准在生物医学知识中共享,并被应用于生物医学数据库的信息提取和集成、本体的语义集成等。

Enterprise Ontology是与工商企业有关的术语和定义的集合。

GO项目旨在定义一套结构化的、定义精确的、通用的受控词表,可用来描述任何有机生物体中基因和基因产物的作用。

4 结语

早期的本体研究工作是围绕词典、叙词表等资源展开的,面向的领域是机器翻译和初级的自然语言处理。WordNet是围绕着西方经典辞书和其他语种与英文的双解词典展开的,知网的词义定义基础也得益于《现代汉语词典》。WordNet可以被认为是一种表象,这种表象体现了词汇所表达的概念之间的语义关系,而这种语义关系可以通过HowNet中有关义原的关系得到解释。也就是说,WordNet中所描写的各种语义关系能够通过HowNet中的义原得到验证、推导。DBpedia类似于一部百科全书,是一个十分丰富的多种类语料库,但与OpenCyc、WordNet和HowNet等手工本体相比,DBpedia的不足之处是:没有形式化的结构,数据质量低并且数据不统一。经过不断发展,Cyc终于走出了只能成为一部“百科全书”的局限。它具有完备的常识库和经过多年检验和修改才逐渐完善的概念/类的体系结构。系统具有概念与概念间的关系、实例及公理等本体必备元素。它具有自己的标示语言CycL,利用形式化语言的描述,以断言

的方式来定义概念和类,然后再不断添加到数据库中。它利用微理论来定义和区别不同概念出现的语境。通过这种机制,Cyc知识库系统将越学习越聪明。随着常识的增多,其解决问题的能力也将以几何级数增长,从而有望成为新一代专家系统的原型。

当今的本体研究要解决机器如何理解自然语言的难题,以及多语种问题。WordNet和知网可以作为早期进行本体系统开发的雏形,DBpedia是个大型的多种类语料库,Cyc不仅有完备的开发工具和标示语言,还有大型的自主开发的知识库作为领域本体的概念基础,是具有推理能力的最为完备的本体库系统。

本体的研究虽然起于人工智能领域,但专业领域本体的构建不仅需要本体工程师,更加需要专业领域专家的参与,以实现对知识体系构造、组织和完善,由于专业背景和研究目的的不同,两者统一协作也存在一定的困难。即便是同一领域的专家,对同一问题的看法也未必一致。所以专业领域本体构建的前提是领域专家对专业知识及系统功能达成共识。

无论是通用本体库系统还是专业领域本体库系统,都是在自然语言处理中受到广泛重视和使用的在线知识资源库。它们已应用于自然语言处理的各个领域,如句法歧义消除、语义歧义化解、信息检索、机器翻译等。上述各本体库各具特色且不可替代,都拥有稳定的用户群体,其研究人员或者是开发者都在尽力完善其功能并提供更加友好的界面,以便更好地为用户服务。然而,这些本体库也各有不尽如人意之处。要真正解决这些问题,还有待于开发一种标准化的工具,这个工具需要满足一定的要求,如具有一定的开放性、

提供通用概念体系和常识库、支持符合Web标准的统一的输入和输出标示语言、支持多语种并使用Unicode 字符集、能够广泛应用于AI领域和知识表示领域并得到领域专家和IT专家的认可。

【参考文献】

[1]张秀兰,蒋玲.本体概念研究综述[J].情报学报,2007,26(4):527-531.

[2]Miller G A, Beckwith R, Fellbaum C, et al. Introduction to WordNet: An On-line Lexical Database[EB/OL].[2010-09-01]. http://wordnetcode.princeton.edu/5papers.pdf.

[3]WordNet. A Lexical Database for English[EB/OL].[2010-09-01]. http://wordnet.princeton.edu/wordnet/.

[4]张晓林.元数据应用与研究[M].1版.北京:北京图书馆出版社,2002:204-205.

[5]Bizera C, Lehmannb J, Kobilarova G, et al. DBpedia-A Crystallization Point for the Web of Data[C]. In: Proceedings

of Web Semantics: Science, Services and Agents on the World Wide Web. 2009: 154-165.

[6]李景.本体理论在文献检索系统中的应用研究[D].北京:中国科学院文献情报中心,2005.

[7]Cycorp. About Cycorp[EB/OL].[2010-09-01]. http://www.cye.com/cyc/company/about.

[8]Cycorp. What is Cyc[EB/OL].[2010-09-01]. http://www.cyc.com/cyc/technology.

[9]OpenCyc. Foemalized Common Knowledge[EB/OL].(2009-04-08).[2010-09-01]. http://www.openeyc.org/releases/.

[10]董振东,董强.关于知网—中文信息结构库[EB/OL].[2010-09-01]. http://www.keenage.com/html/e_index.html.

[11]Dong Z D, Dong Q. HowNet[EB/OL].[2010-09-01]. http://www.keenage.com.

[12]Dumontier M, Andersson B, Batchelor C, et al. The Translational Medicine Ontology: Driving Personalized Medicine


国内外主要本体库比较分析研究(8).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:机械设计习题

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: