在构建过程中,一般采用protégé工具加OWL语言的模式,侯氏等[7]探讨了中医治则治法的逻辑框架,将中医治则治法分为治则、治疗性常体、治疗属性、治疗语义、治疗操作等大类,对各类概念进行细化,初步建立了中医治则治法的本体,并讨论了其与中医顶层本体的关系。纪氏等[8]以针灸学为特定领域,探讨基于本体论的针灸学领域本体构建方法,初步建立针灸学领域本体框架模型。林氏等[9]构建了中医骨伤古籍小本体,解析了OWL表达的语义关系,尝试实现骨伤古籍语义检索系统,对其进行了系统功能演示及评价。
由于中医领域本体构建的复杂性,利用已有本体或叙词表进行改造而构建新的领域本体也是一种方法。如谷氏[10]通过实例阐述了中医古籍文献领域本体的建模依据与方法,认为古籍本体构建是必要的,目标是为数据库的应用服务,其构建过程需要专业叙词表的支持。李氏等[11]参照《中医脑病学》和《临床中医脑病学》的理论体系、复用已有中医学本体,将中医脑病学本体顶层概念分为13个大类,构建了包括概念及其概念间相互关系在内的中医脑病学本体,并对中医脑病学本体构建过程中存在的复杂性、层次性、模糊性、差异性和兼容性进行了分析和探讨。周氏等[12]探索了中药领域本体的构建,提出了按照自然属性分类法建立概念关系体系,进而构建中药领域本体。
此外,刘氏等[13]还进行了基于历史文献的中医药本体的自动构建研究,利用历史文献及公认的领域知识对中医药核心概念进行全面诠释,解释中医病、证、方、药等核心概念的实质与内涵,利用自然语言处理(NLP)理论和技术方法对已有公认领域知识,并借助领域专家知识,实现基于网络的知识采集与加工,建立起受限文本的本体自学习机制,从而实现领域本体概念描述体系的自动构建。
2.2 中医药语言系统
中医药语言系统(TCMLS)属于术语本体方面的研究。语义本体可以解决“人机”交流障碍,从而利于知识共享,中医知识在交流与传承上的障碍更加明显,因此中医药语义本体意义重大。自2001年开始,中国中医科学院联合全国30多家中医院校和多家科研单位,开始建立“中医药学一体化语言系统”。该系统以本体论为指导,按照本体论原理进行设计,旨在建立一个计算机化的、可持续发展的、包含中医药学及其相关学科的中国医药学检索语言集成系统和机读信息资源指南系统,形成中医药学及其相关学科的语言系统平台。目前,该系统已经成为世界上最大的传统医药本体,有16个一级类目,共编录12862个类[14]。
林氏等[15]对中医药领域概念表达的特点和中医药检索的现状进行分析,以中医方剂学领域本体的构建过程为例,说明本体在中医药自然语言语义化和信息表示上的优势,提出对中医药概念的表达不必单纯地强求标准化和一致性,认为本体可以完整、忠实、准确地表达中医药传统理论的语义,并做到机读、通用、可共享。
曾氏[16]论述了基于本体论的TCMLS构建的思路、设计原则及架构,包括术语及定义的采集范围及标准、定义类和类的等级体系、语义关系等,认为在目前国内外缺乏构建领域本体的成熟流程、方法和标准规范的状况下,TCMLS的建立是一项创新性工作,对系统整理中医药知识,促进中医药学术语数字化、标准化,实现中医药知识的再发现具有重大意义。
2.3 基于本体的应用系统
本体的应用研究主要包括两方面:一是解决知识交流障碍,表现为信息系统和语义网的构建;一是领域知识的获取。在信息系统建立上,郑氏等[17]开发了基于本体的名老中医医案研究应用系统,主要功能包含系统管理、古籍本体、名医医案、应用分析等功能模块,实现了用本体描述语言OWL对中医经典古籍及中医医案进行结构化的解析,为利用本体和先进的关系数据库技术结合提供了一个新的研究思路和研究方法。
基于本体的知识获取主要是从操作性知识中利用本体的属性和关系进行推理,从而分离出领域知识。周氏等[18]用NKI本体语言描述医学本体,并利用医学本体的属性和关系进行基于公理的医学知识推理,进而获取医学知识。曹氏等[5]在构建中医舌诊本体基础上,用本体+框架的方法表示中医舌诊知识,并进行基于公理的中医舌诊知识分析和推理,获取舌诊知识,基本能够符合临床情况。