相似度测度总结汇总(7)

2019-02-15 20:43

数决定。通过k次的迭代,可以获得匹配错误最小的两图之间的节点匹配,并计算出其匹配错误。

首先必须定义几个矩阵分别用来表示节点的错误差,可能的节点匹配对等。接着还要定义节点匹配错误的计算公式和边匹配错误计算公式,最后依据匹配错误的大小来确定两个图的相似度。将这种图匹配算法应用于图像检索,取得了很好的实验效果如图1-7所示的是两个图像的属性图结构。

通过计算可以得到图1-7示例中两幅图像的匹配错误,并依此进行图像的搜索或匹配。但同时可以发现该算法存在不足之处,它无法给出两幅图像的确切的相似度,仅能给出其匹配错误,无法定量的描述其相似程度,这也是该算法应要进一步改善的地方

1.8 基于本体的语义相似度测度算法

基于本体的语义相似度算法主要包括概念信息量法，语义距离法、基于属性的语义相似度、混合式语义相似度等方法。

1.8.1 概念信息量法：

概念信息量法以信息论和概率统计为基础，需要进行大量的文集统计工作。

1.8.2 基于概念属性的相似度计算

在本体结构中，概念的属性是决定语义相似度的重要因素［１４］。当两个概念拥有的相同属性越多，表明这两个概念间的语义相似度越大。概念属性的相似度计算公式为：

SimAtt(S,F)?Count(att(S)?att(F))（1）

Count(att(S)?att(F))其中，att(S)表示实体S属性的集合；att(F)表示实体F属性的集合；Count()表示统计

出的属性个数。若实体的某种相应的性质不存在时，则不用表示S、F在该性质上的相似度。

1.8.3 语义距离

语义距离是指本体结构中任意两个概念节点之间的最短路径长度。

基本假设如下：两概念的语义距离越大，其相似度越低，反之相似度越高。

设实体a、b分别对应语义知识库中的概念con1、con2，记sim_sem(con1,con2)为二者的语义相似度，因此sim_sem(a,b)=sim_sem(con1,con2)。

设Dist(con1,con2)为本体中两概念的最短语义距离，则语义相似度与语义距离之间存在如下关系：

（1）当Dist(con1,con2)=0时，sim_sem(con1,con2)=1，表示完全相同。

（2）当Dist(con1,con2)等于无穷大时，sim_sem(con1,con2)=0，表示完全不相似或不