试析基于关键词集合的知识关联网络构建(2)

2012-08-19 23:05

  2.2健词集合及其划分策略

    关键词是用户在编辑知识时为每个知识点设置的,一般用于知识检索,本文则关注应用关键词集合构建知识关联网络的思想与算法.关键词集合指包含了1个或多个关键词的集合.关键词集合所包含的关键词内容与数量如何设置,取决于知识关联所遵循的关键词集合划分策略.本文涉及的三种划分策略分别是单关键词集合策略、全关健词集合策略和不定关键词集合策略.

    在单关键词集合策略下,每个关键词集合S只拥有一个关键词w;,该集合S‘对应知识点集合戊}k,,k2,-..,k,},这些知识点均含有关键词,、.设知识点k,具有关键词、,,,,,…,二r,基于此策略设置知识关联时,k,会把与关键词集合S,,SZ,...,5:匹配的知识点集合K,K‘中的全部知识点链接进来,并剔除其中的重复部分.如图2所示,6个含有关键词“学生”的知识点以单关键词集合{学生}为制图策略构成了有向完全图,也就是这6个知识点基于“学生”关键词的知识关联网络.

   在全关键词集合策略下,全关键词集合s;包含了知识点k:所具有的所有关键词,k:只把与全关键词集合S;wl,叨2,…,,r匹配的知识点集合K;中的知识链接进来.使用该策略获取的知识结果的相关度比使用单关键词策略要高.

    在不定关键词集合策略下,需人工确定关键词集合中所包含的关键词,此方式无法实现全自动知识关联,不适合在大型知识库系统中采用.

    由全关键词策略或不定关键词策略获得的结果集是单关键词集合策略结果集的子集,获得的知识关联网络图是基于单关键词集合策略获得的知识网络图的子图.在实际应用中,宜采用全关键词集合策略与单关键词集合策略相结合的方式,在知识点关联展示的时候分两组按不同的优先级展示.首先展示优先级最高的按全关键词集合策略得出的关联知识点集合,该集合中的知识与当前知识点的相关度最高;其次才展示单关键词集合策略得出的结果集.本文讨论的算法均基于这两种策略相结合的方式.

  2. 3以关键词集合为迭代单元的关联网络算法

    计算知识关联网络可以用关键词集合作为迭代单元循环进行或者仅针对单个知识点进行.这两种方式在KMS中各有优势,分别适合不同的场景在为数量较多的知识点构建关联网络时,首选以关键词集合为迭代单元进行计算,算法描述如下.

    1)设需要计算关联网络的知识范围中有P个知识点k, , k2,…,kP,任意知识点气均对应一个点v;,把所有的点绘制在图‘<V, E>中,v;与k}一一对应.

    2)分拣出KMS中所有种类的关键词w‑w2.wn,记录KMS中所有关键词集合的信息获得关键词集合S, ,52,.. Sn ... S9(包含所有的单关键词集合与全关键词集合),同时获得与任意关键词集合S.相匹配的知识点集合K;.

    3)逐个扫描关键词集合S, ,52, ,59,优先扫描其中的全关键词集合(这样可以确保每条知识后的关联信息优先展示关键字相关度最高的链接),记录当前关键词集合S,所对应的知识点集合Kl,记录知识点集合K中所包含的每个知识点元素k;,在图中与K对应的点集合的所有元素间作有向完全子图,在画边e};、eji时,在系统内知识点k、后加人知识点匆的链接,在知识点k;后加人k‘的链接·如果边已存在,则跳过,每画一条边,计数器c累加1.扫描完K9后,循环结束.

    4)程序绘制的图<V, E>就是P个知识点根据关键词集合S‑S2,S。构建的知识关联网络图,。是知识关联网络所具有的知识关联数量.该算法的复杂度是。(n2).

    如图3所示,在一个具有7个知识点的示例系统中,算法先根据单关键字集合S,{经济学}进行绘图,其次根据单关键字集合管理学进行绘图.“管理经济学”知识点因为同时具有管理学、经济学两个关键词,因此同时处于左、右两个有向完全子图中.图3就是这7个知识点根据2个单关键字集合所绘制的知识关联网络.

试析基于关键词集合的知识关联网络构建(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:突发业务下ATM网络中的双速漏桶监管器性能分析

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: