现在我们基本完成了任务。对于网络中的每一个节点,建立一个从该节点开始的先宽搜索结构,按照这个流程得到发自该节点的信息流的值,然后将这些信息流值加起来,得到每条边的介数值。需要注意的是,对于每对节点X和Y间的信息流,我们计算了两次:一次是从节点X开始进行先宽搜索,一次是从节点Y开始进行先宽搜索。因此,最后我们对所有数据除以2,以消除重复计算的影响。最后,用这些介数值,我们就能够找出介数值最髙的边,并利用Girvan-Newman方法,将它们移除。
3.最后的几点观察
刚描述的方法既可以用于计算边的阶数,又可以用于计算节点的介数。实际上,这已经在第(3)步中出现了。注意到我们不仅记录了通过边的流量,而且也隐含地记录了通过节点的流量,这正是我们计算节点介数所需的。
这里描述的Girvan-Newman方法,基于高介数边的反复移除,体现了从概念上考虑图分割问题的一种很好的方式,也适用于中型网络(可多达几百节点)。而对于大型网络,在每—步重复计算介数值的要求,从计算角度看是非常费时的。
考虑到这点,人们提出了多种不同方法,希望能更加高效地识别类似的关系紧密区域,它们包括对介数的近似[34],以及相关但更髙效的分裂和聚集法[35,321]。寻找能够快速处理极大规模数据的图划分方法,依然是人们很感兴趣的一个研究主题。
练习
1.用两三句话解释什么是三元闭包,以及它在社会网络形成中的作用。如有必要,可以用图例来说明。
2_分析图3.21中的图,其中每条边,除了连接b和c的边,以强联系(s)或弱联系(w)进行了标注。根据强联系和弱联系的理论,采用强三元闭包假设,你预计连接b和c的边该如何标注?请用1?3句话简明地进行解释。
3.如图3.22所示的社会网络,每条边的属性不是强联系就是弱联系,哪些节点满足第3章中讲述的强三元闭包特性?哪些不满足这个特性?请解释你的答案。
4.如图3.23所示的社会网络,每条边的属性不是强联系就是弱联系,哪两个节点满足强三元闭包特性?请解释你的答案。
5.如图3.24所示的社会网络,每条边的属性不是强联系就是弱联系,哪些节点满足第3章中讲述的强三元闭包特性?哪些不满足这个特性?请解释你的答案。