中的“跨度”概念(捷径属性)事实上和它们作为“弱社交联系”有着直接的联系。这种联系虽然是弱的,但很有价值,它将我们引人了社交网络中难于达到的部分,这正是弱联系所带来的惊人力量。
3.3在大规模数据中的联系强度与网络结构
社会网络的结构特性与边的联系强度之间的关联,产生了关于现实生活中社会网络组织的有趣理论推测。然而,自格兰诺维特首次提出联系强度这一观念之后的很多年,由于很难找到可靠地反映现实中大规模社会网络中联系强度的数据,这些推测一直没有得到大范围的社会网络验证。
随着数字通信的出现,这种状态迅速得到改变。这种“谁和谁讲话”的网络数据显示出两个要素:两两通信的人们之间形成的网络结构,以及通过两人谈话的一些情况看出他们的关系强度的指标,例如在观察期间谈得越久,表明关系强度越大。这些正是对弱联系假说进行实验性评估所需的。
以此种方式进行综合研究,翁内拉等人通过覆盖全国人口20%的手机通信量,来研究“谁和谁讲话”网络[334]。其中,节点即手机使用者,在18周的研究期内,如果两个手机经常通话,那么就形成了由这两个手机使用者作为节点组成的一条边。由于手机在普通人中更广泛地用于私人通信(而不是用于商务目的);又由于不存在手机号码的总目录,意昧着手机号码通常是在已经相互认识的人之间交换,于是这其中隐含着的网络可被视为在一个国家社会网络中发生谈话的一个合理样本。此外,该数据显示了在第2章中所讨论的大型社会网络的许多结构特性,包括超大连通分量,即拥有网络中大多数个体(大概84%)的一个连通分量。
1.弱联系与捷径概念的推广
前几章中的理论基于两个定义,强调明确的二分法:即一条边要么表示强联系,要么表示弱联系;要么是捷径,要么不是。当我们考察大量真实数据时,对这两种定义进行一定程度的平滑处理会更有用些。
我们前面刚指出一种如此处理联系强度的思路:可以将一条边的强度数值化,设定为这条边两端通电话的分钟总数。一旦数值化,就可以将边按照其关系强度排序。这样,对于一条指定边,我们就可以问它排在所有边中的前百分之几。 由于手机通话数据中只有很少的边是捷径,我们可以放松该定义,将某些边看成是“差不多是捷径”。由此,定义一条边(A-B)的邻里重叠度(neighborhoodoverlap)如下式:
与A、B均为邻居的节点数 与A、B寸至少一个为邻居的节点数
其中,分母部分不包括A和B本身。以图3.4为例,考虑A-F边。A-F邻里重叠度的分母取决于6个节点B、C、D、E、G和J,因为它们至少是A或F的邻居。但只有节点C既是A的邻居也是F的邻居。所以,A-F的邻里重叠度为1/6。
图3.7边的邻里重叠度作为所有边按照关系强度排序的百分位的函数 该定义的一个关键特性是,当分子为0时,这个比率为0,对应的边是捷径。捷径的概念包含在该定义中,即捷径是邻里重叠度为0的边,因此我们可以把邻里重叠度很低的边粗略视为捷径。(直觉上我们可以想到,邻里重叠度很低的边对应的节点所涉及的“社交圈”很少有共同节点。)例如,按照该定义评价图3.5中的边,A-F要比A-E更接近捷径,这也是和直觉相符的。
关系强度与邻里重叠度的实验结果
用这些定义,我们可以基于格兰诺维特的理论预测,提出一些基础性的定量问题。首先,我们可以问一条边的邻里重叠度与它的强度的相关性。弱联系的强度预测说邻里重叠度随着关系增强而增加。
实际上,这种相关性十分清晰地体现在数据0中。将网络中的边按它们的联系强度排序,图3.7表明了它们的邻里重叠度与其在排序中的百分位之间的函数关系。这样,x轴越往右,边的强度就越大,并且因为这条曲线以醒目的线性方式增长,也就对应有越来越强的邻里重叠度。这两个量之间的关系从而与理论预测相当一致①。
图3.7反映出来的测量描绘了关系强度和局部网络结构(节点的邻居)的一种联系。考虑如何用这种数据来评估理论预测的全局性结果也是很有意思的。所谓全局性结果指的是弱联系起到将包含大量强联系的紧密社区连接起来的作用。此处,欧尼拉(Ormela)等人给出了一种间接的分析,如下所述。首先,从强度最强的关系开始,按序逐一从网络中进行边删除。由于节点间连接的删除,超大强连通分量会随之逐渐变小。然后,他们做同样的操作,但是从强度最弱的关系开始,按强度的升序进行边的删除。在这种情形下,他们发现超大连通分量缩小得更加
迅速;而且,一旦一个临界数量的弱联系被删除,其残余部分会突然分裂。这个结果是与理论预测是一致的,即弱关系在不同社区之间提供了更加关键的连接结构,将分散的社区连接起来,保持了超大连通分量全局结构的完整。
毕竟,这仅是在这种规模的网络数据上评估联系强度理论的第一步,它说明了一些固有的挑战:对于这种规模和复杂性的网络,我们不能只是简单地观其结构,试图“看其中有些什么”。一些间接的测量一定是需要的,因为人们对任何特定节点或边的含义或重要性都知之甚少。总结出更加丰富和详细的结论,依然是一个挑战。
3.4联系强度、社会媒体和被动参与
如今越来越多的社交活动在线进行了,我们一直维护和利用社会网络的方式也开始改变。例如,使用社会网络工具的用户都知道,人们将大量朋友的信息作为自己个人信息的一部分显式记录在那些站点中。以往不是这样,朋友圈相对来说是隐含的,即便是列举或者想一遍自己的朋友,对一个人来讲都是相对困难的[244]。这种情况对社会网络的结构有怎样更广泛的影响?理解这种由技术形式带来的变化是一种挑战,早在互联网在公众中流行的初期,巴瑞?威尔曼(BarryWellman)等研究人员就提出了这样的问题[413,414],并且一直以来不断扩大其范畴。 联系强度在这类问题上表现出其重要性,它提供了一种语言,让人们可以问在线社会活动是怎么分布在不同类型的连接上的,特别是如何分布在不同强度的连接上的。当看到人们在社会网络站点上维护上百人的好友连接时,我们不禁会问这些连接中有多少对应强联系,即彼此经常联系;有多少对应弱联系,即相对交往很少。
①当然,注意到图3.7中的最右的边偏离了这种趋势也是有意思的,那些边具有最大的关系强度^对于这种偏差形成的原因不是很清楚,但很可能是,这些关系强度极强的边与用特别方式打手机的人们有关系。
1.脸谱(Facebook)的联系强度
研究者已经开始利用来自最活跃的社会媒体站点的数据来分析关系强度这类问题。在脸谱公司,卡梅伦?马龙(CameronMarlow)和他的同事们分析了记录中每个用户资料的友情链接,希M了解每个链接实际用于社交活动的程度,这已超出记录中的内容[286]。换言之,一个用户的朋友之间存在的强联系体现在哪些方面?为了用现有的资料进行精确的分析,基于一个月观察期用户的使用情况,他们定义了以下三个类型的连接。
?表示互相联系的连接。在观察期内,如果用户不仅发出信息给连接另一端的朋友,也收到来自他们的信息。
?表示单向联系的连接。如果用户向另一端连接的朋友发出一个或多个信息(不考虑对方是否有回复)。
?表示保持关系的连接。如果用户关注连接另一端朋友的消息,不考虑是否有实际的信息往来,“关注对方消息”在这里表示要么通过Facebook的新闻提醒服务(即提供朋友的更新信息)点击有关内容,或者至少两次访问朋友的信息概要。