《2010 年中国网民社交网站应用研究报告》显示,有83.8%的用户表示,在社 交网站上的好友是现实中的朋友。同时,网络交际人群比例也较高,54.6%的社交 网站用户好友是来自线上交往。
在社交网站用户间的各种关系中,业缘关系占主体,用户的好友中78.9%来自 现在或过去的校友,59.4%的用户好友来自同事或同行业的从业者。其次是基于地 缘的好友关系, 59.7%的用户好友来自同一城市、社区居住的人或同乡,地域 SNS
的市场空间较大;基于亲缘关系的占 57.6%,如下图6所示。
图6:社交网站用户好友构成
现实生活中较亲密群体在社交网站中的交往活动,对用户的活跃度产生了积极 的影响。活跃用户与非活跃用户相比,在社交网站上基于亲缘、业缘、地缘等亲密 关系建立起来的关系网络较多。由于这些关系的线下基础较为牢固,且关系的互动 性和互惠性较强,因此对用户行为的互动性和参与性起到了推动作用。 3.1.2 大学生群体平均好友数量
本次做的研究统计显示,有 52,594 名人人网用户明确的把自己的身份信息设定 为上海交通大学并通过了网站认证核实。由于受用户隐私设置限制,本次研究只获 得了其中 12,721 名上海交通大学用户的完整好友列表。下表 4 是对在不同的好友数 量区间内,符合条件的用户数量以及所占百分比统计得出的数据。 好友数量范围 符合的用户数 百分比% 0-100 1175 9.24 100-200 1920 15.09 200-300 2275 17.88 300-400 2078 16.34 400-500 1640 12.89 500-600 1150 9.04 600-700 770 6.05 700-800 548 4.31 800-900 419 3.29
900-1000 310 2.44社交网络中陌生个
体间人际关系形态研究 第 22 页
1000-1100 221 1.74 1100-1200 89 0.70 1200-1300 41 0.32 1300-1400 31 0.24 1400-1500 14 0.11 1500-1600 14 0.11 1600-1700 7 0.06 1700-1800 9 0.07 1800-1900 3 0.02 1900-2000 2 0.02 >2000 5 0.04
表4:上海交通大学用户好友数量统计
下图 7 是分析了表 4 的上海交通大学用户好友数量之后得出的统计图。 图 7:上海交通大学用户好友数量分布
图中横坐标是好友列表(以间隔100人为一个统计区间)数量,纵坐标是符合条 件的区间用户数。统计数据显示,9.2% 的用户好友少于100个,90.8% 的用户好友 数量在100以上;80% 的用户好友数量在600以下,好友数量在200~400区间段的最 多,占34%;所有用户的平均好友数量是 401 名。这个数值远远高于之前提到的人 人网以及Facebook的平均水平,同时也远大于150这个顿巴数。这直接反映出大学生 群体交际非常活跃,人际关系网更为庞大和复杂。社交网络中陌生个体间人际关系形态研究 第 23 页
根据此前抓取到的其他高校部分用户的好友信息,我做了不同高校大学生的平
均好友对比,如表5所示。由于除了上海交通大学的样本用户数超过1万,其他学校 用户选取的样本相对较小,故这个对比仅具有参考价值,但至少有一点是毫无疑问 的,就是各高校大学生的平均好友数量同样都远大于150这个顿巴数。 学校 样本用户数量 平均好友数量 上海交通大学 12,721 401
复旦大学 169 593 同济大学 83 524 华东师大 73 461 清华大学 62 756 上海财经 54 523 北京大学 52 583
表 5: 不同高校平均好友数量对比
大学生正处于成长的黄金时代,他们渴望建立良好的人际关系,从中得到激励, 自信和归属认同感。社交网站的好友大部分存在于现实生活当中,也就是说网络人 际交往从某种意义上是现实人际交往的延伸。社交网络人际关系既依托于现实人际 关系,同时又对现实人际关系产生反作用。互联网上人际交往的满足降低了现实生 活中人际关系的需要,因此大学生理想的人际关系状态应该是现实和网络的优势互 补。
社交网络给现实生活中不善交往的同学也提供了很好的辅助途径。人们在虚拟 世界可以忽视身份、外貌等客观不利条件,自由自在的与其他同学平等对话,表达 自己的观点;在互联网上,没人知道你是一条狗(On the Internet, nobody knows you're a dog);通过社交网络平台,现实人际交往过程中产生的冲突和矛盾也可能得到化 解和改善。
中国人重友情,在家靠父母,出门靠朋友。很难想象一个没有什么朋友的人, 能够独立生活在这个世界上,并且可以过得快乐和幸福。随着时代的变迁,交友方 式也发生了变化。在人人网上,用户可以用较低的成本,维护和扩展受到时间和空 间两个维度限制的人际交往关系,过滤掉现实生活中可能影响人际交往的不利因素,实现用户需要人际交往的基本诉求。人人网对人际关系的积极作用主要体现在维护 原有人际关系和扩展新型人际关系上。 社会学家费孝通先生说过:“现代化在人与人关系上表现最深刻的就是距离缩 短了,接触加多了,范围扩大了,相互往来频繁了。” 社交网站改变了大学生人际 交往的频率并增加了效率, 使得网络人际交往更加方便、 快捷, 为大学生创造了 更为高效的人际交际平台。大学生群体对社交网络的充分利用也直接反映在其拥有 的明显高于社会平均水平的好友数量上,本研究也证实了这一点。 第二节 社交网络陌生个体联系路径 3.2.1 用户最短联系路径研究
2011年12月5日,Facebook和意大利米兰大学Web算法实验室共同宣布了他们关 于六度分离理论的新研究成果:经过对七亿多Facebook用户(相当于全球10%以上 人口)的研究,他们确定任何两个独立用户之间平均所间隔的人数为4.74。 此次合作研究采用了米兰大学Web算法实验室开发的state-of-the-art算法对
Facebook遍布全球的用户好友关系进行分析。研究表明,用六度来描述社交网络中 两个人之间联系的间隔稍微显得有点大,实际在Facebook上,任意两个用户之间只 有五度间隔的概率是99.6%,任意两个用户之间只有四度间隔的概率是92%。2008 年全球用户之间的平均距离为5.28跳,现在只有4.74跳。当把观察范围缩小到美国一 个国家的时候,大部分用户之间的间隔只有三度(4跳),如下图8所示。
在Facebook的研究中,84%的关系对居住
在同一个国家,并且往往两个人在居
住地附近会有共同的好友,年龄相仿。研究显示即使在一个跨国界和跨年龄的社交 网络上,人们也趋向于与不同国籍的同龄人交朋友,如同在同一个国家的人,如下 图9所示。图中横坐标为好友年龄,纵坐标为百分比。 图9:用户年龄和好友年龄分布的关系
2006年7月,微软研究人员Eric Horvitz和Jure Leskovec分析了匿名化处理的全球
范围内MSN用户消息。此次处理的数据集包含2.4亿使用者的300亿次对话,据估计, 这大约覆盖了那段时间全球一半左右的即时通讯消息。会话的具体内容并没有被记 录,仅仅是从统计角度收集必要信息,这也是科学研究中通行的匿名化处理原则。 利用这个数据集,他们构建了一个拥有1.8亿个节点和13亿无向图的当时最大的社交 网络模型并进行分析。
他们的研究表明,MSN用户通过“六度空间理论”彼此相互交流,两个任意用
户在2006年7月间的平均间隔路径长度是6.6。他们的研究还发现,当人们在相互沟 通时,如果有相似的年龄,相同的语言,相近的地理位置,或者异性间的会话都更
加频繁,持续时间也会相对较长。社交网
络中陌生个体间人际关系形态研究 第 26 页
3.2.2 大学生群体间最小好友间隔
本次研究利用之前开发的信息抓取系统得到的数据集,从中抽取出上海交通大 学的人人网用户信息和彼此关系,精确计算出其中任何两个独立大学生用户之间的 最小间隔数以及最短路径联系。数据抽取的原则为:
1. 抽取的对象为上海交通大学的大学生群体,并且抽取的用户要明确知道其全 部好友列表和直接好友数量;
2. 抽取的人人网用户直接好友也要有部分存在这些用户当中,不能全部存在这 一群体之外;
抽取的目的是为了控制研究的目标群体不能无限制的扩大。经过详细计算和筛
选,符合这些条件的上海交通大学人人网用户为12,717个,他们的平均好友数量为 401个。这些一万多人组成的大学生群体成为了这次最小好友间隔研究的对象,最终 研究结果表明:其中任何两个独立用户之间平均所间隔的人数为1.82。
具体分析研究过程中涉及到很多计算机算法方面的内容,本质上可以转化为计 算机图论里求图上任意两点之间的最短路径问题。为此专门编写了多个程序,使用 自己编写的算法进行各种运算,并且使用了高性能的计算能力和大容量存储来支持
进行相关研究。但由于这些基础性工作和研究过程都不是本文的讨论重点,这里不 详加描述,只是把最终社交网络数据分析得到的结果在下面给出。
这12,717个用户通过彼此之间的好友关系互相连接,形成了一张非常复杂的人
际关系网,最终产生了所有可能的161,709,372(约1.6亿)个两两用户对。在人人网 上两个普通个人用户之间,好友关系具有双向性而不是单向性,也就是说如果A成 为了B的好友,那么B也一定会是A的好友,他们之间是强好友联系而不是单向关注 的弱联系。达成好友关系需要双方的共同意愿和许可,而不会单方面达成。但是对 于公共主页用户,则会存在允许单向关注的现象,因此公共主页用户已经被排除在 了此次研究的对象之外。
如果将这些用户任意抽出两个,他们之间可能是直接好友(中间间隔为0个,1 跳到达),也可能拥有一个共同的好友(中间间隔为1个,2跳到达),或者通过几 个人的中间联系再建立起间接联系,这些都是我们早已知道的社交网络的基本规律。社交网络中陌生个体间人际关系形态研究 第 27 页
任意两两用户之间有无数条可能的联系路径。研究表明:在两度的情况下,这一万 多用户之间的所有可能联系路径就已经达到了28,160,908,945(281亿条),下面的 研究仅计算其中最短的一条路径长度。
经过对任意两个用户所有可能最小间隔人数的计算,结果如下表6所示。 最小间隔人数 存在实际数量 所占百分比% 零
1,038,752 0.642357327 一
41,444,632 25.62908475 二
104,618,538 64.69540801 三
14,326,972 8.859704186 四
278,384 0.172150814 五
2,092 0.001293679 六
2 0.00000123679 七 0 0
表6:大学生群体任意两用户之间的最小间隔人数
大学生群体任意两用户平均间隔人数与所占比例如下图10所示,横坐标为平均
间隔人数,纵坐标为对应所占百分比,可见间隔数为2(也就是两度)的占65%,占 据明显优势。研究数据显示,任意两个用户之间六度间隔的概率是100%,已经完全 覆盖了所有用户群。这次研究的内容再一次成功验证了六度空间理论。即使再增加 一度提高到七度,完全没有任何必要。任意两个用户之间只有四度间隔的概率是 99.999%,只有三度间隔的概率是99.827%,只有两度间隔的概率是90.967%,只有