社会环境下网页重要性的研究
(
?Ki11,Ki12,Ki13,......Ki1n???Ki21,Ki22,Ki23,......Ki2n???Ki31,Ki32,Ki33,......Ki3n? ??........,........,.........,.....,.....,???Kij1,Kij2,Kij3,......Kijn???.*
(
1?1111,,,,....,?NNNNN??1,1,1,1,....,1?NNNNN?11111 ?,,,,....?NNNNN?................................?1?1111,,,....,?NNNNN????????????????n??Zi11,Zi12,Zi13.....,Zi1??Zi21,Zi22,Zi23.....,Zi2n??.*?Zi31,Zi32,Zi33.....,Zi3n???.......,.........,.......,......,......???Zij1,Zij2,Zij3.....,Zijn???))*
?1???1???1? (3.6)???...??1???
上式前三个矩阵相乘的结果是一个j行N列的向量,每一行的N个元素分别表示每个访问者对网页j的权重贡献,为了计算Pij网页的总的PR值必须将同一行N个贡献相加,为了实现相加的结果,可以在上面三个矩阵的后面乘多一个N行1列每个元素为1的列向量矩阵
?1???1???1????...??1???
计算的结果将是一个N行一列的列向量矩阵,设这个列向量矩阵为Sj,Sj就表示所有的
访问者对网页Pij贡献的权重值。 则式(3.1)表示为
PRin=
?j(Kijn ×S)
上面的运算思想参考了Google PageRank的排序算法
R(i+1)(v)=C
v?B?v??R(i)(u)/Nu (2.2)
R(i)(u)表示第i次叠加运算时的网页PR值,相当于Sj(上一次运算网页Pij的权重值) 乘以
1Nu。Nu表示网页的链接数,Nu少说明此网页链接出的单条链接贡献给链接到网页
的PR值越大,这与乘以Kijn (被认同度越高,则访问者的PR值越高)的思想是完全一致的。同样经过叠加运算,最后的结果必然收敛于一个特定的值。具体详细的迭代下面再详解
31
社会环境下网页重要性的研究
下面先用矩阵表示PRin=
?j(Kijn ×S)
PRin=ST *Kijn (矩阵ST为矩阵S的转置矩阵)
ST是一个行矩阵,各元素表示每个网页的权重,矩阵Kijn的每一列表示同一个访问者对于每个网页的被认同度,ST与Kijn的每一列元素对应相乘再相加的结果就是Kijn中相应列的访问者的PRin。
上式得到的结果是一个一行N列的行向量,各元素分别表示每个访问者自身的PRin上面是矩阵运算,是一种计算方法的总的表达方式,要验证上面的矩阵算法是否正确需要举例验证,就像上面VB编程一样,下面我仍然用图3.1的数据例子用矩阵运算,如果运算结果和VB算法一样说明计算结果没有错误,同时证明两种方法都是可行的。Matlab能处理数、向量和矩阵.但一个数事实上是一个1×1的矩阵,1个n维向量也不过是一个1×n或n×1的矩阵.从这个角度上来讲,Matlab处理的所有的数据都是矩阵.Matlab的矩阵处理能力是非常灵活、强大的.以下我们将用matlab来进行矩阵运算。 下面首先编写matlab程序: PRi1=0.25; PRi2=0.25; PRi3=0.25; PRi4=0.25; L=[1;1;1;1]; i=1 while i<=20
PRin=[PRi1,PRi2,PRi3,PRi4;PRi1,PRi2,PRi3,PRi4;PRi1,PRi2,PRi3,PRi4;PRi1,PRi2,PRi3,PRi4];
Zijn=[3,0,1,2;1,4,0,3;0,2,2,0;2,0,0,1];
Kijn=[0.7,0.5,0.2,0.1;0.4,0.5,0.5,0.1;0.5,0.5,0.5,0.5;0.8,0.5,0.5,0.2]; zPRin=((Kijn.*(PRin.*Zijn))*L)'*Kijn ; PRi=(1/(zPRin*[1;1;1;1]))*zPRin t=1; y= PRi (1,1); m=2; x= PRi (1,2); n=3; v= PRi (1,3); l=4; p= PRi (1,4);
32
社会环境下网页重要性的研究
hold on
plot(t+0.05*i,y,'-r',m+0.05*i,x,'-r',n+0.05*i,v,'-r',l+0.05*i,p,'-r') PRi1= PRi (1,1); PRi2= PRi (1,2); PRi3= PRi (1,3); PRi4= PRi (1,4); i=i+1 end
运算结果显示如下 i = 1 PRi =
0.342207792207792 i = 2 PRi =
0.348649402475917 i = 3 PRi =
0.349386378902118 i = 4 PRi =
0.349467206106789 i = 5 PRi =
0.349476125018587 i = 6 PRi =
0.349477108296626
0.292207792207792 0.292668797871656 0.292734440342258 0.29274125949571 0.292742016418722 0.292742099801721 0.243506493506493 0.122077922077922 0.240348430560621 0.118333369091806 0.240023620867169 0.117855559888455 0.23998737951074 0.117804154886761 0.239983388537883 0.117798470024808 0.239982948433407 0.117797843468246
33
社会环境下网页重要性的研究
i = 7 PRi =
0.349477216709329 0.292742108996117 0.23998289991064 0.117797774383914 i = 8 PRi =
0.349477228662355 i = 9 PRi =
0.349477229980236 i = 10 PRi =
0.349477230125539 i = 11 PRi =
0.34947723014156 i = 12 PRi =
0.349477230143326 i = 13 PRi =
0.349477230143521 i = 14 PRi =
0.349477230143542 i = 15 PRi =
0.349477230143544
0.292742110009832 0.239982894560747 0.292742110121599 0.239982893970895 0.292742110133922 0.239982893905861 0.292742110135281 0.239982893898691 0.29274211013543 0.2399828938979 0.292742110135447 0.239982893897813 0.292742110135449 0.239982893897803 0.292742110135449 0.239982893897802 34
0.117797766767066 0.117797765927269 0.117797765834678 0.117797765824469 0.117797765823344 0.117797765823219 0.117797765823206 0.117797765823204
社会环境下网页重要性的研究
i = 16 PRi =
0.349477230143545 0.292742110135449 0.239982893897802 0.117797765823204 i = 17 PRi =
0.349477230143545 i = 18 PRi =
0.349477230143545 i = 19 PRi =
0.349477230143545 i = 20 PRi =
0.349477230143545 i = 21 >>
>>显示图形如图:
0.292742110135449 0.292742110135449 0.292742110135449 0.292742110135449 0.239982893897802 0.117797765823204 0.239982893897802 0.117797765823204 0.239982893897802 0.117797765823204 0.239982893897802 0.117797765823204 35