一般地,当影响结果Y的因素不只是一个时,要通过作图来确定它们的关系是困难的,可以假设它们之间有线性相关关系,
即得到我们的模型:
Y=a1A+a2B+a3C+a4D+ ?t
六、模型的求解
模型的求解过程: 模型为
Y=a1A+a2B+a3C+a4D+ ?t
上式表示因变量Y对自变量A,B,C,D的相依性,其中a1,a2,a3,a4为未知参数, 模型特点如下:
1、 A、B、C、D为一般变量,?t为随机变量;
2、 Y为一般变量和随机变量的线形组合,Y序列的值既取决于A,B,C,D序列,又受制
于?t。 如表五所示各序列
?t一般假定为白噪声序列,假定其服从均值为0,方差为б 2的正态分布
表五
城市 北 京 天 津 石家庄 上 海 南 京 杭 州 福 州 武 汉 长 沙 成 都 昆 明 拉 萨 西 安 Y 13799 6886 3263 12840 4983 7826 5427 3532 2680 3509 2931 2452 3223 A 21105.61 14389.10 9830.57 23172.36 13480.72 16701.04 14211.49 10331.51 9854.09 10132.43 9641.68 13326.40 10775.37 B 83601.71 39781.95 19263.99 71355.13 25994.34 34427.49 19516.98 14271.78 12191.34 14141.95 10213.56 7805.05 17878.61 C 2219.07 2642.37 1851.67 2923.56 2147.98 2049.83 1509.06 1881.15 1667.34 1403.38 1564.40 999.54 1865.76 D 551.99 450.48 187.24 991.08 512.11 652.20 469.24 289.00 315.10 314.46 432.74 105.27 243.32
将其中心化后得
Y-pjY=a1*(A-pjA)+ a2*(B-pjB)+ a3*(C-pjC)+ a4*(D-pjD)+ ?t
- 10 -
上式即为
ΔY =a1*ΔA +a2*ΔB +a3*ΔC +a4*ΔD+ ?t
现在对模型的参数进行最小二乘法估计[3]
其中ΔY、ΔA、ΔB、ΔC、ΔD各序列(矩阵)的值见表六
表六
北 京 天 津 石家庄 上 海 南 京 杭 州 福 州 武 汉 长 沙 成 都 昆 明 拉 萨 西 安 △Y △A △B 55106.03 11286.27 -9231.7 42859.44 -2501.34 5931.806 -8978.7 -14223.9 -16304.3 -14353.7 -18282.1 -20690.6 -10617.1 △C 317.1379 740.4361 -50.2633 1021.631 246.0455 147.8984 -392.874 -20.7817 -234.587 -498.555 -337.528 -902.393 -36.1672 △D 127.8185 26.30846 -236.932 566.9085 87.93846 228.0285 45.06846 -135.172 -109.072 -109.712 8.568462 -318.902 -180.852 8156.6154 7493.889 1243.6154 777.3792 -2379.385 -3781.15 7197.6154 9560.639 -659.3846 -131.001 2183.6154 3089.319 -215.3846 599.7692 -2110.385 -3280.21 -2962.385 -3757.63 -2133.385 -3479.29 -2711.385 -3970.04 -3190.385 -285.321 -2419.385 -2836.35 T令a= (a1,a2,a3,a4),则a 的最小二乘估计,应使残差?t平方和S(a)达到最小,其中称实际值与回归值的差为残差。
S(a)=
?t?1n?2t =
?t?1n(ΔY t-a1*ΔA t-a2*ΔB t-a3*ΔC t -a4*ΔDt)
2由于S(a)是a1,a2,a3,a4的一个非负二次型,故其极小值必存在,根据微积分的理论可知,只要求S(a)分别对a1,a2,a3,a4的一阶偏导数得到:
?S(a)=0,先对a1求一阶偏导即可?a?S(a)n=?2*(ΔYt-a1*ΔAt-a2*ΔBt-a3*ΔCt-a4*ΔDt)*(-ΔAt)=0 ?a1t?1化简上式可得:
?t?1n-ΔYt*ΔAt+a1*ΔAt*ΔAt+a2*ΔBt*ΔAt+a3*ΔCt*ΔAt+a4*ΔDt*ΔAt=0
用μya表示序列ΔY和ΔA的协方差,μaa表示ΔA序列的协方差,μba表示序列ΔB和ΔA的协方差,μca表示序列ΔC和ΔA的协方差,μda表示序列ΔD和ΔA的协方差,
- 11 -
则上式可写成:
-μya+a1*μaa+a2*μba+a3*μca+a4*μda=0----------------------------------式1
同理
?S(a)=0推出: ?a2-μyb+a1*μab+a2*μbb+a3*μcb+a4*μdb=0----------------------------------式2
同理
?S(a)=0推出: ?a3-μyc+a1*μac+a2*μbc+a3*μcc+a4*μdc=0----------------------------------式3
同理
?S(a)=0推出: ?a4-μyd+a1*μad+a2*μbd+a3*μcd+a4*μdd=0----------------------------------式4
式1、式2,式3,式4写成矩阵相乘的形式为:
? ?ya??a1?? ?aa ?ba ?ca ?da?? ?yb ???? ?ab ?bb ?cb ?db ?a? ?? * ?2? = ??a3?? ?yc?? ?ac ?bc ?cc ?dc??????? ?yd ?ad ?bd ?cd ?dd a???????4?则求解参数的公式为:
? ?ya??a1?? ?aa ?ba ?ca ?da?? ?yb ???? ?ab ?bb ?cb ?db ?a?---------------------式5 ?2? = ?? * ??a3?? ?yc?? ?ac ?bc ?cc ?dc??????? ?ad ?bd ?cd ?dd ?yda???????4??1
具体到本问题中,我们运用往年的统计数据对模型中各个参数的求解。
经计算得各个协方差的值为:(利用MATLAB软件,协方差计算程序参见附录3) μaa=2.3326?10 μba=μab=1.1461?10 μca=μac=1.7483?10 μda=μad=9.8190?10
6798 - 12 -
μbb=6.7575?10 μcb=μbc=1.1038?10 μdb=μbd=4.8191?10 μcc=3.1654?10 μdc=μcd=1.0633?10 μdd=6.3300?10
μya=1.9062?10 μyb=1.0607?10 μyc=1.6910?10 μyd=8.4238?10
通过矩阵运算得到a1,a2,a3,a4的值为:(利用MATLAB软件,计算程序参见附录4)
6798566789a1=0.1197 a2=0.1281
a3=-0.8191 a4=3.0715
把系数a1,a2,a3,a4代回原模型得:
Y-5642.4=0.01197*(A-13611.7)+0.1281*(B-28495.7)-0.8191*(C-1901.9)+ 3.0715*(D-424.2)+?t
利用表三中的商品房平均销售价、工薪收入、城乡人均储蓄余额、造价、人均全年住房支出反推?t的值,即:
?t=Y-5642.4-[0.01197*(A-13611.7)+0.1281*(B-28495.7)-0.8191*(C-1901.9)+
3.0715*(D-424.2)]
- 13 -
得到的13个?t值为(利用MATLAB软件,计算程序参见附录5):
表七 残差数据 城市序号 1 2 3 4 5 6 7 8 9 10 11 12 13 平均值 残差 56.7861 230.5766 -57.5374 -341.4342 -391.7489 474.8112 402.8636 502.5934 -281.0530 50.5127 -196.9233 -265.3069 -193.8714 -0.74858
残差曲线见图5(利用MATLAB软件,图像画法程序参见附录5):
残差曲线600400200残差012345678910111213-200-400-600城市序号
图5
- 14 -