1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
2086.21 2303.15 2752.18 3476.70 4632.38 6367.08 7438.68 8157.81 8561.71 8839.68 9125.92 9761.57 10415.19 11137.20 12380.40 13627.65 14769.94 16015.58 17699.30 19732.86
955.02 1043.03 1143.06 1307.65 1674.78 2181.52 2699.24 3183.46 3467.69 3527.14 3628.93 3654.48 3769.79 3911.91 4054.58 4365.87 4690.49 5079.78 5624.04 6399.77
1131.19 1260.12 1609.12 2169.05 2957.60 4185.56 4739.44 4974.35 5094.02 5312.54 5496.99 6107.09 6645.40 7225.29 8325.82 9261.78 10079.45 10935.80 12075.26 13333.09
2.18 2.21 2.41 2.66 2.77 2.92 2.76 2.56 2.47 2.51 2.51 2.67 2.76 2.85 3.05 3.12 3.15 3.15 3.15 3.08
注:数据来源于《广东省统计年鉴2009》;“城乡收入差距指数”以农村为1计算。
从表1可以看出,从1979年城乡收入差距最低点的193.61元到2008年的
13333.09元,相差13139.48元,城乡收入的差距扩大了近68倍。这个数字比过去其他省份的城乡差距都大。1978~1985年城乡收入的平均差距为283.16元;1986~1990年城乡收入的平均差距为876.01元,较前一阶段差距增长了309.36%;1991~1995年城乡收入的平均差距为3 132.154元,较前一阶段增长了357.54%;而到了1996~2008年,城乡收入的平均差距则达到了7 223.503元,较前一阶段增长了230.62%。由此
可见,城乡居民增长的幅度虽然有缩小的迹象,但是绝对差距在不断扩大。
2
贵州民族学院——统计学专业——毕业论文:广东农民收入影响因数的分析
图一收入差距绝对数量变化图
如图一所示,随着年份的增加,城乡居民收入差距也在大幅度增加,尤其从2000以来,几乎沿直线上升,城乡居民收入差距问题让人担忧。 1.2城乡居民收入差距的相对比例不断增加
从表1可以看出,城乡居民收入相对比例最低的是1982年,为1.65∶1,城乡收入相差249.66元;城乡居民收入相对比例最高的是2005年,达到了3.15:1,而且这个比例维持到2007年,2007年城乡收入相差12 075.26元。1978~1988年城乡居民的收入一直维持在2∶1以内,其相对比例平均在1.88左右。自1989年开始,城乡居民的相对比例则一直保持在2∶1以上,最高达到3.15∶1。世界银行1998年研究报告指出,36个国家的数据表明,城乡之间收入比率超过2的极为罕见,绝大多数国家农村收入为城市收入的2/3或更多一些。
城乡居民收入差距的相对比例3.532.5相对比例21.510.5019751980198519901995200020052010系列1年份
图二城乡居民收入差距相对比例图
3
正如图二所示,1975年以来,虽然其中城乡收入差距比例在某特定年份有所下降,但总体趋势在上升,从2003年以来比例值已经超过3,由此可见,广东省城乡居民收入差距的问题依然严峻。
4
贵州民族学院——统计学专业——毕业论文:广东农民收入影响因数的分析
第二章 回归分析方法理论知识介绍
2.1 回归分析的含义
回归分析是研究一个变量对另一个变量或者多个变量的依赖关系,其目的在于通过自变量的给定值,来预测因变量的平均值或某个特定值,具体而言,回归分析需要解决四个问题:
(1).构建因变量与自变量之间的回归模型,并依据样本观测值对回归模型中的参数进行估计,给出回归方程。
(2).对回归方程中的参数和方程本身进行显著性检验。 (3).评价自变量对因变量的贡献。
(4).利用所求得的方回归方程对因变量进行预测,对自变量进行控制。 2.2线性回归模型及其假设条件
在回归分析中,因变量Y和自变量X之间的关系通常用以下带有条件期望的方程表示: Y?E(Y/X)??
其中,E(Y/X)为变量Y关于变量X的条件均值。?为随机误差,则上式方程为Y关于X的总体回归模型。
在回归分析中,由于E(Y/X)是变量X的函数,所以记: E(Y/X)=f(X)
其中f(X)为X的某个函数,若函数f(X)只含一个变量,称为一元回归;若含有两个或两个以上的自变量则称为多元回归,若f(X)是X的线性函数,即:
F(X)=?0??1X1??2X2????pXp
其中, ?0,?1??p为未知参数,称为回归系数。当模型中有p个自变量
X1,X2,?,Xp时称为p元线性回归模型,或者多元线性回归模型,其一般形式可表示
为:
Y??0??1X1??2X2????pXp+? 在经典的线性回归分析中,一般有以下假定: (1).随机误差项均值为0,即E(?)?0。
(2).对每个i,随机误差项?i的方差均为?2,且各误差项之间相互独立,即:
5
Cov(?i,?j)?0,i?j(i,j?1,2,?,n),用矩阵表示为:E(???)??2I ,其中,I为n阶
单位阵。
(3).自变量是非随机的确定性变量。
(4).自变量和误差项互不相关,即Cov(X,?)?0。
(5).自变量之间不存在多重共线性,即矩阵X的秩R(X)=p+1 (6).为进行假设检验,通常还进一步假定误差项服从均值为0,协方差为?2I的多元正态分布,即?~N(0,?2I)。 2.3线性回归模型的参数估计 对于假定的回归模型: Y=XB+? ???其中,Y?????y1??1??y2??1,X????????1yn???x11x21?xn1????x1p???1???0??????x2p???2???1?B?,??,???,其参数的最小二???????????????xnp???P???N?乘估计量(OLS)为: ?,则: ??(X?X)?1X?Y,记???Y?XB B?2??????n?p?1。 2.4回归模型的诊断 在线性回归分析中,当对n组独立观测运用最小二乘法估计出总体回归方程中的 参数后,总体回归方程的估计也即样本回归方程就可以用参数的估计值表示出来,即: ????x???x?????x ???y01122pp 在估计出了回归方程后,一个很自然的问题是,这个方程拟合好吗?对于线性回归模型,因变量与自变量之间的关系是线性的吗?方程中的每个自变量都对因变量有显著性影响吗?换句话说回归方程中的参数都与0有显著性差异吗?等等,这些问题正是回归诊断需要解决的。在回归分析中一般可以通过以下一些指标或者假设检验得到部分解决。 6