(3) 生育率与生育模式
f(t)表示婴儿出生率,下面对f(t)作进一步分解。
记女性性别比函数为k(r,t),即时刻t年龄在[r,r?dr)的女性人数为
k(r,t)p(r,t)dr,将这些女性在单位时间内平均每人的生育数记作b(r,t),设育龄
区间为[r1,r2],则
f(t)??r2r1h(r,t)k(r,t)p(r,t)dr
再将b(r,t)定义为:b(r,t)??(t)h(r,t) 其中,h(r,t)满足 ?h(r,t)dr?1
r1r2于是 ?(t)?r2?r2r1b(r,t)dr
f(t)??(t)?h(r,t)k(r,t)p(r,t)drr1从两式及b(r,t)的含义可以看出,h(r,t)是年龄为r女性的生育加权因子,称生育模式。在稳定环境下可以近似地认为它与t无关,即h(r,t)?h(r)。h(r)表示了在哪些年龄生育率高,哪些年龄生育率低。图给出了h(r)的示意图,表明r?rC附近生育率最高。
以下进行总和生育率、生育模式和性别比函数的参数估计: Ⅰ总和生育率?(t)
?(t)的直接含义是时刻t单位时间内平均每个育龄女性的生育数。如果所有
育龄女性在她育龄期所及的时刻都保持这个生育数,那么?(t)也表示平均每个女性一生的总和生育数,所以?(t)称为总和生育率(简称生育率)或生育胎次。 根据国家人口发展战略研究报告和我们国家的计划生育政策,取?(t)?1.8
Ⅱ 生育模式h(r,t)
h(r,t)是年龄为r的女性的生育加权因子,称生育模式。在稳定环境下可以
9
近似地认为它与t无关,即h(r,t)?h(r)。h(r)表示了在哪些年龄生育率高,哪些年龄生育率低。由人口统计资料可以知道当前实际的h(r,t)。在这里我们用概率论中的?分布对h(r)进行拟合:
(r?r1)???1 h(r)?e?r?r1???(?)
设l(r,t)表示在时刻t年龄为r妇女的生育率,根据2001年—2005年年龄从0到90+妇女的生育率,利用MATLAB绘出5条原始数据曲线,见图10。
0.10.080.060.040.0201520253035404550 图10 2001年—2005年年龄为0—90+的原始数据曲线
由图10知,2003年的生育率曲线与其他4年的曲线有着明显的差异,因此我们首先剔除掉2003年的年龄为0—90+的生育率数据,其他4年的4条生育率原始数据曲线基本相同,故可知在短时期内生育率l(r,t)与t无关,即l(r,t)?l(r),我们取这4条曲线的算术平均值作为在这段时期年龄为0—90+的生育率。 记h'(r)?l(r)maxl(r)0?r?90?r2 经过计算得 ?h'(r)dr??。
r1r2r2由于考虑到?h(r,t)dr?r1?r1h(r)dr?1,所以我们最终可确定h(r)?l(r)?maxl(r)0?r?90?。
如此便可以得到离散的h(r)值,通常我们取定??2,由题目附件所给数据可以
10
知道r1?15,然后通过对公式h(r)?得??4.5,则有 h(r)?(r?151)24.53.5(r?r1)???1e?r?r1???(?)进行最小二乘拟合,可以求
e?r?1512?(4.5)
生育模式h(r)曲线情况见图11。
0.10.080.060.040.0201520253035404550 图11 生育模式h(r)最小二乘拟合后的?分布函数曲线
Ⅲ 性别比函数k(r,t)
性别比函数k(r,t)在短时期内与r和t均有关,我们研究两个自变量r和t对因变量k的影响:
为了大致地分析k与r、 t的关系,我们首先作出k对r和 t的散点图(见图12和图13)
从图12可以发现,k和r的关系如下:
k?a4r?a3r?a2r?a1r?a0
432从图13可以发现,k和t有比较明显的线性关系: k?b1t?b0
11
0.7 0.65 0.6 0.55 0.5 0.45 0.40 0.750.750.70.650.60.550.51020304050607080900.4520012001.520022002.520032003.520042004.52005图12 k(r,t)对r的散点图 图13 k(r,t)对t的散点图
综合上面的分析,建立如下的回归模型:
k(r,t)?a4r4?a3r3?a2r2?a1r?a0?bt
利用regress命令进行统计回归分析,得到回归系数的估计值以及检验统计量
2见表3,同时绘出t?2001?2005的5条函数曲线图(见图14)。 R、F、p的结果,
表3 回归系数和检验统计量
a4 a32.66854E-08 -3.0965E-06 7.52E-05 0.001471273 0.448574793 0.000717278 a2 回归系数 a1 a0 b 2R 检验统计量
Fp 0.9298 1189.8157 0.0000 12
0.750.70.650.60.550.50.450.40102030405060708090 图14 t?2001?2005的5条多项式函数曲线图
由图14可知原始数据曲线与多项式回归函数曲线基本相同,且由表3可知,F值远远超过F检验的临界值,p?0.0000远小于置信水平?(??0.05),
R2?0.9298说明因变量k(r,t)的92.98%可由统计回归模型确定。由于a4和a3很
小,我们可以忽略r的三次项和四次项,这样性别比例可写为
k(r,t)?0.0000752r?0.001741273r?0.448574932?0.000717278t
4.2.2 人口指数
人口分布函数F(r,t)和人口密度函数p(r,t)是人口发展过程最完整的描述,然而在人口统计学中还常用一些所谓的人口指数来简明扼要地表示一个国家或地区的人口特征。下面是一些人口指数的定义及它们与p(r,t)等数量之间的关系。
(1) 人口总数N(t):
N(t)?(2) 平均年龄R(t): R(t)??rm0p(r,t)dr
?N(t)1rm0rp(r,t)dr
(3) 平均寿命S(t):它表示时刻t出生的人不论活到什么时候,死亡率都按时刻t 13