数据如表1。
表1 各年份全国总人口数(单位:千万) 年份 总人口 年份 总人口 年份 总人口 1954 60.2 1963 69.1 1972 87.1 1955 61.5 1964 70.4 1973 89.2 1982 101.654 1991 115.823 2000 126.743 1956 62.8 1965 72.5 1974 90.9 1983 103.008 1992 117.171 2001 127.627 1957 64.6 1966 74.5 1975 92.4 1984 104.357 1993 118.517 2002 128.453 1958 66.0 1967 76.3 1976 93.7 1985 105.851 1994 119.850 2003 129.227 1959 67.2 1968 78.5 1977 95.0 1986 107.5 1995 121.121 2004 129.988 1960 66.2 1969 80.7 1978 96.259 1987 109.3 1996 122.389 2005 130.756 1961 65.9 1970 83.0 1979 97.5 1988 111.026 1997 123.626 1962 67.3 1971 85.2 1980 98.705 1989 112.704 1998 124.761 年份 1981 总人口 100.1 年份 1990 总人口 114.333 年份 1999 总人口 125.786 1、将1954年看成初始时刻即t?0,则1955为t?1,以次类推,以2005年为t?51作为终时刻。用函数(5)对表1中的数据进行非线性拟合,运用Matlab编程(程序见附录1)得到相关的参数xm? 180.9871,r?-0.0336,可以算出可决系数(可决系数是判别曲线拟合效果的一个指标):
R2?1??(yi?15i?15i?i)2?y?0.9959
i?(y?y)2由可决系数来看拟合的效果比较理想。所以得到中国各年份人口变化趋势的拟合曲
线:
180.9871 (6)
180.98711?(?1)e?0.0.0336t60.2根据曲线(6)我们可以对2010年(t?56)、2020年(t?66)、及2033年(t?79) 进行预测得(单位:千万):
x(56)?138.6161,x(66)?148.5400,x(79)?158.6028
结果分析:从附录1所给信息可知从1951年至1958年为我国第一次出生人口高峰,形成了中国人口规模“由缓到快”的增长基础;因此这段时期人口波动较大,可能影响模型结果的准确性。1959、1960、1961年为三年自然灾害时期,这段时期人口的增长受到很大影响,1962年处于这种影响的滞后期,人口的增长也受到很大影响。总的来说1951-1962年的人口增长的随机误差不是服从正态分布,
由于上面的曲线拟合是用最小二乘法,所以很难保证拟合的准确性。因此我们再选择1963年作为初始年份对表1中的数据进行拟合。
2、 将1963年看成初始时刻即t?0,以2005年为t?32作为终时刻。运用Matlab x(t)?5
编程(程序见附录2)得到相关的参数xm? 151.4513,r? 0.0484,可以算出可决系数
R2?0.9994得到中国各年份人口变化趋势的另一拟合曲线:
151.4513 (7)
151.45131?(?1)e?0.0484t69.1根据曲线(7)我们可以对2010年(t?47)、2020年(t?57)、及2033年(t?70) 进行预测得(单位:千万):
x(47)? 134.9190,x(57)?140.8168,x(70)? 145.5908
结果分析:1963年-1979年其间,人口的增长基本上是按照自然的规律增长,特别是在农村是这样,城市受到收入的影响,生育率较低,但都有规律可寻。总的来说,人口增长的外界大的干扰因素基本上没有,可以认为这一阶段随机误差服从正态分布;1980-2005年这一时间段,虽然人口的增长受到国家计划生育政策的控制,但计划生育的政策是基本稳定的,这一阶段随机误差也应服从正态分布(当然均值与方差可能不同)因此用最小二乘法拟合所得到的结果应有较大的可信度。
3、从1980-2005年,国家计划生育政策逐渐得到完善及贯彻落实,这个时期的人口增长受到国家计划生育政策的控制,人口的增长方式与上述的两个阶段都不同。因此我们进一步选择1980年作为初始年份2005年作为终时刻进行拟合。运用Matlab编程(程序见附录3)得到相关的参数xm? 153.5351,r? 0.0477,可以算出可决系数
x(t)?R2?0.9987得到中国各年份人口变化趋势的第三条拟合曲线:
153.5351x(t)? (8)
153.53511?(?1)e?0.0477t98.705根据曲线(7)我们可以对2010年(t?30)、2020年(t?40)、及2033年(t?53) 进行预测得(单位:千万):
x(30)? 135.5357,x(40)? 141.8440,x(53)? 147.0172
结果分析:这一时期,国家虽然对人口大增长进行了干预,但国家的计划生育的政策是基本稳定的,在此其间没有其他大的干扰,所以人口增长的随机误差应服从正态分布。所以我们的结果应是比较可信的。
我们分别根据拟合曲线(6)、(7)、(8)对各年份中国总人口进行预测得到结果如表2:
表2 各年份全国总人口用不同拟合曲线预测数(单位:千万) 全国总人口预测(单位:千万) 年份 2000 2003 2006 2009 2012 2015 2018 2021 2024 预测曲线(6) 预测曲线(7) 预测曲线(8) 126.7649 126.3338 126.473 130.5141 129.2303 129.5168 134.1 131.8447 132.2758 137.516 134.1926 134.7638 140.7577 136.2917 136.9971 143.8231 138.1607 138.9933 146.7117 139.819 140.771 149.4251 141.2856 142.3489 151.9662 142.579 143.7452 6
2027 2030 2033 2036 2039 2042 2045 2048 154.3392 156.5494 158.6028 160.5063 162.267 163.8924 165.3903 166.7683 143.7168 144.7157 145.5908 146.3562 147.0247 147.6077 148.1158 148.558 144.9778 146.0632 147.0172 147.8541 148.5871 149.2284 149.7886 150.2775 由上表可以看出:用拟合曲线(6)预测得到的数据比较大,在2024年总人口就已经超过了151.9662千万,而且一直以比较快的速度增长到2048年达到了166.7683千万。用拟合曲线(7)预测得到的数据偏小,到2048年人口只有148.558千万。相比较而言用拟合曲线(8)预测的数据比较接近附件1中的预测。画出图形如图1:
对各年份全国总人口的预测人口数180170160150140130120110100预测曲线(6)预测曲线(7)预测曲线(8)年份200020062012201820242030203620422048
图1:对各年份全国总人口数的预测
模型Ⅱ:按年龄分布的Leslie模型[2] 一、模型的准备
将人口按年龄大小等间隔地划分成m个年龄组(譬如每10岁一组),模型要讨论在不同时间人口的年龄分布,对时间也加以离散化,其单位与年龄组的间隔相同。时间离散化为t?0,1,2?.设在时间段t第i年龄组的人口总数为ni(t),i?1,2,?m,定义向量
n(t)?[n1(t),n2(t),?nm(t)]T,模型要研究的是女性的人口分布n(t)随t的变化规律,从而
进一步研究总人口数等指标的变化规律。
设第i年龄组的生育率为bi,即bi是单位时间第i年龄组的每个女性平均生育女儿的人数;第i年龄组的死亡率为di,即di是单位时间第i年龄组女性死亡人数与总人数之比,si?1?di称为存活率。设bi、si不随时间t变化,根据bi、si和ni(t)的定义写出ni(t)与ni(t?1)应满足关系:
m??ni(t?1)??bini(t) (9) ?i?1??ni?1(t?1)?sini(t),i?1,2,?,m?17
在(9)式中我们假设bi中已经扣除婴儿死亡率,即扣除了在时段t以后出生而活不到t?1的那些婴儿。若记矩阵
?b1b2?bm?1bm??s0?0?1? L??0s2(10) ??
??????0sm?10??0?则(9)式可写作
n(t?1)?Ln(t)(11)
当L、n(0)已知时,对任意的t?1,2,?有
n(t)?Ltn(0) (12)
若(10)中的元素满足
(ⅰ)si?0,i?1,2,?,m?1;
(ⅱ)bi?0,i?1,2?,m,且至少一个bi?0。
则矩阵L称为Leslie矩阵。
只要我们求出Leslie矩阵L并根据人口分布的初始向量n(0),我们就可以求出t时段的人口分布向量n(t)。
二、模型的建立
我们以2001年为初始年份对以后各年的女性总数及总人口数进行预测,根据附件2中所给数据,以一岁为间距对女性分组。
(i?0,1,2,?,90?): (1) 计算2001年处在各个年龄上的妇女人数的分布向量ni(0),附件2给了2001年中国人口抽样调查数据,提取为表3
表 3 城市男 城市女 镇男 镇女 乡男 乡女 147907 147465 80279 77976 394690 372242 根据抽样调查的结果,可以算出2001年城市、镇、乡人口占2001年全国总人口的比率分别为:
ps?0.242,pz?0.1297,px?0.6283
我们由表1数据知2001年全国总人口Z0?127.627(单位:千万),因此可以算出2001年城市、镇、乡的总人口分别为(单位:千万):
zs?ps?z0?30.885、zz?pz?z0?16.548、zx?px?z0?80.194 根据附件2给的2001年城市、镇、乡各个年龄段的女性比率,可以分别算出2001年城市、镇、乡处在第i(i?0,1,2,?,90?)年龄段的女性的总数分别为n1i(0),n2i(0),n3i(0)。以城市为例,设2001年城市中处在i年龄段妇女占城市总人口比率分别为Pi,则n1i(0)?Pi?Zs(镇、乡类似)。于是可以算出2001年处在第
8