统计软件及应用期末作业
完成作业:3、5、11、12题
第3题:基本统计分析3
利用居民储蓄调查数据,从中随机选取85%的样本,进行分析,实现以下目标:
1、分析不同职业储户的储蓄目的(一),只输出图形并进行分析即可,不需要输出频数表格; 2、分析城镇和农村储户对“未来收入状况的变化趋势”是否持相同的态度;4.3.5 3.分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。
基本思路:
首先通过随机抽样中的近似抽样方式,对居民储蓄调查数据进行抽样。
操作步骤:选择菜单数据→选择个案→随机个案样本,样本尺寸填大约所有个案85%。
1、题目:分析不同职业储户的储蓄目的(一),只输出图形并进行分析即可,不需要输出频数表格。
基本思路:首先进行多选项分析,定义名为X的多选项变量集,其中包括a7_1、a7_2、a7_3三个变量,然后对多选项变量集进行频数分析;对不同职业储户储蓄目的进行分析,采用多选项交叉分组下的频数分析。 操作步骤:
分析:从折线图看出,储户中商业服务业的人数最多,总体上所有职业储户的正常生活零用所占的百分比最大,买证券及单位集资的人较少,说明大部分人群还没有这方面的意识。
2、分析城镇和农村储户对“未来收入状况的变化趋势”是否持相同的态度。
基本思路:该问题列联表的行变量为户口,列变量为未来收入状况,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对该问题的态度是否一致进行分析。
操作步骤:分析→描述统计→交叉表,显示复式条形图前打勾,行选择户口,列选择未来收入情况,统计量选择卡方,点击单元格,在观察值、期望值、行、列、总计、四舍五入单元格计数前打勾,最后确认。
输出以下表格和图形: 户口* 未来收入情况 交叉制表 增加 计数 期望的计数 城镇户口 户口 中的 % 未来收入情况 中的 % 总数的 % 户口 计数 期望的计数 农村户口 户口 中的 % 未来收入情况 中的 % 总数的 % 计数 期望的计数 合计 户口 中的 % 未来收入情况 中的 % 总数的 % 14 14.4 21.5% 26.9% 6.0% 52 52.0 22.2% 100.0% 22.2% 32 39.7 49.2% 22.4% 13.7% 143 143.0 61.1% 100.0% 61.1% 19 10.8 29.2% 48.7% 8.1% 39 39.0 16.7% 100.0% 16.7% 65 65.0 100.0% 27.8% 27.8% 234 234.0 100.0% 100.0% 100.0% 38 37.6 22.5% 73.1% 16.2% 未来收入情况 基本不变 111 103.3 65.7% 77.6% 47.4% 减少 20 28.2 11.8% 51.3% 8.5% 169 169.0 100.0% 72.2% 72.2% 合计
卡方检验 值 df 渐进 Sig. (双侧) Pearson 卡方 似然比 线性和线性组合 有效案例中的 N 10.622a 9.844 4.077 234 2 2 1 .005 .007 .043 a. 0 单元格(0.0%) 的期望计数少于 5。最小期望计数为 10.83。
分析:因为卡方值小于0.05拒绝原假设,认为行列变量之间相关,户口对未来收入看法有影响,说明城镇和农村储户对“未来收入状况的变化趋势”持不同的态度。
3、分析储户一次存款金额的分布,并对不同年龄段的储户进行比较。 基本思路:由于存款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。
操作步骤:转换→重新编码为不同变量→选择存(取)款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。最后点击确定。再分析→描述统计→频率→变量:存款金额分组,图表选择直方图,选择显示正态曲线。