学号 0121114410103
武汉理工大学 数据信息处理课程设计
设计题目 2012年昆明市空气质量状况的统计分析 专业班级 信计1101
姓 名 黎 玮 贤 指导老师 吴 海 英
2014年 1月 15 日
课程设计任务书
学生姓名: 黎玮贤 专业班级: 信计1101 指导教师: 吴海英 工作单位: 武汉理工大学 题 目: 初始条件:
随着科技的发展,天气测评技术的改进,越来越多的天气信息数据出现。这里通
过收集2012年昆明市的每月空气质量状况频数数据,分优,良,轻度,中度,重度和严重污染五个等级作为指标,利用SPSS软件,进行统计分析,以期得到2012年昆明市的天气质量状况了解。
通过《数据分析》课程了学习,已经掌握了基本的数据统计分析方法,如描述性统计分析、方差分析、聚类分析、主成分分析等。
要求完成的主要任务:
1、收集数据:通过查阅中国环保部数据中心,收集、筛选2012年昆明市的空气质量状况频数数据;
2、数据的描述性分析:对筛选出来的有效数据进行描述性统计分析,主要是优,良,轻度,中度,重度和严重污染的样本均值,方差,变异系数,折线图,箱线图、直方图等,获得2012年昆明市的空气质量状况的整体信息;
3、方差分析:通过spss软件进行单因素方差分析,包括分析每种空气质量的天数各月有无差异,;同时分析每种空气质量各月份有无差异,以判断该地区空气质量分月份是否明显;
4、聚类分析:利用系统聚类方法,将整体空气质量状况按月分类,分析空气质量状况那几个月差不多.
5、主成分分析: 将整体空气质量状况按月排名.
时间安排:
2014年1月3号
2014年1月3号至2014年1月10号 2014年1月10号至2014年1月17号 2014年1月18号
查阅资料,确定选题
选择方法,输入数据上机计算 效果分析,总结报告 答辩
指导教师签名: 年 月 日
系主任(或责任教师)签名: 年 月 日
I
摘要
本篇文章主要研究了昆明市2012年1-12月空气质量状况并做出相关统计分析。 首先从中国环保部获得了昆明市2012年1-12月份每月不同空气质量等级的频数,绘制各月不同空气质量等级分布图;其次,利用SPSS软件获取每月空气质量数据的相关统计量,对昆明市2012年的空气质量有一个初步了解,通过每个月份空气质量分布条形图,发现每个月的空气质量等级有明显差异。
经过正态性检验,认为每个月份的数据和不同质量等级下的数据近似服从正太分布,从而进一步通过单因素方差分析,发现质量等级因素对空气质量频数有显著性影响,
为了验证月份之间以及质量等级之间的相似程度,我们采用了谱系聚类法对月份进行了聚类分析,发现1、5、6、7、8、9这几个月空气质量较好,而其他月份空气质量一般,与之前空气质量有明显季度划分的猜想吻合;此外,利用谱系聚类法对质量等级下的数据进行聚类分析,两者比较发现结果近似。
最后,将三组空气质量等级数据类型标准化,成为三个评价指标,选用主成分分析法对指标进行主成分分析,利用每个月份在主成分上的综合得分,最终得到 12个月的综合排名情况,其中空气质量最好的是7月,最差为2月。
关键词: 天气数据、描述性分析、方差分析、聚类分析,主成分分析
II
目录
摘要 ........................................................................................................................................... II 1 数据 ........................................................................................................................................ 1 2 描述性统计分析 .................................................................................................................... 2 3 方差分析 ................................................................................................................................ 9 4 聚类分析 .............................................................................................................................. 11
4.1按月聚类 .................................................................................................................... 11 4.2系统聚类 .................................................................................................................... 12 5 主成分分析综合排名 .......................................................................................................... 14 6分析结论 ............................................................................................................................... 16 7 参考文献 .............................................................................................................................. 17
III
1 数据
通过查阅中国环境保护部数据中心历史空气质量数据,得到了2012年昆明市每月不同空气质量等级的频数,绘制如下统计表,如表1所示。
表1 2012年昆明市每月不同空气质量等级的频数
月份 优 良 轻度污染 中度污染 重度污染 严重污染
一月 16 15 0 0 0 0
二月 1 28 0 0 0 0
三月 3 27 1 0 0 0
四月 4 26 0 0 0 0
五月 9 22 0 0 0 0
六月 16 14 0 0 0 0
七月 29 2 0 0 0 0
八月 8 23 0 0 0 0
九月 12 18 0 0 0 0
十月 8 23 0 0 0 0
十一月 7 23 0 0 0 0
十二月 0 31 0 0 0 0
从表1中,我们可以得到以下信息:
(1) 昆明市2012年空气质量总体较好,等级为“中度污染”、“重度污染”、“严重污染”的天数为零,而等级为“轻度污染”的仅有一天。
(2) 全年空气质量等级以“优”和“良”为主,其中七月有29天空气质量为“优”。 由于等级为“中度污染”、“重度污染”、“严重污染”的天数为零,因此后面在对2012年昆明市空气质量进行数据分析时,不再考虑等级为“中度污染”、“重度污染”、“严重污染”的天数。
1