多元统计分析课程设计

2020-05-23 14:54

`

多元统计分析 课程设计

题 目: 对应分析的方法及应用 学 院: 理学院 班 级: 数学08-1班 学 生 姓 名: 夏 红 学 生 学 号: 080524010119 指 导 教 师: 张永利

2012年 1 月 1 日

课程设计任务书

姓名 设计题目 夏红 班级 数学08-1班 学号 080524010119 聚类分析进行样品的判别 22222利用距离统一形式的递推公D2kr??pDkp??qDkq??Dpq?rDkp?Dkq,系统聚类法可有重心法、中间距离法、离差平方和法,通过对距离的理论要点 不同定义,将各指标量之间的样品以不同的距离分开,我们把距离样本距离小者聚合成一个小类,即距离最短的聚为一类,样本距离大者聚合成一个大类,如此重复,直至最后一个也聚入类中,再根据想要划分的类数,即可达到分类的要求。 通过对聚类分析的理论要点的学习,将实际问题转化为应用多元统计设计目标 分析的具体问题,运用聚类分析的知识,熟练运用聚类分析软件命令能运用聚类分析的方法解决实际问题应用spss软件命令,实现对问题的分类和解读,达到分类的真实效果。 1.更深入的学习聚类分析的相关知识,掌握各种距离计算的方法。 研究方法步骤 2.安装spss软件,借阅相关书籍,掌握该软件的使用命令。 3.对要解决的问题进行,根据样品变量估计分类的数量,及相应的分类结果。 4.运用spss软件,将实际问题予以解决,进行分类。 预期结果 运用spss轻松实现实际问题的分类过程,且得到相应的图表,这样得到的结果更容易理解,更容易北大多数人所接受。 课程安排一周,分四次完成: 计划与进:写论文的前言、摘要、以及理论依据部分 步的安排 第二次(3-4天)第三次(4-6天):写论文的问题描述、问题分析以及求解计算部分 第四次(7天):写论文的结论部分以及最后的审核和排版、打印等

第一次(1-2天):上网搜查有关的资料,并开始考虑设计的方法

摘要

针对聚类分析的多种方法,主要有系统分析聚类法、有序样本聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。而对于系统聚类可将具有某些指标变量的统计量按一定规律分成几类,这些类之间的样品是相互独立的,分类是彼此的顺序是平等的,且系统聚类法有最短距离法、最长距离法、重心法、类平均法、中间距离法、可变类平均法、可变法、李差平方和法等。 本文运用系统聚类的方法,将全国各省的粮食产量进行分类,且在分类中充分的考虑了各指标间的关系,使分类达到了很好的效果。通过对spss得出的结果进行分析,即可得到分类的情况和标准。通过给定的分类情况,可将各省粮食产量情况的各项指标综合得到四至七类,在这些分类中,可以充分的体现各指标之间的关系,鲜明形象的体现了聚类分析的优势。

关键词 系统聚类,聚类分析,距离,相似系数

目录

1.基本理论................................................................................................................ - 1 -

1.1聚类分析简述 .......................................................................................... - 1 - 1.2聚类分析基本思想 .................................................................................. - 1 - 1.3系统聚类分析基本方法 .......................................................................... - 4 -

1.3.1系统聚类 ·························································································· - 4 - 1.3.2二阶段聚类 ······················································································ - 4 - 1.3.3K中心聚类 ······················································································ - 4 - 1.3.4层次聚类 ·························································································· - 5 -

2问题描述................................................................................................................ - 5 - 3.问题分析................................................................................................................ - 6 - 4.计算求解................................................................................................................ - 6 -

4.1 操作步骤 ................................................................................................ - 6 - 4.2结果解读 ............................................................................................... - 10 - 5.结论...................................................................................................................... - 16 - 6.参考文献.............................................................................................................. - 17 -

多元统计分析课程设计

聚类分析进行样品的判别

1.基本理论

1.1聚类分析简述

聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法,所谓类,通俗地说,就是指相似元素的集合。严格的数学定义是较麻烦的,在不同问题中类的定义是不同的。

聚类分析起源于分类学,在考古的分类学中,人们主要依靠经验和专业知识来实现分类。随着生产技术和科学的发展,人类的认识不断加深,分类越来越细,要求也越来越高,有时光凭经验和专业知识是不能进行确定分类的往往需要定性和定量分析结合起来去分类,于是数学工具逐渐被引入分类学中,形成了数值分析学。后来随着多元分析的引入,聚类分析又逐渐从数值分类学中分离出来而形成一个相对独立的分支。

在社会经济领域中存在着大量分类问题,比如对我国30个省市自治区独立核算工业企业经济效益进行分析,一般不是逐个省市自治区去分析,而较好的做法是选取能反映企业经济效益的代表性指标,如百元固定资产实现利税、资金利税率、产值利税率、百元销售收入实现利润、全员劳动生产率等等,根据这些指标对30个省市自治区进行分类,然后根据分类结果对企业经济效益惊醒综合评价,就易于得出科学的分析。又比如若对某些大城市的物价指数进行考察,而物价指数很多,有农业生产物价指数、服务项目物价指数、食品消费物价指数,建材零售价格指数等等。由于要考虑的物价指数很多,通常先对这些物价指数进行分类。总之,需要分类的问题很多,所以聚类分析这个有用的数学工具越来越受到人们的重视,它在很多领域中都得到了广泛的应用。

聚类分析内容非常丰富,有系统分析聚类法、有序样本聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等 1.2聚类分析基本思想

为了将样品(或指标)进行分类,就需要研究样品之间关系。目前用的最多的方法有两个:一种方法是用相似系数,性质越接近的样品,它们的相似系数的绝对值越接近于1,而彼此无关的样品,它们的相似系数的绝对值越接近于零。比较相似的样品归为一类,不怎么相似的样品归为不同的类。另一种方法是将一个样品看做P维空间的一个点,并在空间定义距离,距离越近的点归为一类,距

- 1 -


多元统计分析课程设计.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:年产35万吨聚丙烯聚合工段工艺设计

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: