西南交通大学2017数学建模国赛预选赛优秀论文(2)

2019-06-10 23:40

用即:

a

ij

表示第i个消费者第j个指标的取值,首先将各指标

a

ij

转化为标准化指标值,

bij ?

amij?j

jMm ? j(i=1,2,···,8806;j=1,2,3,4.)

式中:

a

ij

为原始数据,

b

ij

为处理后数据。j,j分别为第j个指标的最小值和最大值。

mM

(4)将消费者样本数据进行聚类分类

Step1:计算8809个消费者样本点两两之间的距离,构造距离矩阵?这里距离采用欧几里得距离:

j?4

2d

ik

?

8806 8806?

d

ik ??b b? ij ?k j?, (i,k=1,2,···,

8806.) j?1

使用最短距离法来测量类与类之间的距离,即类

G

p和

G

q

之间的距离:

DGG?

p q

, ??

iG kG?

minp, ?q ?dik?..

Step2:构造8806个类,每一个类中只包含一个样本点,每一类的平台高度均为零: Step3:合并距离最近的两类为新类,并且以这两类间的距离值作为聚类图中的平台高

度。

Step4:若类的个数等于1,转入步骤3,否则计算新类与当前各类的距离,回到步骤2。

Step5:利用Matlab绘制聚类图,根据需要决定聚类的个数和类。

5.1.3 问题一模型的求解聚类分析:

6

根据聚类分析的原理,利用 Matlab 软件根据消费者的五个指标变量对消费者样本进行聚类,聚类树型图如下

201816141210864

5 6 2 3 12 19 7 28 23 17 13 4 29 8 9 26 22 10 11 14 15 24 16 20 21 25 18 27 30 1

图 1- 2 消费者聚类树形图

分析上面的消费者聚类树型图可知,我们将消费者样本分为8类,结果如下表所示:

表 1- 1 消费者分类表

分类 第一类 M00058、M00060、M00116、M00135、M00142 第二类 M00081、M00086、M00114、M00118?? 第三类 消费者编号 M00167、M00018、M00332、M01332 第四类 M00025、M00035、M00044、M00051??

7

第五类 M00953、M01148、M01281、M01379?? 第六类 M00502、M00774、M00936、M01128?? 第七类 M00111、M00121、M00148、M00149?? 第八类 M00203、M00220、M00236、M00243?? 5.2 问题二模型建立与求解

5.2.1 问题二的分析

本问题要求分析不同类别消费者的特征,比较不同天类别消费者的价值。那么,首先我们可以通过主成份分析的方法对第一问中分为八类的消费者进行排序评价。

根据第一问将消费者分为 8 类,将每一类消费者指标变量的数据值累加求平均值作为该类消费者该类指标的数据值,数据表如下:

?a

N

pq

?

pq

,p=1,2,···,8;q=1,2,3,4,5.

np

式中:p表示消费者类别,q表示消费者的变量指标,

N

pq

表示第p类消费者第q

个指标变量的归一化数据平均值。

利用Matlab软件对消费者分类的数据进行累加计算,经整理后如下表所示:

表 2- 1 消费者指标均值表

8

类别 从进入系统到观测截止日的消费总次数(C) 最近一次消费时间与观总消费数 测截止日的 (M) 间隔倒数 (J) 消费频率 (P) 平均折扣率 (Z) 第一类消费者 0.090192308 0.002852897 0.058138665 0.001641337 0.122669271 第二类消费者 0.406940608 0.013890055 0.191869613 0.50585663 0.792672652 第三类消费者 0.173377404 0.002321694 0.071097977 0.002540537 0.165547689 第四类消费者 0.708013333 0.00634 0.3411 0.441973333 0.810966667 0.6316 第五类消费者 0.175828571 0.530457143 0.166771429 0.522414286 第六类消费者 0.083571034 0.464841034 0.076409655 0.461973448 0.737987931 第七类消费者 0.109251724 0.089510345 0.180686207 0.454686207 0.927765517 第八类消费者 0.265025 0.01885 0.22094375 0.3563625 0.78144375

5.2.2 问题二模型的建立(主成份分析)

用xx xx x1, , , ,2 3 4 5分别表示从进入系统到观测截止日的消费总次数、最近一次消费时间与观测截止日的间隔的倒数、总消费数、平均折扣率、进入系统到观测截止日的消费频率。用i=1,2,3,···,8分别表示第一类到第八类消费者。第i类消费者第j个指标变量

x

j

的值取作

a

ij

(1)对原始数据进行标准化处理。

aij ?? j , 1 4. i ? ,2,6; j ?1 ? ,2,3, ij a s j

6

2 1 6 , j ?1 ,2,3, 4 ,即 aij ??式中: ,s 为第 j aaij ,s ? j j j ? j j ? ? ?????? 6 i 1 1 i ??ij

各指标

转化成标准指标aij,即

1 6

9

个指标的样本均值和样本标准差。对应地,称

x ??

x ? j

j

j,j=1,2,3,4.

sj

为标准化指标变量。(2)计算相关系数矩阵R相关系数矩阵

R r

1 6

?

? ?

jk

4 4?

?a a?

rik ?6 i?1 ij ik , ,jk ?1 ,2, ,5. 6

1?

式中:

R

jk

?1 ,

r r

jk

?k i,

r

jk

是第j个指标与第k个指标的相关系数。

(3) 计算特征值和特征向量计算相关系数矩阵R的特征值? ? ? ?1 ??2 ?3

?4 ?5 ?0 ,及对应的标准化特征

T

向量

1j j j j j

uuuuu1, , , , ,2

3

4

5

3 4 5

其中,由特征向量u u u u u uj ??

, , , ,2

?组 成p个新的指标变

?y ux ux ux ux ux1 ?1 1 1 + 21 2 ?3 1 3 ?4 1 4 ?5 1 5, ?

?y ux ux ux ux ux2 ?1 2 1 ? 22 2 ?3 2 3 ?4 2 4 ?5 2 5, ??y ux ux ux ux ux3 ?1 3 1 ?2 3 2 ?3 3 3 ?4 3 4 ?5 3 5,

??y ux ux ux ux ux4 ?1 4 1 ?2 4 2 ?3 4 3 ?

44 4

量:

?5 4 5, ??y ux ux ux ux ux5 ?1 5 1 ?2 5

2

?3 5 3 ?4 5 4 ?5 5 5.

式中:y1是第1主成分,y2是第2主成份;y3是第三主成份,y4 是第四主成份, y5是第五主成份。

10


西南交通大学2017数学建模国赛预选赛优秀论文(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:电磁感应专题复习一

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: