聚类分析在证券市场分析中的应用 - 图文(2)

2020-06-28 12:14

到的数据进行处理,并用相关软件进行分析,最后再做出聚类分析的结果,取出其中有用的信息,为投资者做出决策。其流程图如图2.1所示:

建立股票综合评价指标体系 选定聚类分析的范围 收集股票样本 的指标数据 用SPSS软件 进行聚类分析 求取行业指标的均值 分析聚类结果,做出决策 根据需要确定聚类程度 对数据进行标准化处理

图2.1 聚类分析流程图

2.3聚类分析的方法

聚类分析有很多种类,大致划分为以下几类: (1)快速聚类分析法

快速聚类分析发的思想是首先将样品粗糙得分类,再依据样品间的距离按一定的规则逐步调整,直至不能再调整为止。它适用于样本数目较大的数据集的聚类分析,但它也有一定的局限性,需要事先指定分类的数目,并且这个数目对最终分类结果有较大的影响。

快速聚类法的步骤首先也是要选择聚类种子点或者中心点,再将每个观察样本分配给最近的种子,然后重新把每个聚集中的中心点作为种子,并不断重复以上过程直到种子的变化足够的小。 (2)模糊聚类分析法

模糊聚类分析是采用的模糊数学语言对对象按一定的要求进行分类的方法。模糊聚类分析一般是指根据研究对象本身的属性来构造模糊矩阵,并在此基础上根据一定的隶属度来确定聚类关系,即用模糊数学的方法把样本之间的模糊关系定量的确定,从而客观且准确地进行聚类。模糊聚类分析所讨论的对象,事先没有给定任何模式供分类参考,要求按照样本各自的属性特征加以分类。它的原则就是“最小化类间相似性,最大化类内相似性”。 (3)最优分割法

这种方法又被大家称为有序样品聚类法。简单的讲就是将研究对象的全部样品当作一类,然后根据某种最优的准则将其分割为两类,再分为三类,以此类推,直到样品被分割为我们所需要的类为止。 (4)系统聚类分析法

4

其基本思想是假设要研究的对象有n个样品,每个样品有m项指标。首先定义这些样品间的距离,然后将这n个样品看成是n类,再将最近的两类合并聚为新的小类,将已聚合的小类按其相似程度(用类间距度量)再聚合,·······,依此类推。这样每次缩小一类,直到最后将全部样品合成一类,并类的全部过程可以用聚类谱系图来描述。基本步骤如图2.2:

决定分类个数及各类的成员 画谱系聚类图 K<=1 是 i=i+1 否 合并距离最近的两类 K=n-i K=n,i=1 计算n个样品两两间的距离

图2.2 系统聚类分析法基本步骤

系统聚类分析法的特点为事先可以无须知道分类对象的分类结构,而只需要一批分类数据,然后选好分类统计量,并按一定的方法步骤进行计算,便能得到其分类系统图。它既可以对观测量也可以对变量进行聚类,既可以连续变量也可以是分类变量,提供的距离计算方法和结果显示方法也很丰富。在进行实证分析研究的时候,往往采用不同的聚类分析法就会有不同的分类结果,而在实际过程中,系统聚类分析还是最常用的一种方法,因此本文也采用系统聚类分析法。

2.3.1 系统聚类法类间距离的度量

距离作为对样品之间的相似程度的度量是聚类分析的基础。假设以i,j分别表示

5

样品xi,xj,dij表示样品xi,xj之间的距离,含样品数为np与nq的两个类为:

?p??p??p??q??q??q?,Gq?x1 Gp?x1,x2,...,xnp,x2,...,xnp????类Gp与Gq之间的距离为Dpq,常用的类间距离定义如下: (1)最短距离

Dpq?mindiji?Gp,j?Gq

??两个类中样品之间距离最短的作为类间距离,其特点是样品有链接聚合的趋势,因此不适合一般数据的分类处理。 (2)最长距离

Dpq?maxdiji?Gp,j?Gq

??两个类中样品之间距离最长者作为类间距离。 (3)类平均距离

2Dpq?1npnqi?Gpj?Gq??d2ij

两类中所有两两样品之间的平方距离的平均作为类间距离。这种方法是一种比较广泛,聚类结果也较好的方法。本论文便采用此方法来进行度量类间距离。

2.3.2 系统聚类法类的个数确定

在聚类分析中,最后数据对象的类的个数应该怎么来划分,将哪些划分为一个类别。虽然这没有一个统一的标准,但是常用的几种分类个数方法有: (1)根据数据点的散布图直观的确定分类个数

如果指标只有2个,那么可以通过数据点的散点分布图来直观的确定。如果有3个变量,则可以绘制三围空间的散点分布图,并通过旋转三维坐标轴由数据点的分布来确定应该分为几类。如果变量超过3个时,则需要综合这些指标,综合成2个或3个,再来确定。

(2)根据聚类谱系图确定分类个数

数据经过系统聚类法处理后,便会得到相应的谱系图。再根据如下准则确定分类。首先任何类都必须在相近类中是突出的。各类所包含的元素不宜过多。分类的数目要符合实用目的。

(3)根据聚类分析折线图确定分类个数

在聚类分析中,把离的较近的类进行合并,因此在并类过程中聚合系数会呈现出增加趋势,系数越小表示合并两类的相识程度越大。在聚类分析折线图中,以y轴表示聚合系数,x轴表示分类数,画出聚合系数随着分类个数的变化曲线图。在曲线开

6

始变得平缓的地方,选择较为合适的分类数。这种方法的优点就是简洁、直观,因此后文的分类数就是以此为依据来确定分类个数。

第三章 聚类分析在证券市场分析中的应用

3.1 聚类分析指标体系的建立

3.1.1证券行业分析及指标的选择

利用聚类分析,我们首先得将研究的对象进行分类,然后再量化分析与研究,因此我们要建立相应的评价指标。影响整个证券行业价格水平的因素大概有收益性和成长性。这里我们选择每股收益、主营收入增长率和净资产收益率来评价行业因素对证券的影响?6?8?。

每股收益越高,反映的是整个行业的投资收益越高,每一股的获利的能力也就越强。主营收入增长率反映的是行业发展速度的一个快慢,发展速度快的行业当然前景就远大扩张的能力与速度就越快,而处于成长期的行业呢,对未来的收益预期就会较高。净资产收益率反映的是每股净资产的实际获利能力,是非常具有公正与客观的指标。

3.1.2指标评价体系

从综合考虑行业和公司的因素出发,可以有十几个具有一定代表性的指标组成一个证券的综合评价指标体系,如图3.1所示。但是,由于从行业分析的指标来看,本文所选取的45家企业数据不能完整、系统的代替整个行业的指标数据,因此后文的实证研究着重以公司因素方面的业绩指标数据为主,进行聚类分析研究。其选择的指标有盈利能力、偿债能力、资产管理能力、成长能力、股本扩张能力。

7

股票综合评价指标体系 行业因素 公司因素 收益性 成长性 盈利能力 偿债能力 资产管理能力 成长能力 股本扩张能力 行业每股收益 行业净资产收益率 行业主营收入增长率 总资产收益率 净资产收益率 主营业务收益率 每股收益 资产负债率 流动比率 速动比率 总资产周转率 主营收入增长率 净利润增长率 流通股股本 每股净资产 每股公积金 每股未分配利润

图3.1 聚类分析指标体系图

(1)盈利能力指标

总资产利润率?净利润;

平均资产总额净利润(平均股东权益);

平均净资产主营业务利润;

主营业务收入净资产利润率?主营业务收益率?每股收益?净利润;

期末总股本总资产利润率是直接整体反映公司的获利能力大小,净资产利润率是反映公司对股东投资回报的大小。而主营业务是公司的未来发展方向和现阶段利润的来源,主营业务收益率越大,说明该公司目前的竞争能力就越强。 (2)偿债能力

8


聚类分析在证券市场分析中的应用 - 图文(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:九年级第一单元 复习课学案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: