昂昂
上市公司年报数据分析案例
背景分析与数据资料
上市公司的经营业绩与其股票价格、市场价值息息相关,因此反映上市公司经营业绩的定期公开披露的中期会计报告、年度会计报告就成为社会各界密切关注的重要信息之一。对所有上市公司的财务报告进行统计整理和分析,把握上市公司整体的经营状况、经营业绩的水平和变化趋势,无论是对投资选择,还是政府的决策与监督,都是不可或缺的。
本案例探讨的就是面对大量的财务报告数据信息如何进行统计整理与分析,这对于投资者、投资咨询人员或是理论界研究者,都具有实际的指导意义。通过本案例的学习讨论,有助于大家掌握统计描述和相关回归分析的方法,同时积累应用这些方法的实际经验和教训。
本案例所依托的客体是某年上市公司年报中的有关财务指标。当年末,沪、深两市共有上市公司949家。这些上市公司分布在13个行业部门。根据中国证监会的《上市公司分类指引》中规定的分类方法,其中制造业共有578家,占60.91%。总股本1938亿元,占62.73%,制造业是上市公司最集中的行业。本案例研究的总体范围确定为如期公布年报的制造业560家上市公司。
数据的初步分析——制造业上市公司行业结构
在制造业中,生产不同产品的企业或公司,具有不同的规模,占有不等的资源要素,他们的总股本、净利润、净资产收益率必然存在很大的差异。为了深入认识总体,首先要对制造业按其经济活动的特点进行行业分类。根据《上市公司分类指引》,制造业进一步分为10个行业种类,编码为C0、C1、C2、?、C9。分类统计属于定名测定。从上述资料经计数整理后即可得到如表一的分布数列。
表1 制造业上市公司行业分布 代 码 C0 C1 C2 C3 C4 C5 C6 C7 C8 C9
这是一个品质标志分组的分布数列。从该数列中可以知道上市公司的行业结构。当年560个制造业上市公司中,27%是机械、仪表、设备制造业(包括汽车、船舶、摩托车、家电等);23%是石化类行业;而冶金、钢铁等金属非金属类公司占17%;通讯电子章9%。所以,制造业上市公司中传统产业占了较大比重。这些行业中大部分是国有或国有控股企业,是国企改革中率先建立现代企业制度进入资本市场的排头兵。行业的分布也体现了国家的产业政策导向,在当年新发行的A股中,大盘股和高科技股明显增多,有力地支持了国企改革和高科技企业的发展,推动了上市公司的行业结构优化。
行业分类 食品、饮料 纺织、服装、皮毛 木材、家具 造纸、印刷 石油、化学 橡胶、塑料 金属、非金属 机械、仪表、设备 通讯、电子 其他 合 计 上市公司数 48 45 2 16 130 10 96 151 51 11 560 比重(%) 8.57 8.04 0.36 2.86 23.21 1.79 17.14 26.96 9.11 1.96 100.00
方 案 设 计
本案例研究的总体对象是某一特定时间的静态数据集,为了对它有一个全面和透彻的认识,一般应对其进行基本的特征描述和揭示各特征间主要的相互关系。根据这一目的,本案例按照如下顺序对数据进行处理:
1.分别对总体个单位的数量标志按值的大小作升序排列,以大概认识个变量的变化范围及其一般水平。
2.分别计算总体个变量的特征值,进一步抽象认识个变量的分布特征,包括算术平均数、众数、方差等。
3.分别根据特征指标绘制各变量的分布图,以形成对各变量分布的直观认识。
4.分别对总体各指标进行相关分析,了解各指标间的依存关系,在相关关系成立的基础上进行回归分析,从而更深层次地认识总体的规律与特征。
案例设计的工作过程 (一)数据整理与描述
1.编制按各财务指标的变量数列 (1) 将数据顺序排列。 (2) 计算描述统计指标。
在Excel“工具”的“数据分析”中,“描述统计”提供了所分析数据的主要描述指标和有关信息。其内容是;
x?平均——算术平均数,即x=
n标准误差——抽样平均误差,即
?n
中值——中位数,即Me; 模式——众数,即Mo; 标准偏差——标准差,即?; 样本方差——方差,即? 求和——标志总量; 计数——总体单位总数; 最大(K)——第K个最大值; 最小(K)——第K个最小值;
置信度——“数据分析”中默认概率为95%(也可自行选择)的1/2误差范围。 (3)分析描述统计指标——比较平均数、众数、中位数的大小。 (4)整理成频数分布和直方图(或其他图形),显示总体分布特征。 2.制造业公司主要财务指标的分布 (1)总资产分布数列和直方图
总资产描述统计1
平均 标准误差 中值 模式 标准偏差; 158315.1 8970.946 95296.9 212291.3 2 样本方差 最小值 最大值 求和 计数 置信度 (95%)
4.51E+10 12256.69 2190846 88656452 560 17620.89 总资产描述统计2
平均 标准误差 中值 模式 标准偏差; 样本方差 最小值 最大值 求和 计数 置信度 (95%)
从描述统计1看,560家公司的总资产呈高度偏态。总资产最大值是上海石化219亿元,最小值是ST黔凯涤1.2亿元,相差近200倍。将6个总资产100亿和7个2亿元以下的数据作为极值舍去,计算得到描述统计2,此时的标准差降低了,说明数据间的差异小了
不论何种分布,均值和方差其分布的两个主要特征值。根据切比雪夫定理,可以平均数为中心,以K倍的标准差为组距,因为此时平均数?K倍的标准差所涵盖的数据范围不小于1-1/K。
本例中,均值14.5亿元,中位数9.5亿元,标准差15亿元,说明560家公司的总资产分布为右偏态。若以1个标准差为组距,则中位数以下部分的描述势必过于概括。所以考虑用1/2标准差,即7.5亿元为组距,由于100亿元以上只有7家,将105亿元以上并为一组,组数=15。分组后变量数列及直方图如表二和图一所示。
表2 560家上市公司总资产分组统计 分组(万元) 75000以下 75000~150000 150000~225000 225000~300000 300000~375000 375000~450000 450000~525000 525000~600000 频数 209 192 64 33 18 15 4 2 频率(%) 37.32 34.29 11.43 5.89 3.21 2.68 0.71 0.36 2144640.7 6388.948 95410.48 149424.9 2.23E=10 21671.49 976941.1 79118478 547 12549.92 600000~675000 675000~750000 750000~825000 825000~900000 900000~975000 975000~1050000 1050000以上 合计
4 6 2 1 3 1 6 560 0.71 1.07 0.36 0.18 0.54 0.18 1.07 100.00 从图表中可以知道,制造业中,总资产8866亿元,平均规模在15亿元左右。82%的上市公司总姿产在22.5亿元以下,100亿元以上的只有1%。在各行业中,总资产规模最大的是C8——通信电子行业20.3亿元,最低的是C2——木材家具业6.38亿元,另外,C4——石油化工、C5——橡胶塑料、C6——金属非金属的总资产规模在平均之上。
频数2502001501005000100500007500150022503000375045005250600067507500825090009750其他00000000000000000000000
图1 560家制造业公司总资产分布
(2)净利润分布数列和直方图
净利润描述统计
平均 标准误差 中值 6669.48 516.2828 4120.164 模式 标准偏差; 样本方差 最小值 最大值 求和 计数 置信度 (95%)
# N/A 12217.48 1.49E+08 -37417.9 75468.6 3734913 560 1014.092 净利润分布呈右偏态。以1/2标准差6500万元为组距,可分17组。分组后3.25亿元以上各组不仅频数少,而且有两组频数为0。这种情况下可考虑合并这些组,因为合并后的数列并未影响总体特征的描述。见表3和图2。
表3 560家上市公司净利润分布
净利润分组(万元) -13000以下 -13000~-6500 -6500~0 0~6500 6500~13000 13000~19500 19500~26000 26000~32500 32500以上 合 计
频 数 (个) 14 10 22 332 112 24 13 16 17 560 频 率 (%) 2.50 79 3.93 59.29 20.00 4.29 2.32 2.86 3.04 100.00