第三章:数据调用。给出本数据库的数据调用方法和实例等。
附录:给出12种类型数据文件的结构框架、字段及说明。
第二节 CSMAR数据库特点和功能
1、特点
? 完整性
CSMAR数据库记录了自上海证券交易所和深圳证券交易所成立以来中国上市公司的资料、全部交易数据和财务数据,并且实时跟踪调整和更新以保证其高度的连续性和完整性。
证券交易所 上海 深圳
数据库最早记录时间 1990年12月19日 1991年07月03日 ?
准确性
CSMAR数据库主要是以学术研究为目的而设计开发的,具有高度的准确性。数据来源于由上海证券交易所和深圳证券交易所指定发布的证券时报、上海证券报、中国证券报等权威机构的一手资料数据。为保证数据的准确性,我们还应用大量的其他来源数据对本数据库的数据记录逐条进行了细致的校订工作,基本避免了错漏情况的发生。尤其是历史的原始数据,我们更是反复地以多种方法校验,从而又更大地提高了其准确性。
? 持续性和及时性
CSMAR数据库更新的持续性和及时性。CSMAR数据库将根据需要每年更新一次或两次。
? 规范性和可比性
CSMAR数据库借鉴了CRSP(Center for Research in Security Prices)和PACAP(Pacific-Basin Capital Markets)等国际知名数据库的成功经验,采用国际上通行的数据检验和调整方法以确保数据实际应用的可靠性,并力求与国际接轨。在数据项目上,CSMAR不仅提供经过调整的个股回报率,还提供了市场回报率和综合市场回报率。
本数据库的交易数据已经调整了其由于时间间隔(休息日、节假日)和上市公司原因(配股、送股、分红等)引起的股价变化,保证用户使用本数据库作数据分析的可比性和一致性。
? 便捷性
本数据库具有合理、清晰的分类,能随意根据上市公司的某项或多项财务指标,或根据某项或多项交易数据的数值或数值区间,或根据某项或多项财务指标和某项或多项交易数据的组合,方便地查找出符合条件的一系列股票,并能给出这一系列股票的交易数据和财务指标。
2、特色
CSMAR数据库与目前我们所见的同类的中国股票市场数据库相比,有如下特别之处:
(1)借鉴CRSP和Compustat等国际知名数据库的成功经验,把个股回报率、市
场回报率和综合市场回报率等数据项目直接提供给用户使用。提供市场回报率和综合市场回报率(由市场或综合市场上的所有股票的回报率加权平均得到,包括等权平均、流通市值加权平均和总市值加权平均三种加权方法),避免了目前对中国股票市场的市场组合回报率用综合指数或其他指数替代的无奈之举。
(2)提供各只股票详细的股本变动情况。由于中国股票市场的发展时间较短,很
多地方还不规范,股票的股本变动情况非常复杂。我们提供了详细的股本变动类型,包括新股上市、增发新股、职工股上市、转配股上市、配股除权、配股上市、配股除权并上市、送股除权、送股上市、送股除权并上市、拆细除权和拆细上市等十多种股本变动类型。对于每次的股本变动,我们都详细提供总股数、国家股股数、境内发起人法人股股数、境外发起人法人股股数、募集法人股股数、内部职工股股数、基金配售股数、转配股股数、优先股股数、A股股数、B股股数、H股股数、流通配送股尚未流通股数、高级管理人员持股数等数据。
(3)提供收盘价的可比价格。由于送股、配股、拆细等原因引起的股本变动,交
易所公布的收盘价也经过调整,从时间上看,交易所公布的收盘价就不具有可比性。为了解决这一问题,CSMAR数据库提供了以上市首日的收盘价为基准的各个交易日的收盘价的可比价格。
(4)结构合理查询方便。CSMAR数据库系统能够方便快捷地检索和获取
满足一定条件的股票交易数据和财务指标,并能灵活地以Foxpro、Excel、TXT等格式输出,可供SAS、SPSS等统计软件和Fortran、C、Pascal等高级语言直接调用。
3、功能
?
本公司提供两种服务方式,可针对不同用户提供相应的服务:
(1) 根据用户特定的数据需求,提供用户所需求的部分数据。这种服务方式的优
点在于用户不需要熟悉整个数据库的数据结构及数据调用方法。 (2) 提供整个数据库文件。用户可随时根据自己的需要调用CSMAR数据库中的
数据。
?
CSMAR数据库提供的数据格式有文本格式和DBF格式两种,可直接供SAS、SPSS等通用统计软件调用。
4、2000年版数据区间
股票市场 上海A股 上海B股 深圳A股 深圳B股 数据区间 1990年12月19日~1999年12月30日 1992年02月21日~1999年12月30日 1991年07月03日~1999年12月30日 1992年02月28日~1999年12月30日
第三节 安装配置要求
硬件配置:
建议采用Pentium / 266 以上CPU,64M 内存,800*600 以上分辨率,256色以上显示模式,2G 以上硬盘空间。
软件配置:
中文版WINDOWS 95/98,或NT; VISUAL FOXPRO 6.0。
第二章 数据说明
第一节 数据库基本文件介绍
市场交易数据库目前包括的数据文件分为12种类型:公司文件、汇率文件、日历文件、分配文件、日个股回报率文件、日市场回报率文件、月个股回报率文件、月市场回报率文件、综合日市场回报率文件、综合月市场回报率文件、指数文件和股本变动文件,我们在此简要说明,见附表,详细的文件分类和各个文件的数据结构及处理说明参见附录。
( 1 ) 公司文件
记录上市公司的一些基本情况。数据项包括公司的国家代码、证券代码、证券简称、公司代码、公司名称、行业代码、行业名称、公司成立日期、上市日期、数据库中最早交易数据记录的日期、数据库中交易数据的计量货币、股票发行溢价、招股价格、招股价格的计量货币、招股数量、股票面值的计量货币、招股日期、股票面值、区域码、公司活动情况、参考代码、情况变动日、备注。目前共有4个公司文件,分别为上海A股公司文件、上海B股公司文件、深圳A股公司文件和深圳B股公司文件。
( 2 ) 汇率文件
记录的是自1990年12月19日至1999年12月31日的人民币、港币和美元之间的汇率值。数据项包括国家代码、汇率日期、汇率日星期、人民币对美元汇率、港币对美元汇率、港币对人民币汇率。目前有1个汇率文件。
( 3 ) 日历文件
记录上海证券交易所和深圳证券交易所自成立以来至1999年12月30日的每天开市日历记录(开市或休市)。数据项包括国家代码、日期、星期、开市情况。目前共有4个日历文件,分别为上海A股日历文件、上海B股日历文件、深圳A股日历文件和深圳B股日历文件。
( 4 ) 分配文件
记录上市公司自1990年至1999年的分配情况,包括现金红利,送红股、配股、拆细等,数据项包括国家代码、证券代码、分配类型、公告日期、除权(息)日期、支付日期、比率、配股价格。目前共有4个文件,分别为上海A股分配文件、上海B股分配文件、深圳A股分配文件和深圳B股分配文件。
( 5 ) 日个股回报率文件*
记录上市公司的每日交易数据以及根据交易数据和除权(息)情况计算得出的日个股回报率。数据项包括国家代码、证券代码、交易日期、大类码、星期、行业代码、日开盘价、日最高价、日最低价、日收盘价、日交易股数、日交易金额、总股数、国家股股数、法人股股数、A股股数、B股股数、H股股数、转配股股数、基金配售股数、流通配送股尚未流通股数、内部职工股股数、高级管理人员持股数、优先股股数、流通市值、总市值、考虑现金红利再投资的日个股回报率、不考虑现金红利再投资的日个股回报率、考虑现金红利再投资的收盘价的可比价格、不考虑现金红利再投资的收盘价的可比价格。目前共有4个文件,分别为上海A股日个股回报率文件、上海B股日个股回报率文件、深圳A股日个股回报率文件和深圳B股日个股回报率文件。
( 6 ) 日市场回报率文件*
记录上海A股、上海B股、深圳A股和深圳B股四个市场的6种不同计算方法得出的日市场回报率。数据项包括国家代码、交易日期、交易日星期、日交易股数、日交易金额、考虑现金红利再投资的日市场回报率(等权平均法)、不考虑现金红利再投资的日市场回报率(等权平均法)、考虑现金红利再投资的日市场回报率(流通市值加权平均法)、不考虑现金红利再投资的日市场回报率(流通市值加权平均法)、考虑现金红利再投资的日市场回报率(总市值加权平均法)、不考虑现金红利再投资的日市场回报率(总市值加权平均法)、计算日市场回报率的有效公司数量。目前共有4个文件,分别为上海A股日市场回报率文件、上海B股日市场回报率文件、深圳A股日市场回报率文件和深圳B股日市场回报率文件。
( 7 ) 月个股回报率文件*
记录上市公司的每月交易数据以及根据交易数据计算得出的月个股回报率。数据项包括国家代码、证券代码、交易月份、区域码、行业代码、月开盘价、开盘价日期、月收盘价、收盘价日期、月交易股数、月交易金额、总股数、国家股股数、法人股股数、A股股数、B股股数、H股股数、转配股股数、内部职工股股数、基金配售股数、流通配送股尚未流通股数、高级管理人员持股数、优先股股数、流通市值、总市值、月交易天数、考虑现金红利再投资的月个股回报率、不考虑现金红利再投资的月个股回报率。目前共有4个文件,分别为上海A股月个股回报率文件、上海B股月个股回报率文件、深圳A股月个股回报率文件和深圳B股月个股回报率文件。
( 8 ) 月市场回报率文件*
记录上海A股、上海B股、深圳A股和深圳B股四个市场的6种不同方法计算得出的日市场回报率。数据项包括国家代码、交易月份、月交易天数、月交易股数、月交易金额、考虑现金红利再投资的月市场回报率(等权平均法)、不考虑现金红利再投资的月市场回报率(等权平均法)、考虑现金红利再投资的月市场回报率(流通市值加权平均法)、不考虑现金红利再投资的月市场回报率(流通市值加权平均法)、考虑现金红利再投资的月市场回报率(总市值加权平均法)、不考虑现金红利再投资的月市场回报率(总市值加权平均法)、计算月市场回报率的有效公司数量、流通股本市场资本总值、总股本市场资本总值。目前共有4个文件,分别为上海A股月市场回报率文件、上海B股月市场回报率文件、深圳A股月市场回报率文件和深圳B股月市场回报率文件。
( 9 ) 综合日市场回报率文件
记录上海证券交易所和深圳证券交易所全部A股、全部B股和全部A、B股的6种不同计算方法计算得出的综合日市场回报率。综合市场包括A股综合市场(上海A股市场和深圳A股市场的综合)、B股综合市场(上海B股和深圳B股市场的综合)和A、B股综合市场(上海A股、B股和深圳A股、B股市场的综合)。数据项包括国家代码、交易日期、交易日星期、日交易股数、日交易金额、考虑现金红利再投资的综合日市场回报率(等权平均法)、不考虑现金红利再投资的综合日市场回报率(等权平均法)、考虑现金红利再投资的综合日市场回报率(流通市值加权平均法)、不考虑现金红利再投资的综合日市场回报率(流通市值加权平均法)、考虑现金红利再投资的综合日市场回报率(总市值加权平均法)、不考虑现金红利再投资的综合日市场回报率(总市值加权平均法)、计算综合日市场回报率的有效公司数量。目前共有3个文件,分别为A股综合日市场回报率文件、B股综合日市场回报率文件和A、B股综合日市场回报率文件。
( 10 ) 综合月市场回报率文件
记录上海证券交易所和深圳证券交易所全部A股、全部B股和全部A、B股的6种不同计算方法得出的综合月市场回报率。数据项包括国家代码、交易月份、考虑现金红利再投资的综合月市场回报率(等权平均法)、不考虑现金红利再投资的综合月市场回报率(等权平均法)、考虑现金红利再投资的综合月市场回报率(流通市值加权平均法)、不考虑现金红利再投资的综合月市场回报率(流通市值加权平均法)、考虑现金红利再投资的综合月市场回报率(总市值加权平均法)、