(4) ?t<∞,如果P(vt <0) > 0,那么limVar(vt) = 0 ???以上条件的经济意义可以表述为如下四个方面,包括:
(1)以初始化为零的自融资交易策略为核心的统计套利描述; (2)预期折现收益为正向值的描述; (3)预期亏损概率趋近于零的描述;
(4)在有限时间内损失非零情况下的时间均放值趋向于零的描述。
条件(4)说明统计套利并不保证盈利,但是随着时间的推移,发生损失的概率越来越小,最终收敛于0.数学意义表述为:交易策略的方差不能高于随着时间的无限增长而增长的交易速度。根据这个数学表述,我们可以粗略的认为统计套利策略是可以生无风险收益的长期交易策略。
3.在以上的基础上,Robert Jarrow, Melvyn Teo, YiuKuenTse, &Mitch Warachka (2005)给出了统计套利的一系列扩展定义——它是一个初始化为零的成本决策,采用自融资的交易策略,其累积收益的折现和增量情况应该满足以下公式:
(1) v0= 0
⑵ lim E(vt)>0 ???(3) lim p(vt <0)=0 ???(4)limVar(Δvt |Δvt <0)=0 ???该定义中的前三个条件与 Hogan S , Jarrow R . Teo M, Warachka M(2004)的定义相同,只是对第四个条件进行了修正。根据条件(4)如果投资人只是关心投资的潜在风险,或者说是财富的潜在损失,那么当收益折现是正向值时,这种损失波动是没有约束的。
上述后文的两个定义中的第四个条件都不包含其经济定义中的一些方面,比如在有限时间内产生了套利利润,并且为补偿这种不确定而对风险的时间性变化产生限制等因素。其中,有较小风险性的瞬时交易的利润情况在后两个定义的条件(4)中给出了定义,它将套利界限重新设限并且整合到原先的统计套利范围内。
p
2.2统计套利策略的类型
统计套利主要有如下四种策略:配对交易策略(Pairs Trading);多因子套利策略(Multi-factor Model);均值回归策略(Mean-reverting Strategies);协整套利策略(Cointegration)。统计套利方法的范围,从最古老的纯粹匹配交易机制到复杂的、动态的非线性模型,应用的技术包括神经网络(neural networks).小波分析(wavelets)、分形分析(fractals),几乎覆盖了所有的统计学、物理学和数学模拟匹配技术。这些技术经过分析师的反复检验,不断淘汰不合适的方法,留下具有实用性的方法。
如前文所述,本文只着重研究了其中基于协整方法的配对交易策略。这种交易策略也是目前国内文献中最常研究的。
2.3国外研究现状
Burgess (1999)使用逐步回归法以及误差修正法研究了 FTSE100指数及其成分股,统计套利被他定义为传统的“零风险”套利的一个扩展。
Gatev, Goetzmann和Rouwenhorst (1999) 在文章中提出了使用与给定股票的
标准化序列之间的偏差平方和最小的股票构成股票对,相应的阈限值是配对股票标准化价格的差的历史标准差的两倍。在Nath (2003)用实证方法分析了建仓和平仓时机的选择,文章得出的结果认为建仓的时机是观测到的配对股票的偏差超过阈限值的15%时,同时,当这种偏差距离设定的平仓范围小于5%时,是平仓的时机。
DmytroSudak和OlenaSuslova(2003) 运用行为统计套利策略去发现最优投资组合,他们在实证研究中把累积收益当做判断股票优劣的指标,并且提出三种判断最优投资组合的方法:组合最小方差、组合多头与空头头寸之间的最小协方差以及组合beta值为0时的最小方差和协方差。对两个样本内区间和三个样本外区间分别进行检验,得到了预期的风险收益效果。Whistler(2004)将相关系数接近或为1的股票配对,接着使用价格比或价格差以及累计概率等统计数据,将基本分析和技术分析的趋势相结合来决定进出场点。Ganapathy Vidyamurthy (2004) 提出统计套利是一种建立在相对价基础上的思考方法,这种思考认为具有相似特征的股票的价格在理论上应该是相似的,价格差异度是一种错误定价形成的,并且价格差异越大,那么价格被错定的程度越高。与此同时,他还通过将协整方法和统计套利方法结合起来使用,是配对的交易有了指数化的形式。Carol Alexander和AncaDimitriu (2005)对指数化跟踪的研究方法进行了改进,将协整方法的统计套利策略运用其中。他们的研究成果表明:与市场相关性小、波动率低、近似正态分布是协整话的统计套利策略的显著特征,并且研究表明这种方法的跟踪差方差明显优于其他方法。
Elliott, Van Der Hoek和Malcolm (2005) 对于该领域研究的贡献在于他们成功构造了一个能够观测到的配对股票之间的价差过程,这篇文章给出了运用随机价差模型进行配对交易的一个基本的分析框架。
Thoraaidis(2006)将神经网络的GARCH的自回归模型应用于统计套利中,并由此计算股票的投资机率和套利的可能性。
Low(2009)在股票市场中性策略调查报告中指出,市场中性策略是受市场影响较小的少数几个策略之一。调查发现,股票市场中性策略相比其他策略在长期具有更低的年化波动率,因此可以避免市场下跌的影响。而且在过去10年中,股票市场中性策略可以获得正的风险调整收益率。报告还指出,虽然市场中性策略在牛市中无法充分获得市场收益率,但是在熊市中,该策略却可以完全避免市场下跌的风险,获得稳定的低风险收益率。
Engle和Granger (1987)提出了协整理论,为建立一个配对交易参数化的模型提供了一种思路。Ti_ermann(2009)发展了连续时间协整分析法,并用此方法模拟了利用均值回归识别错误定价的风险套利过程,计算出了最优交易策略的表达式。文章得出的结论是,风险套利以预期收益最大化为标准,而传统套利以获得组合资产价格为0为目标,二者是不同的。Bolgun等(2009),收集了在伊斯坦布尔股票交易所上市的公司从2002到2008年间的股票日收盘价,并使用动态统计套利策略进行实证分析。文章为了提高不同成分股价格之间存在均值回归的可能性,在对ISE30指数成分股进行统计套利时没有按照行业进行分类。研究结果表明,相对于单纯的购买并持有策略,成对股票组合产生的同平均收益率要高出3.36%。但值得一提的是,交易限制和交易佣金大幅减低了成对股票组合超额收益率,使得实际收益只占理论收益的一小部分。
William K. Bertram(2010) _计算出了服从O-U过程时交易信号的最优解。Mark Cummins (2010)使用爱尔兰交易所的交易数据,发展了一种全面的综合的实
证分析法。结果发现,假设对数价差序列满足的O-U过程会产生较大的误差,这种误差体现在:该假设会使得对单位时间期望收益估计过高和对交易策略持续时间估计过低。同时,该文献还发现,Bertram (2010)提出的模型是非常适于模拟具有高均值回复性的随机过程的。
Christian L. Dunis 和 GianluigiGiorgioni (2010) 使用高频数据而非日交易数据进行套利,文章对具有协整关系的股票对以及没有协整关系股票对的套利立即收益率进行了比较,结果表明,股票间价格协整程度越高,进行统计套利的机会就越多,潜在收益率也越高。
2.4国内研究现状
方昊(2005)研究了统计套利的基本原理、理论模式和交易策略,然后用中国封闭式基金市场的数据加以模拟检验,探讨了在实践中统计套利是否能被应用,得出的结论是统计套利策略我国封闭式基金市场上有效。徐玉莲(2005)应用新的资本市场效率检验方法,对存在于中国股票市场中的价格惯性和价格反转以及价值反转的投资策略运用统计套利方法进行了检验,并且在价值反转投资策略中发现了 7种可生成统计套利的策略。徐光梅(2008) 用实证方法检验了沪市A股的动量效应,在此过程中将统计套利的市场中性性质引入投资组合,先假设组合策略能够生成统计套利机会,在此基础上构建投资组合,检验动量投资策略持有期的可盈利性,以此为依据判断市场是否具有动量效应及效应的大小。陈之远(2011) 使用Larson和Arberg (2002)的方法对沪深两市选定的股票进行研究,在这一方面,行为统计套利模型比传统价格动量交易策略更有效,因为它在提高收益率的同时还降低了波动率。
韩广哲,陈守东(2007) 运用上证50指数的50个成分股,运用套利模型研究发现股票价格符合偏离随机游走的性质,因此股票价格可以被预测。并且,运用联立方程模型的估计结果说明,错误定价易于在短期内形成趋势,而在较长时期内回复。于玮婷(2011)选取了当时我国融资融券标的90只股票作为研究对象,使用协整方法,对成对交易的统计套利策略的收益率等指标进行了实证分析,结果表明统计套利可以较好地运用于中国市场。另外,在实际情况中,学者发现统计套利策略不足以解决具体考虑投资相关的许多问题,因此,需要将更多的精力投入到更加全面、更加详细的研究当中,以便提高该策略在解决实际问题中的效用(陈祥利2011).王云平(2011) 一起使用协整理论和传统的统计套利方法,模拟了一年内的历史数据,然后对策略的稳健性做了预测检验。实证结果证明了该策略的可行性与收益性.同样地,协整分析成为了该类问题不可或缺的方法,并在此基础之上,学者结合GARCH(1,1)模型分析向前复权收盘价格的时间序列,有效地估计价差序列的动态标准差σe,并以此作为交易信号,以便有效地对配对交易进行有效性分析(胡丹丹2011) 除此之外,该作者在处理数据的过程中使用了三阶的移动平均以补给缺失值进行处理,该种处理也为之后的深入的分析提供了必要的条件。
袁瑶,朱华成(2008) 使用统计套利策略跟踪了沪深300成分股中的30对股票,对2008年3月10日-9月10日和2004年2月13日-2008年9月10日两个时间段内的实际交易数据进行了统计套利模拟,结果显示统计套利策略的累积收益率高于同期上证综指累计收益率,而且波动性低于同期上证综指水平或与上证综指水平相仿。胡浩(2008) 分析了宝钢和武钢的价差走势,分以收盘价为交易对象进行低频交易和以日内价格为交易对象进行高频交易,两种交易方式均获得了年化50%以上的收益率,并且得出了统计套利组合与沪深300指数之间相关性很低的
结论。张雷,刘洋,张爱玲(2010)对当时的90只标的股票进行两两配对检验,筛选出60个具有可供操作参考的配对组合,并根据价差建立套利模型。通过对建设银行和工商银行之间的套利过程进行模拟,发现在08、09年,建设银行和工商银行之间存在5次较好套利机会,去除交易成本,累计获利达到42. 88%。报告认为,考虑到融资成本,是否利用融资来放大这种套利效果还需进一步研究。周健(2010) 先以沪深300指数成分股作为股票池,然后使用银行业14支股票的数据和高频数据进行实证研究,结果发现在行业内进行策略构建,综合股票流动性、公司基本面和消息面上的分析,以高频数据为基础,构造出来的统计套利产品样本外收益更高。
在以往的研究基础之上进行比较分析,动态统计套利的方法比传统的方法来说有明显的改进,无论是在收益结果的稳定性还是在套利机会上都增加了更多,最终导致的结果是有更高的交易成功率,此外,该方法可以得到的市场走势也变得更为稳定(刘海燕,2011)。
董艺停,葛新元(2011)将特定事件的发生作为配对交易的另一触发条件,采用高频交易,构建了基于事件冲击的统计套利策略。在实证的测试区间内,收益基本持平,而同期沪深300收益率为-48. 15%。放松交易成本和融资融券利息的设置,降低融资融券利率和交易成本,仍然采用之前的交易参数,收益大幅提高,并且非常可观,整个持有期内,净值低于1的天数仅为10天。陈怡(2012)尝试将统计套利的方法引入分级基金交易,采用“成对交易”策略,实证结果表明:1)相比优先份额,进取份额是成对交易策略更稳定的交易标的;2)不论市场表现如何,该策略都可以获得高于大盘的收益和夏普比率;3)如果市场时单边的熊市,组合价差将长期偏离均衡,该策略不能获得绝对收益。
2.5文献述评
统计套利研究领域的可查文献主要分为如下几类:1)指出统计套利策略优势;2)分析统计套利与传统无风险套利的区别:3)统计套利策略实证研究;4)统计套利的新方法。除文献综述外所有文章都采用了实证的研究方法。可查的文献中,统计套利研究数据主要采用日收盘价。随着近两年高频数据运用的兴起,有少数文献开始采用日内高频数据。
由于统计套利策略已经在国外使用了将近30年的时间,国外的文献一般都致力于对已有的策略进行重新验证和调整,在确定股票池,构造残差,交易时机的选择上不断增加模型精度,并用不同时期的数据进行验证.
由于做空机制的缺失,国内关于统计套利的研究起步较晚。2010年融资融券试点开始后,国内的一些证券研究机构相继发布了一系列研究报告。这些报告大多采用已有模型来验证中国市场的数据,得出的结论基本一致,即统计套利策略在中国股票市场有效。而学术论文的不仅分析数据,也注重分析模型本身,在建模原理方面有更多思考。但总的来说,国内文献在模型的发展上贡献有限,研究的重点还是放在对国外研究中经典模型的验证上.
3.协整理论
协整关系是配对交易的基础。若两只股票的收益率之间具有协整关系,我们认为他们之间存在着某种稳定联系,所以当两只股票的收益率出现背离,说明其中一只股票的收益率被低估而另一只股票的收益率被高估,此时因做多价值被低估
的股票,做空价值被高估的股票。因此协整方法的第一步,就是选取两只相关性很高的股票,判断他们之间是否存在协整关系。
3.1选取配对交易股票
统计套利策略属于市场中性策略,它通过对相关证券进行对冲来获得与市场相独立的稳定性收益。统计套利策略的理论基础就是均值回归,也就是说,如果两个相关性很高的投资标的价格之间存在着某种稳定的关系,短暂的偏离会不断地得到调整,并逐渐回归均值水平。具体而言,那么当二者的价格出现背离走势时,但是投资者预期未来这种偏离会得到有效的修正,纵然短期内两者之间的套利空间会增大,但是长期的回归使得二者之间存在套利空间。在实际投资中,价格的背离使得聪明的投资者可以买进被低估的,卖出被高估的,以获取未来相对稳定的收益。因此统计套利的第一步就是要选取相关性很强的股票,选股时采用距离法,根据距离公式(其中γAγB分别是股票A和B的收益率) d(A,B)=|ρ|= (3-1)
可知,股票之间的距离就是股票的相关系数,相关系数越接近1,两只股票的收益率越接近。在实际计算时,也用A、B的对数价格来代替各自的收益率。
3.2交易数据分析
在选取两只距离较近的股票后,需要对两只股票的收益率进行协整检验,已确定两只股票之间是否真的存在协整关系。这一过程包括两个部分:首先是对各自股票收益率的平稳性检验,保证其趋势是平稳的,其次是对两只股票收益率的残差进行检验,保证其残差是平稳序列。
3.2.1平稳性检验
依赖于时间t的随机变量集合{yt}成为随机过程。随机过程概念很广泛,其中有一种特殊情况叫白噪音,其定义为:如果随机过程服从的分布不随时间改变,且对所有t满足:
E(yt) = 0 (3-2) Var(yt) = E(yt2) =σy2=常数 (3-3) 同时
Cov(yt ,ys) =E(yt* ys), (t ≠s) (3-4)
那么,这一随机过程成为白噪音。
如果一个随机过程在时间过程上的均值和方差都是恒定的,并且在任何两时期的协方差的值仅依赖于这两时期间的距离或滞后,而非依赖于计算这个协方差的实际时间,就称这个随机过程为平稳的。用数学公式表达如下,对所有t:
均值
E(yt) =μ (3-5) 方差
var(yt) =E(yt-μ)=σ2 (3-6) 协方差
γk=E[(yt -μ) (yt+k -μ)] (3-7)
其中γk即为滞后k期的协方差,也就是相隔k期的两期yt和yt+k的协方差。有时时间序列的高度相关是因为二者同时随时间的推移有向上或向下变化的趋