期货学堂 > 详情文章

【专题报告-金融工程】商品期货中的阿尔法策略

文 / 2017-07-12 14:14

......

报告日期: 2017年7月7日


 

★商品期货市场中的阿尔法

价格变动的直接原因是供给与需求的博弈,而本质则反映了对未来预期的变化,因此对于商品期货的预期收益来说也可以被分解归因到不同的因子上面去。我们所构建组合的方式也类似于选股模型,通过对横截面上同一个因子在各品种上的相对关系来选择做多与做空的组合。如果一个因子有效那么就说明能够通过该因子截面上的相对关系所构建的多空组合能够获得超额收益。

★基本面因子与技术型因子

考虑到商品远期曲线能够反映出市场对基本面的判断,故采用升贴水因子作为主要的基本面因子指标。我们统计了不同品种的升贴水序列,发现非平水的远期曲线是具有一定回复力的,故该因子实际可作为反向指标。从历史回测来看,我们用主力与次主力合约所计算得到的升贴水因子对持有期长度的敏感度较小,而且超额收益表现持续又稳定。

技术型因子包括趋势性的动量、 MAcrossover、RSI 因子,也包括收益率序列的统计量STD、Skew等因子。趋势型因子所构建的多空组合对持有期与排序期长度更加敏感,这一定程度上可解释为和所选品种的趋势周期有关。综合考虑各个因子的分组表现、多空组合收益的稳定性以及对组合参数持有期长度的敏感性,我们认为技术型因子中仅一定计算周期下的动量和Skew因子才更为有效一些。

★多因子组合的构建

我们综合所分析得到的所有有效因子,通过打分法构建了多因子组合,结果获得年化收益率在不加杠杆时为11.7%,夏普比率1.21,收益最大回撤比1.24,最大回撤9.41%。

★致谢

感谢东方证券研究所首席金工分析师朱剑涛的指导与帮助。



1、背景


在股票量化投资中,多因子模型是应用地最广泛的一种选股方法。基于CAPM模型,Fama和French最早提出了三因子(市值因子、规模因子和价值因子)模型对CAPM模型进行了拓展,后来在套利定价理论(APT)的思想指导下,四因子、五因子等模型陆续地被提出来能够更加有效地解释股票收益,而且也被投资者成功地应用于选股投资中。现在有效因子的数量在不断地增加,累积并形成了各具特色的因子库、因子池,从而也丰富和多元化了投资标的的受关注的特征。从本质上看,因子化投资是将股票的超额收益归因到不同的方面,超额收益的预期值可能由包括价值类、技术类、情绪类、质量类等的众多因素所引起的。

对于商品市场来说,交易标的作为大宗商品不再像股票那样其价格由股票发行公司的价值所决定,而影响其价格变动的最直接因素是市场上该商品的供给和需求的边际变化的总体效应。但和股票类似的是,价格的形成都是对未来的预期的变化,因此对于商品的预期收益也可以被分解成不同的因素,比如宏观因子(包括汇率、GDP以及政策变化)、基本面因子(包括航运、库存量、消费量等),以及一些不可预期的因子(比如天气、政治、战争等)。所以,商品投资事实上也可以从因子的角度分解收益与风险,如果将它们之间的关系搞清楚的话,便能够依靠因子的表现情况来主动地进行商品品种间的配置,构建多空组合,从而对冲未来可能出现的风险并获得Alpha收益。

国外学术机构或投资机构对商品期货市场中因子化的投资策略进行了大量的研究和挖掘,其中较为显著并且历史上持续有效的因子主要有动量因子、期限结构因子,另外国内的研究也涉及到了异质波动率、库存水平及对冲压力等。

受国内外相关多因子的研究启发,在本篇报告中我们便尝试挖掘商品期货市场中的有效阿尔法因子,并根据因子的表现构建多因子的期货品种组合,以得到收益稳定并且显著的CTA策略。



2、回测样本数据选取


2.1、品种选择

目前为止,我国境内上市的商品期货品种已经有46种,但相比于股票市场超3000只股票的数量,期货市场上可用来进行配置的品种数量少很多,因此尽管我们要做期货品种的因子化配置,但也有可能因品种数量过少而使得因子的表现波动较高。另外一方面,就像股票选股一样,对于CTA策略来说,影响策略收益最为明显的因素之一便是品种的流动性,如果配置了流动性较差的品种就会产生明显的冲击成本从而降低策略收益。所以,我们按照下面两个条件首先对实际可成交的品种做了筛选。 

(1) 我们计算了历史上每个上市品种的每一天的日均成交量,该值是由近30个交易日的成交量数据计算得到,并择取了日均成交量手数超过10000手的品种。这里我们做了简单的测算,以每个品种200万的交易保证金来计算手数的话,基本上都不会超过10000手的1/10,故这些交易量也就基本满足对流动性的要求。

(2) 考虑到有些新品种刚刚上市之后出现“炒作”行情,由于投资者对品种不够熟悉,使得交易量可能会有较大的变化,所以我们就只考虑上市满3个月的期货品种。

(3) 为了防止前视偏差,在T日收盘后计算满足以上两个条件的的品种,而T+1日时才能按照后文所介绍的配置逻辑进行实际的交易。

从2005年年初的时候仅仅5个可交易品种满足流动性要求,而到2017年5月31日则共34个可交易品种,具体地,上述条件剔除了一部分流动性严重不足的品种,比如早籼稻、粳稻、晚籼稻、胶合板、纤维板、线材、普麦等“死掉”的品种,剩余的品种按照黑色产业链、有色金属、贵金属、能源化工和农产品五大类划分,具体结果如图表2所示。而历史上每一天实际满足上述要求的可进行交易的品种数量变化,如下图所示。


2.2、区间选择

考虑到阿尔法策略投资中实际多空组合内的品种数量仅仅是当期品种池内的一部分的品种,所以品种池的数量不能过少,否则多空组合内的品种有可能仅仅一两个品种,这样就造成组合波动较大。根据上图的结果,我们不能选择过早的时间起始点。综合考虑之后,最终选取的样本数据的时间范围为2011.01.01至2017.05.31,共计1555个交易日,总的实际可交易品种的数量由17个到34个。

2.3、合约选择

同样地因考虑到交易品种的流动性,我们做交易的合约都选用主力合约,但是对于主力合约来说,在移仓换月时会出现“跳价”现象。所以需要我们先对主力合约进行“复权”处理,这里采用的方法和我们之前一系列的策略报告中所采用的方法一致,即先将旧的和新的主力合约的收益率序列拼接到一起,然后再将收益率序列按照前复权或后复权的方式还原成价格序列。也就是说,尽管原始的主力合约价格序列是“不连续”的,但是收益率序列却可以是“连续”的。

我们利用“复权”后的主力合约价格序列进行各项因子指标的计算,但是对于开仓、平仓等实际交易仍然采用真实的合约价格,所以在策略回测时仍然会考虑移仓换月时的展期操作,以及该操作所导致的交易成本和换手率的增加。


3、阿尔法策略组合构建


3.1、组合策略设置逻辑

我们构建商品期货策略组合时有以下一些设置:

1. 组合构建方式——采用了Jegadeesh和Titman (1993)等人所提出的策略组合的构建方式,即定义两个周期长度,一个是排序期(K),另一个是持有期(H),在排序期内考察各个股票的因子表现情况,而在持有期开始时做多因子值满足一定条件的期货品种,同时做空近一期内的因子值满足一定条件的另外一部分期货品种,并持有H的长度,直至下一个持有周期开始。

2. 交易形式——上一期的持有期T日结束,重新计算T日收盘后的因子值,但调仓操作发生在下一持有期的开始,即T+1日的开盘时进行开仓、平仓、补仓、减仓等一系列操作。补仓和减仓发生在新的持有期仍将持有之前的持仓品种。

3. 合约展期——在持有期内,假如在T日发生主力合约切换的品种,旧主力合约会在T-1日收盘时提前进行全部平仓,而新主力合约则在T日开盘时进行再开仓。假设T日刚好为调仓日,那么如果新持仓期内不再持有该品种,那么展期操作就不再开新仓了。

4. 杠杆倍数——策略总资金量设为5000万元,但可用作保证金占用的资金占比为20%。对于每个交易品种,为了方便,我们统一设置他们的初始保证金系数均为20%(实际保证金比例低于此值),因此整体的杠杆倍数可简单地通过资金使用占比与保证金系数之间的比值得到,为1倍杠杆。

5. 交易成本——由于实际不同期货品种的交易摩擦成本会受流动性不同而不一样,为了方便考虑并且贴近事实,统一设置每个期货品种的滑点为三个最小价格变动单位,而交易手续费比例设置为双边各万分之三。

6. 权重分配——在每个持有期开始时,用该日开盘价计算得到整个账户内的总资产计算下一期各持仓资产的资金权重。我们默认采用相等的资金权重分配方式。


3.2、多头市场组合

为了与商品期货市场中的阿尔法策略对比,与股票市场中的指数组合类似地,这里我们首先按照上述的组合策略设置条件构建了具有不同持有期的多头市场组合,也就是说将回测期间内实际可交易品种(选择品种的标准如前文所述)等权购入做多,而在持有期结束后会重新计算再次等权分配权重。

不同持有期长度的多头市场组合的结果如上图所示,另外图中红色实线是Wind数据库中的全商品市场指数CCFI在同时期的净值走势。整体来看,我们所构建的多头市场组合的年化收益率基本在-5%左右,但是净值受持有期长度的影响非常小,这是因为对于纯多头的策略来说,这样的构建方式只是影响了权重的再分配,而并没有影响到持仓的品种,而在后续部分我们便着重讨论商品阿尔法因子对持仓品种的影响,进而对策略收益造成影响。

尽管对于多头市场组合来说,持有期的变化对净值并未造成较大影响,但实际上从交易的角度来看,实际上对策略交易次数、换手率的影响还是较为明显的。当持有期较短时,交易次数较大,交易次数随着持有期长度增加而迅速下降,而持有期超过25天之后基本上就稳定在一定范围内了。换手率的影响结果也同样如此,如果从每个持有期的换手率来看,因为持仓周期变长所以换手率也会越来越高,考虑了移仓换月的换手率就更加明显了;而如果从年度换手率来看,持有期长度的增加是会降低换手率的。在我们后续对单个阿尔法因子的换手率计算时,这种结论会更加明显。


4、商品期货中的阿尔法因子

接下来,我们首先对国外市场上较为有效的动量效应因子、期限结构因子以及异质波动率因子在国内的商品期货市场上进行实证测试,测试方式是以截面上单因子排序表现进行分组,通过各个分组组合的表现确定因子的有效性程度,以及对排序期、持有期参数的敏感程度。除了这三种因子之外,我们也对和基本面有关的升贴水因子以及几个由量价计算而来的技术型因子也做了实测。在确定了有效因子之后,我们也会利用这些因子再构建多因子的组合。

4.1、动量效应

类似于物理学中对具有质量的运动物体的描述,金融市场中的动量效应是指交易标的物本身也具有一定的“惯性”,而价格则被反映为“速度”(具有反向),因此当价格的走势可能在一段时间内呈现出一定的趋势,那么它就具有了“动量效应”,之前表现为上涨的在趋势中仍有较大可能性继续上涨,而之前下跌的则在未来大概率继续下跌。显而易见的是,如果金融市场确实存在动量效应的话,那就违背了Fama所提出的有效市场假说。因为如果市场完全有效的话,任何投资者都无法从历史的价格信息分析当中获得稳定的超额收益,而价格的涨跌是完全随机的从而无法进行预测。但是实证研究却证实了无论是股票市场还是商品期货市场或者其他市场(诸如外汇),动量效应都切实存在。在我们看来长期的动量效应本质是由基本面供需所决定,而短期内的动量效应则源于投资者追涨杀跌的非理性羊群行为。

Jegadeesh和Titman (1993)等人在对美国股市的研究开始了最早的金融市场中动量效应的研究,在排序期内考察各个股票的动量表现(即历史业绩),而在持有期开始时买入近期的胜者(业绩较好),卖出近一期内的输者(业绩较差),并持有H的长度,直至下一个持有周期。之后Miffre和Rallis (2007),Shen (2007) 以及Szakmary (2010)对国外商品期货市场中的动量效应也做了测试,发现期货市场中也确实存在着“胜者更强,输者更弱”的现象。国内学者对我国境内的期货市场中的动量效应的研究较少,他们的研究由于数据和品种的选取、策略组合的构造方式等或多或少地具有一定局限性。但是,尽管近几年我国期货市场的上市品种种类和数量在不断地丰富,以及大量的投资者不断地涌入到期货市场的交易中,日均交易量稳步提升,但是动量效应是否仍然存在并持续有效,就需要进一步详细的统计以及相关回测的分析了。

1. 时间动量效应

我们常常提到的“动量效应”往往是指业绩表现或者价格走势具有一定了延续性,这实际上说的是时间序列中的动量特性。NBER的Tobias Moskowitz及AQR的Yao Hua Ooi等人在2012年发表的一篇名为《Time Series Momentum》的文章中非常详细地讨论了时间序列上的动量效应的表现。他们在对全球包括股指、外汇、债券及商品期货在内的共58种资产价格时序进行分析,发现了在1个月到12个月内的窗口期内存在显著的时间动量效应,而且以该策略构建的品种组合收益对标准定价模型中的因子暴露值很低,时间动量效应因子的表现对不同的行情都持续表现优异。

(1) 时间动量效应的线性回归检验

我们借鉴Tobias Moskowitz在其文章中所提到的回归分析的方法,对国内商品期货不同品种的收益率序列进行了线性回归,以查看是否存在着回归方程如下:

 其中回归对象实际是受风险调整过后的收益率序列,我们对t时刻的收益率除以t-1时刻的波动率(波动率的计算周期长度为10天),这是为了防止前视偏差带来的错误。回归方程中的h指的是时间序列往前平移的窗口长度,我们对不同大小的h(从5天到145天)并对不同的品种都进行了回归分析,最终记录下回归时的t统计值。我们对目前可被交易的34个品种分别进行了不同平移窗口h的线性回归,计算得到了各自的t统计值,结果发现大多数的品种在不同的h下t值表现不一,并且仅在某些h值时能够通过显著性检验(显著性水平为0.05),尤其是黑色系中的螺纹钢与焦炭,而其他多数品种都无法通过t检验。为了近似地得到整体的国内商品的表现,我们将不同品种的t统计值按相同的平移窗口长度h进行简单地加总平均,结果发现尽管t值在平移窗口为35天及以下时得到明显的正值(如下面两张图所示),但是t统计值仍没有显著超过1.646(显著性水平0.05,自由度1000)也就是说明了我们通过t检验的方式发现国内多数品种可能不存在显著的时间动量效应。尽管时间动量效应不够显著,但是我们却不能否认它的确存在。


(2) 时间动量策略组合

为此,我们利用时间序列上的动量特征对国内上市的商品期货的也做了测试。由于这种时间序列上的动量特征,表现为价格在时间上满足一定的持续性,故时间动量效应策略设置的具体内容是,先设置排序期K及持有期H长度,然后做多排序期K内累计收益率为正的品种,而做空累计收益率为负的品种。上面两张表展示了当采用不同的参数对(K,H)时,时间动量效应策略组合的年化收益率、夏普比率的表现,整体上来看,在参数满足一定条件时该策略均能够获得正收益。对比前面t检验的统计结果,我们认为国内商品市场上的时间动量效应的确存在,但部分参数条件下才表现有效。

由于排序期长度决定了动量因子的计算,那么单从排序期的角度来看,当排序期K大于等于20天时,该策略的收益表现较好。如果考察对换手率影响的话,类似于前文中对其讨论的结论一样,年度换手率(或日均换手率)会随着持有期长度的增加而急剧地下降,基本上在H超过25以后便处于较低的水平了。换手率如果非常高,就会使交易因为流动性风险而无法保证在实际情况下能够取得回测所展现的收益。在综合考虑了策略收益、稳定性以及交易换手率之后,我们认为该策略的表现较好且稳定的参数范围为K在20到35天之间,H在25-30天之间。以K=25,H=30为例,不加杠杆时的年化收益率为7.28%,而夏普比率为0.59,收益最大回撤比为0.93,最大回撤仅为7.84%,尽管该因子的年化收益并不是特别突出,但是该策略在整个回测期间内表现还是比较稳定的。

(3) 不同大类期货品种的时间动量策略组合表现

除了在某些参数条件下时间动量效应表现有效之外,不同大类的期货品种的这种时间动量效应的表现也区别较大。我们按照前文对可交易的期货品种的分类,对不同大类的品种分别进行了时间动量策略的回测,结果如下图所示,为做对比参数仍旧选取K=25,H=30。在回测期内,黑色系和能化系的期货品种的时间动量效应较为显著,且能化系品种的波动性也更小更加稳定,而农产品、有色和贵金属的时间动量特征表现得并不显著,而且较为震荡。


2. 截面动量效应

而截面动量效应则是指横截面上的动量效应,即过往业绩表现较好的品种未来会继续较好的表现,而较差的品种未来也会较差。所以,截面动量效应所考虑的是品种间的相对表现,而不是对单个品种在时间前后的绝对业绩表现,具体的对于动量效应来说,这种截面策略表现为做多在横截面排名相对靠前的(历史业绩相对较好的品种),而做空排名相对靠后的(历史业绩相对较差的品种)。

(1) 截面分组表现

首先需要讨论的便是截面上不同品种的排名是否真的能够区分开来,也就是说截面效应是否真的有效。为了查看分组对收益表现的影响,我们通过截面动量从大到小的排名进行分组,标记排名前20%为第一组,后20%为第三组,中间剩余部分为第二组,每个分组内的品种都选择做多。

我们随机选取参数组K=20,H=20,以展示截面动量效应的结果。我们看到回测收益确实能够通过分组得到较为明显的区分,说明存在着截面上的动量效应;否则如果区分不开各组的表现,就说明横截面上的因子不够有效。除此之外,我们也看到,不管那个分组在2016年以前表现为净值下跌、2016年表现为上涨而2017年又表现为下跌,这与前文中市场多头组合的表现结果较为相似,说明各分组的绝对表现受一定程度的市场因素所驱动。但是不同分组的相对关系却较为稳定,这是我们通过分组构建多头组合与空头组合的依据,说明了在该参数条件下动量因子确实能够明显地区分不同的品种,动量因子与品种的预期收益率具有一定的正向相关性。我们所构建的多空组合的另外一方面的原因是可以对冲掉一部分的单边风险,而且这样的多空组合做多资金量与做空资金量相等,故不存在严重的风险敞口问题,这是与前文所介绍的时间动量效应多空组合不一样的地方。

(2) 截面动量组合的参数敏感性

如果我们换一组参数以查看各分组的表现,却得到了不一样的结果。在K=40,H=40时,因子分组的区分效果就表现得不够明显了,这说明了截面动量效应的有效性是和参数的选取相关的。所以,我们便设置不同的持有期H及排序期K,查看该策略的参数敏感性表现,结果如上表和下表所示。其中表现最好的参数组合是K=15,H=35,可以获得7.86%的年化收益率(不加杠杆),夏普比率0.68,收益风险比0.79,最大回撤10.01%。 

(3) 对参数具有一定敏感性的原因

从参数敏感性的热度图中可以清晰地看到,截面动量因子的表现具有很强的参数敏感性。这是因为由不同的计算周期所得到动量特征表现结果不一,不同的品种的动量特征也会表现不一,所以在构建截面动量因子组合之后,组合的整体表现就会很强地受参数选择的影响。另外一个原因则和前文中提到的换手率的结论是一样的,即持有期的长度取值较低时,交易次数会很多,由交易成本带来的负面冲击也较大。故综合考虑之后,我们认为截面动量因子的有效性只存在部分参数区域内,较为合适的K值范围为10天左右,而H的合理取值范围为25天以上。

(4) 在大涨、大跌行情下不同持仓期的截面动量组合表现

根据前文所给出的多头市场组合的表现,2016年的商品市场整体表现强势,多数品种都呈现上涨,而2017年以来商品市场整体走势则较为“惨淡”。为探讨截面动量因子策略组合在大涨、大跌行情下的表现是否和持仓周期有关,我们便固定了K=15,而得到不同H的策略组合,回测结果如上图所示(起始净值全部归化为1)。在2016年的“普涨”环境下,截面动量组合的持有周期长度较短时,策略组合整体表现就越好,但需注意不是越短越好,因换手率也会越高。但是到了2017年之后,前期表现较好的参数却反而表现得相对较差,此时更好的周期长度是较长的持有周期长度。

(5) 截面比例系数

另外,一个需要着重讨论的地方是,多空组合的整体收益表现是否会受到截面比例的影响呢?截面比例决定了构建组合时所选取的多空品种的数量。所以我们仍以上述的参数组合K=15,H=35为例,选取了不同的截面比例系数进行测试。截面比例系数是个百分比,如果等于0.2(表示着等比例分为了5组),多空组合为做多前20%的品种同时做空后20%的品种。从下图的对比结果中我们可以看到,尽管截面比例系数较小时能获得更优的年化收益,但是由于所交易的品种数量太少,导致组合净值的波动性很大。

4.2、期限结构

商品期货合约的设置会有有不同月份的到期日,以满足投资者或套保者对不同时间期限的需求。而正是由于具有了不同的月份合约,不同月份的合约价格实际上反映出市场对不同到期时间的预期的变化。商品期货的期限结构(Term Structure)实际上就表现为市场对到期时间长度的敏感性,所以也被看做是商品的远期价格曲线。一般而言,假设有某持有商品现货的生产商,他们有自然性避险的需求,担心出现现货价格下跌的风险,因此他们更愿意在期货市场卖出期货合约而成为空头套保者,这样就会使得远期合约价格产生折价,这部分折价其实就是下跌风险所对应的风险溢价。此时,期货折价而现货溢价,也被称为期货贴水(Backwardation)该商品的期限结构呈现一条斜率为负的曲线。相反地,假如市场上不愿意持有现货更不愿意承担现货上涨的风险,那么期货就会表现为溢价,即升水(Contango),此部分溢价便是对承担上涨风险的补偿,而期限结构则表现为一条斜率为正的曲线,远期的期货价格高于现货价格。 

我们在前文曾列出了能够对商品供需关系产生影响的一些基本面因素,实际上在我们看来尽管这些基本面因素数量较多,但是在市场有效的背景下,它们却从不同的角度最终对该商品的期限结构产生影响,也就是说基本面因素的变化都会反映到期限结构上面来。比如说某商品的现货存量水平偏低,生产供应较为紧张而且下游需求旺盛,那么假如市场能够及时地吸收消化这些因素,并反映到期货价格上面,结果就是远期期货价格走高,期货升水,而且如果这种供需错配的关系越强,那么远期价格曲线就会表现地越陡峭;相反地,对于供过于求的市场环境期货价格就会走低,从而造成远期贴水的现象。所以,我们认为期限结构的变化源自于市场对基本面因素变化的反映。但是未来期限结构是如何变化呢?这是我们构建期限结构策略组合的关键。

(1) 不同品种的远期曲线

下图展示了上期所的铜品种的远期价格曲线的升水或贴水状况在几个时点上的表现。如果将铜历史上次月合约相对当月合约的升贴水比例统计出来的话,会发现这样的升贴水变换确实存在着均值回复的特征,并且表现得比较稳定。

除了铜之外,我们也对黑色系的螺纹钢及农产品系的大豆次月对当月的升贴水情况进行了统计,均发现了升贴水比例的平稳性及均值回复特性。根据我们前文中对期限结构的理解,不同方面的基本面信息最终反映在了期限结构(升贴水)上面了,如同在理性的股票市场当中,公司的基本面信息也都最终会反映到其PE值上面来。

(2) 升贴水具有回复特征的原因

商品价格理论指出影响商品期货价格的最直接因素是供给与需求,而供需格局不是一成不变的,而是在不断地产生你强我弱的交替变化。这种供需交替变化反映到期限结构上面来看的话,就是远期升水与远期贴水的周期性变动。关于为何升贴水的变动会呈现中性回复的特性,我们从两个方面来进行解释。(1)期限结构的变化和展期收益有关,具体来说,假设持有了期货多头,当出现远期贴水的期限结构(即市场表现为现货溢价、期货折价)时,进行展期收益(卖出近月合约买入远月合约)可以获得正收益,那么如果为了获得该展期收益大量的投资者的买入操作就会不断地抬高远期合约的价格,直到远期期货不再贴水;(2)和现货与存货之间的变动有关,大宗商品市场的平衡位置是期限价差和持有成本达成一致。如果商品市场因为存货量充足而使得出现现货溢价,那么将会有大量的存货涌入到现货市场中并打压现货价格,最终使得商品的期限价差和持有成本达成一致,甚至出现期货溢价的状态。从上述两个原因来看,期限结构的变化具有类似均值回复的特性。

(3) 不同方式计算的升贴水因子多空组合

所以,我们便可以利用该特点构建投资组合,做空远期升水比例较高的品种,做多远期贴水比例较高的品种。实际上,国外已经有众多的文献对升贴水因子做出了研究,Erb和Harvey(2006)、Gorton和Rouwenhorst(2006)以及Fuertes et al(2003)均利用了该期限结构因子构建了投资组合,结果也取得了不错的收益。

但是国内上市的很多期货品种具有明显的固定模中证500指数期货式的月份分布,比如大商所、郑商所大部分黑色、农产品、能化品种及上期所的镍、锡、橡胶等都是以1、5、9月合约为主力合约的,这可能和交易者的交易习惯及标的产品的生产周期有关,所以如果考虑以当月与次月合约之间的升贴水的话,可能对远期价格的升贴水情况把握地不够准确,因为有些远期曲线结构可能出现次近月与远月的升贴水情况刚好是相反的,就是说远期曲线结构是不平滑的。

所以,我们这里考虑以三种方式对升贴水比例进行计算:(a) 一种方式是次月合约对当月合约的升贴水比例,(b) 第二种是次主力合约对主力合约(或主力和次主力,考虑以到期日较远的合约对到期日较近的合约)的升贴水比例,(c) 第三种方式是主力合约对现货的升贴水比例。但不管是哪种计算方式,由于不同品种在计算时所用到的两个月份合约的到期日间距不同,故我们在截面上进行排序之前会先将各品种的升贴水比例统一到同一个时间窗口上,在实际计算时为了简便我们仅以交割月份之间的月份数作为到期日间距。在计算升贴水比例时,取的是各品种上一个持有期期末时点的相关数值。

(4) 主力与次主力合约所计算的升贴水因子表现更优

我们对三种方式所计算的升贴水因子均进行了参数敏感性的测试,结果(如上表)发现由第二种方式(主力合约与次主力合约间)所计算得到的升贴水因子的表现更加稳定,对持仓期长度的敏感性较低,而第一种(当月与次月之间)、第三种(现货与主力之间)所计算的升贴水因子的策略多空组合受持仓期的影响较为明显,但是基本上当持仓期在35天及以上时,敏感变化较为平稳,而且收益表现也较为不错。那么,为了对比三种方式计算的升贴水因子的有效性,我们选取H=30作为例子,查看此时不同方式计算得到的升贴水因子在各个分组的多头策略表现,结果如上图所示。能够非常明显地区分不同分组的升贴水因子是由第二种方式计算出来的。

我们分析之所以由第二种方式计算得到的升贴水因子的表现更好,是因为主力合约与次主力合约的流动性是同一个品种里最好的,那么较高的流动性意味着市场投资者的参与度也较充分,合约价格就越“理性”,因此远期价格曲线上由主力合约与次主力合约所计算出来的价差就越接近“真实”的价差,而其他流动性特别差的合约由于市场参与度不高,定价不够“准确”,故所计算出来的价差不能够真实反映期限结构。当月、次月合约对于某些品种来说流动性很差,所以当月、次月之间的跨期价差也不够完全“真实”;同样地现货价格数据又受到地区的限制,故也不够特别准确地反映出“真实”的期现基差。

另外,对于第一种和第三种方式得到的升贴水因子,之所以持仓期的长度越长,组合收益越好也越稳定,这是因为升贴水的回复周期较长,选取较长的持仓周期能够凸显由升贴水因子所带来的正效益。

(5) 采用时间序列平均的升贴水因子

在计算升贴水比例时,我们取的上一个持有期期末时点的相关数值进行计算的,但是由于升贴水比例在短期内也会呈现小幅波动,所以我们以排序期K为参数,取T时刻之前K内的升贴水比例的平均值,然后再对各个品种进行排序。我们以第一种计算升贴水的方式为例,以对比查看新的方式带来怎么样的改变。结果如上图图表所示,尽管采用平均的方式有一定的延迟性,但是却剔除了噪音带来的波动,增加了一定的稳定性。当计算周期长度K超过20天时,能够显著地改善第一种方式的组合收益,尤其是K在25到35天之间时,这种改善效果尤为突出。

下图展示了H=35时,之前(采用持有期末时点的值)与新方式(取K期期内的平均值,K=30)之间的净值对比表现。新的方式获得了9.58%的年化收益率,以前20%和后20%构建多空组合话,结果发现多空组合的净值一直表现较为稳定,年化收益率达到10.8%,夏普比率1.10,收益最大回撤比0.92,最大回撤10.4%。

4.3、异质波动率

异质波动率因子也是最早从对股票市场的研究中挖掘出来的因子,它实际上是对无法被三因子或其他因子所解释的那部分超额收益的波动情况的描述。Ang et al (2006)通过对NYSE、NASDAQ等股票进行Fama-French三因子模型线性回归钢铁期货行情并得到残差项的标准差作为股票相应的的异质波动率,实证结果发现与理论结果相悖的“异质波动率之谜”,即异质波动率与预期收益呈负相关关系。而Miffre et al. (2012)以及Fuertes et al (2013)也尝试挖掘了商品期货市场上的异质波动率与期货未来收益之间的关系,并构建了相应的策略组合,且获得了较为显著的策略收益。因为商品期货收益不能使用三因子模型进行分解,他们借助于CAPM模型,利用标普高盛商品指数(S&P-GSCI)计算的商品的无法被指数所解释的剩余部分的标准差作为异质波动率,然后做多具有较小异质波动率的品种,做空异质波动率较大的品种。

因此如果对国内商品的异质波动率进行统计的话,首先需要确定商品指数的选择。国内由于交易所之间的一些限制暂时并没有推出一个官方的商品指数,而Wind数据库提供了一个通过自有算法得到的商品指数CCFI,该指数只考虑每个品种的主力合约,而权重是根据各品种的持仓额的比重来确定的。所以,我们就采用该商品指数对各品种排序期内的收益率进行线性回归,并计算回归后的残差的标准差作为当期的异质波动率。

 如上面的两个不同参数条件下所得到的分组多头策略的表现所示,实际我们对多个参数都做了类似的检验,从结果上来看我们并不能完全地肯定异质波动率存在着明显的有效性,因为从截面的异质波动率的排名并不能非常有效地区分出未来具有潜在收益的期货品种,也就是说商品期货市场当中的异质波动率之谜并不存在,我们也无法证明利用商品指数对期货品种进行归因后的所剩余部分存在且有效。

为此,我们也尝试从实际回测结果的角度来查看因子是否有效,于是就构建了相应的多空组合,做多IV值较小的期货品种而做空IV值较大的期货品种,结果发现异质波动率策略组合不仅仅参数不敏感,而且几乎收益均接近于0(最大的年化收益率仅为0.63%,夏普值为负值),也就是说我们无法通过异质波动率来对期货品种进行有效的筛分并得到超额收益。我们认为原因可能在于各个商品间的相关性较低,导致商品本身无法被市场指数所解释。

4.4、其他技术指标

除了上述几个在文献中已被证明国外市场中有效的因子之外,我们也挑选几个技术型因子,来探讨各因子的有效性。

1. STD

STD是收益率的标准差,是排序期内收益率序列的中心二阶炬。STD做为一种统计量,其对波动性的衡量是基于中心极限定理和大数定律的,所以STD的计算周期就相较其他指标偏长,短则1个月,长则半年甚至1年。而对这个技术型因子有效性的考察,则跟之前一样,首先选择两组不同的参数对(以K=20,H=20和K=180,H=40为例),在该条件下通过分组的多头策略来查看是否能够通过该因子显著区分出不同的品种,结果如下图所示。

从分组的多头策略表现来看,STD对于区分品种来说并不是那么突出,尤其是在STD的计算周期偏短的时候,说明STD在较短周期上无法有效地对品种进行区分,因此也就没有产生较为稳定的多空收益。在STD计算周期较长时,如上图所示例子中K=180,基本上前20%、中间部分及后20%的品种之间的差异就稍微明显一些,但是差异的表现却不够稳定,这一点从其对应的净值图上面也有所反映。

下面的图表展示了STD作为因子所构建的策略组合的年化收益率,对不同参期货技巧数的敏感性表现。我们也可以看到基本上这个策略所得到的组合年化收益的绝对值较小,在合适的K值区域内(K超过140天),该策略最优的组合年化收益率仅2.87%。而且,如前面净值图所示,STD因子在不同的大行情下表现不一,故我们认为该因子并不有效、稳定。

2. Skew

偏度Skew是排序期内收益率序列的中心三阶矩,实际上衡量了排序期内收益率分布的左偏或右偏的幅度。偏度表着征收益率分布呈现不对称,如果是收益率分布的重尾在右侧时,偏度值为正,数值越大说明偏得越厉害;而如果分布的重尾出现在左侧时,偏度值为负,且数值越小说明偏得越厉害。和STD的计算一样,该指标作为一种统计量,其计算周期也应该长一些。一般情况下偏度值在一定周期上具有均值回复特征的,因为如果偏度值过大或者过小的话,未来有很大的可能会往偏度为0即对称的位置回复,因此偏度应该是个反向指标。所以,我们在构建的多空组合时应该做空偏度值较大(右偏较严重)的品种,而做多偏度值较小(左偏较严重)的品种。

但是该因子在不同参数条件下的实际分组表现如何呢?如下图所示,我们采取了两组参数,一组是K=20,H=20,前20%的组合与后20%的组合之间的差异却不够明显,另一组是K=140,H=40,较为稳定的差异却仅仅出现在2016年以后。值得注意的是,这里偏度值是在截面上的比较,并非绝对的概念,所以可能存在截面上各品种都是右偏的但仍然做多右偏得不严重的品种的情况。

综合考虑不同参数条件下分组的表现以及多空组合的净值表现,我们认为Skew和STD因子一样的是,当计算周期较长时(超过140天),开始变得有效,但这种有效性却在特定的市场环境下(2016年以来)更加地突出。为此,我们构建了多个参数条件下的Skew策略组合,如下面的图表所示。结果佐证了上述的结论,同时我们也发现K更适用的范围是40-160天,而且此时Skew策略组合受持仓长度的影响相对较小。所以,我们认为Skew因子在特定的条件下较为有效,在后续构建多因子组合时可以选取K=140-160的Skew因子。

3. MAcrossover

MAcrossover也是一种描述趋势型的因子,指的是快、慢均线之间的偏差度。我们对该因子的具体计算方式如下,其中慢速均线周期是快速均线周期的2倍,

上面的式子是快线相对慢线的偏差,如果该值越大说明快速均线在慢速均线之上且相对偏差较大,说明这个时刻趋势向上的力量较为强劲,所以应该做多该品种;而如果该值越小则说明快速均线在慢速均线之下的相对位置较远,这时说明向下的趋势较强,故做空该品种会更合适。所以该因子实际上是一种对短期趋势的判断的指标。

在实际回测时,我们所采用的快速均线的周期长度为5天,而慢速均线的周期为10天。从上面图中的不同分组的多头策略结果来看,排序之后的分组还是能够较明显地区分出有不同收益预期的品种。因此,我们同样地构建了多空组合,做多MAcrossover的值相对较大的品种而同时做空该值相对较小的品种,并对不同参数条件都进行了回测,回测结果如下图所示。我们发现排序期长度K=10的时候(快速均线周期为10天,慢速为20天)结果较为突出。我们也看到持有期长度对结果的影响也很大,也就是说MAcrossover因子太过于依赖周期长度了,敏感性特别高。

另外我们根据下图的结果,将持有期、排序期超过25天该因子构建反向的“空多”组合(做空前20%,做多后20%),却同样没有得到组合年化收益率显著为正的结果,说明在该条件下即使把MAcrossover认作反向指标也无法得到显著的收益。总体来说,MAcrossover参数敏感性太高,我们暂不认定它是稳定有效的因子。



4. RSI

RSI是相对强弱指标(Relative Strength Index),其计算方式很简单,N日内累计的上涨幅度值 / N日内累计上涨幅度与累计下跌幅度之和,该指标的原理就是用涨跌幅的方式简单地衡量市场中多方力量和空方力量。该值如果超过50%,说明前N日的涨幅比重较大,侧面反映市场多方力量较强,而相反地如果该值低于50%,则说明市场中的空方力量较强。由于RSI指标存在最大值100%与最低值0的上下界限,所以一般情况下,投资者都会将该指标做为反向指标,并认为当RSI超过80%市场就处于超买状态,未来大概率会出现下跌,而当RSI低于20%的时候市场处于超卖状态,未来可能出现上涨。但是市场在出现拐点的时候,RSI的值并非总会出现[20%,80%]之外,而大部分的时间内RSI都是处在[20%,80%]之内的,那么这么看来,实际上RSI在不考虑阈值的辅助判断时,我们是可以将它视为一种描述市场趋势的指标。举例来说,当市场经历了多空博弈之后,多方力量稍占上风时,RSI指标可能刚刚超过50%(或者说开始了增大的势头),所以这时候RSI反映着市场的上涨趋势,未来该品种可能会大概率再上涨,构建组合时应做多RSI相对较高的品种做空RSI相对较低的品种。

我们通过RSI在截面上的表现来查看分组的多头策略的表现,如下图所示,参数组合分别选取了K=20,H=20以及K=40,H=40。结果显示RSI和前文的Macrossover的结论比较类似,截面RSI值排名前20%的组合表现与后20%的组合表现之间的差异,在K与H偏小的时候表现稍微明显一些,而在K与H偏大的时候则表现模糊。但是因子的有效性最终还是要通过回测收益来表现,所以我们构建不同参数条件下的多空组合以查看因子的敏感性。

RSI因子的参数敏感性也比较类似于MAcrossover因子以及之前动量因子,整体来看,表现较好的策略组合的排序期参数较小,而持有期长度的影响规律不够明显,说明策略组合对它的敏感性最强。综合考虑之后,我们认为该因子和MAcrossover一样,由于对参数有很强的敏感性,没有较为稳定的表现,不适合被采用到有效因子的范围内。

5、多因子组合构建

到目前为止,关于截面因子的考察,我们对包括动量、升贴水、异质波动率、STD、Skew、MAcrossover、RSI这些指标进行了分析,有些因子是同向指标而有些则是反向指标,但发现有关基本面变化的升贴水因子的有效性最为明显,其次是衡量趋势的动量、MAcrossover及RSI因子,但MAcrossover、RSI对参数太过敏感,另外统计发现Skew因子在特定的计算参数下表现也较为稳定,而总终被我们认为不适合才用到多因子当中的还有STD及异质波动率因子。我们这里就将目前已经测试出的这些有效的因子综合到一起,构建多因子组合,而构建的方法也是多因子选股模型中较常用到的打分法。

具体地,

(1) 在持有期开始时,首先得到可交易的期货品种。

(2) 然后计算各个品种在对应的排序期内的因子表现,其中因子包括动量因子、主力与次主力之间的升贴水因子、计算周期为160天的Skew因子。

(3) 对每个因子进行排序,升贴水因子、Skew因子为从小到大排序,而动量因子为从大到小排序,并记录排序的序号,序号相当于打分,分数越低表示越应该做多,而分数越高表示越应该做空。

(4) 将每个品种在每个因子上的序号(分值)加和起来,之后再次进行从小到大的排序,做多排名靠前的品种,做空排名靠后的品种。这里选取构建多空组合的截面比例仍为20%。

打分法在汇总计算时其实是对不同的因子采取相等的权重,但是我们知道从单因子组合的角度来看,升贴水的表现特别突出,所以实际上在用打分法构建多因子组合的时候还可以适当地增加升贴水因子的打分比重,以增加升贴水因子对多因子组合的作用。如下面的表所示,当增加了升贴水的权重之后也确实能够提升组合的收益和夏普比率。

因为可被使用的因子包括动量因子、升贴水因子和Skew因子,所以我们依次尝试不同的因子组合,考察它们在不同的持有周期H上的表现会如何,回测年化收益率、夏普比率的结果如上表所示。

另外一个方面,在之前的策略当中,得到多空信号之后给每个待交易的品种分配了相等的资金权重,但实际上该权重的分配也是可以进行调整的。一种较常用的方式便是根据不同品种历史波动率的表现来分配权重,结果我们发现以各品种收益率的历史波动率为权重是能够提升整个组合的收益,而以该波动率的倒数为权重的话则反倒并没有提升整个组合的表现。

整体来看,多因子(至少两个因子)组合的表现均比单独一个因子的策略组合表现得更好,而且多因子组合普遍在持有期较长(超过30天)的时候表现得更好一些。表现最好的是动量因子、升贴水因子和Skew因子三个有效因子所构建的组合,持有期长度为50天,该组合获得的年化收益率在不加杠杆时为11.7%,夏普比率1.21,收益最大回撤比1.24,最大回撤9.41%。

最后,我们讨论一下策略组合的“起始日效应”。由于我们构建组合的方式是采用Jegadeesh和Titman最早提出的持有期H和排序期K的方式,而并非我们在选股模型中较常用的固定一个月的月度调仓模式,因此我们的策略回测结果必然会受到回测时所设置的起始日的影响。

我们以前文中得到的最好的三个因子的多因子策略组合为例(H=50),选择自2011-1-4之后的不同的起始日日期进行回测对比。从下面的图中可以看出,在同样的条件下,不同的起始日对组合表现的影响还是比较明显的。我们选择后延的方式,来重新进行回测,如果后延1天,那么起始日为2011-1-5,以此类推。由于持有期长度为50天,所以共有50种起始日日期的区别。

如上图所示,结果显示组合净值的表现差异还是挺明显地,但并不是换了起始日期之后就一定比原始组合的表现更差了。组合的表现会随起始日不同表现不一,这是和持仓品种行情周期有着很大的关系。

那么如何避免起始日效应呢?其中一种方法是构建组合的时候,等长度地挑选全部或者部分持有期期内的各个日期进行建仓,并保证每个建仓点位所分配的资金量相等。比如H=50并打算等量分配10份资金,那么就可以从最开始每5天就拿其中一份资金进行建仓。这样的方法可以对冲掉因起始日日期不同而造成的波动风险。


6、总结


市场如果完全有效的话,那么我们用何种方式构建的投资组合几乎都无法跑赢根据市场大小作为权重而构建的简单组合(或者全市场指数),因此超额收益alpha或许就不存在,即使短期内发现了alpha但也无法保证长期仍然有效。但是实际情况是我们总能找到一些除了Fama=French三因子之外的其他有效因子,并通过因子的表现对股票进行配置来得到alpha收益。那么对于期货品种来说,我们是否也可以通过组合配置来获取超额收益呢?但是相比于A股市场庞大的股票数量而言,期货市场目前已上市交易的仅有40多种,剔除掉某些交易活跃度非常差、流动性非常不足的品种之后,剩下的可进行组合配置的品种更少了。但是尽管如此,由于期货品种本身的波动性较大且易受供需基本面、市场参与者情绪等因素的影响,使得我们仍然可以根据期货各品种的因子表现情况来进行配置。而且期货品种有个优势的地方在于,可以直接对品种做空获取因子的超额收益,而配置A股组合则需要根据组合特点选择对应的股指期货做空。

商品期货中的基本面因子主要来自于是和商品供需相关的库存、航运、销售、天气等方面的数据,但这里我们暂只考虑商品的升贴水因子,这是因为任何的基本面信息实际上最终都会通过市场交易行为反应到远期曲线上来,一般而言对于有上涨预期的品种来说其远期曲线为升水,对于有下跌预期的品种则表现为贴水。我们统计了不同品种的升贴水序列,发现非平水的远期曲线是具有一定回复力的,因此该因子实际应作为反向指标,即我们会选择做空升水较重的及做多贴水较重的品种。从历史回测来看,基本面因子受持有期与排序期的影响较小,而且超额收益表现持续稳定。

对于技术型的因子而言,我们主要对动量因子、异质波动率因子及一些其他的由价量数据得到的技术型因子进行了分析讨论,其中动量因子及异质波动率因子在Moskowitz等人对国外商品市场的研究结果中表现得较为有效而且稳定。但是在我们对应的研究中发现,动量效应仍然在国内市场中存在,而异质波动率就不再有效了。关于动量效应,我们利用经波动率调整过的收益率序列进行了不同平移窗口下的线性回归,以讨论在什么条件下收益率序列存在着较为显著的相关性。结果我们发现,在窗口长度较低的时候,t统计值的平均标为为正,说明在短期内存在正相关,这种收益率序列的正相关恰恰说明了短期内可能会具有一定的趋势,那么由价格信息所推导出的动量因子、MAcrossover因子及RSI在一定的周期参数条件下才会变得有效。

另外,尽管我们在前文大部分的回测时没有提及,但是对于由Jegadeesh和Titman所提出方法所构建的组合都会存在着起始日的影响,因为不同持有期长度的调仓日期不同,因此就导致组合的回测收益会发生改变。我们提出克服这种因起始日不同而造成的潜在风险的最好办法是,将资金等权地分配到由不同的起始日开始的组合上。

整体来看,期货品种上阿尔法因子配置型的组合策略有着稳定、持续等优势,但是也有着一定的劣势,如开仓起始日的影响。对于接下来的工作,我们除了会对阿尔法策略再做更加深入的研究分析之外,也将尝试探索期货市场中的风险因子配置策略。

感谢东方证券研究所首席分析师朱剑涛的指导与帮助。


7、参考文献

1. Jegadeesh N., & Titman S. (1993). Returns to buying winners and selling losers: Implications for stock market efficiency. Journal of Finance, 48, 65--91.

2. Miffre J., & Rallis G. (2007). Momentum strategies in commodity futures markets. Journal of Banking and Finance, 31, 1863-1886

3. Shen Q., Szakmary A., & Sharma S. (2007). An examination of momentum strategies in commodity futures markets. Journal of Futures Markets, 27, 227-256.

4. Szakmary A., Shen Q., & Sharma S. (2010). Trend-following strategies in commodity futures: A re-examination. Journal of Banking and Finance, 34, 409-426.

5. Moskowitz T.J., Ooi Y.H. & Pedersen L.H. (2012). Time series momentum. Journal of Financial Economics 104 (2): 228–250

6. Erb C., & Harvey C. (2006). The strategic and tactical value of commodity futures. Financial Analysts Journal, 62, 69-97.

7. Gorton G., & Rouwenhorst G. (2006). Facts and fantasies about commodity futures. Financial Analysts Journal, 62, 47-68.

8. Fuertes A.M., Miffre J., & Rallis G. (2010). Tactical allocation in commodity futures markets: Combining momentum and term structure signals. Journal of Banking and Finance, 34, 2530–2548.

9. Miffre J., Fuertes A.M., & Fernandez-Perez A. (2012). Commodity futures returns and idiosyncratic volatility. Working paper.

10. Ang A., Hodrick R. J., Xing Y., & Zhang X. (2006). The cross-section of volatility and expected returns. Journal of Finance, 61, 259-299.

 


下一篇:2017年7月12日期货明星品种操作策略 上一篇:2017.7.12青石看盘 商品期货操作建议