利用机器学习算法预测沪深300与中证500的强弱
-
策略**
首先对中证800的成分股,按照因子值进行降序排序,对排名为前50名的成分股的日收益率取平均作为“因子收益率”,对m个因子采用上述操作,得到输入$${\bf {X= (x_1, x_2, ..., x_n), x_t }} =(x^{(1)}_t, x^{(2)}_t , ..., x^{(m)}_t)^T$$
用沪深300的日收益率减去同一天中证500的日收益率,得到两者的收益率之差,大于等于0标记为1,小于0标记为-1,得到输出
$$\bf Y=(y_1, y_2, ... , y_n)$$ 运用${\bf {x_t}}$预测$y_{t+1}$:
$$f({\bf {x_t}}) \rightarrow y_{t+1}$$ -
涉及的因子
(1)具有明确的方向的因子,如因子值越大越好的因子:最近12个月净资产收益率(roe_ttm), 净资产收益率增长率(roe_growth ),企业价值乘数( ebit2ev), 最近12个月市盈率倒数(ep_ttm), 最近报告期市净率(bp_lr)
(2)方向不明确的因子:周收益率、一个月动量、12个月动量、波动率、振幅、对数市值、成交量
对于方向不明确的因子,可以考虑取因子值排名后50名的成分股的日收益率作为“因子收益率”
-
算法
Logistic回归,训练集大小1000-1500,测试集150-250,k折交叉验证优化参数
-
数据处理
对特征进行标准化,并删除训练集中日收益率过小的样本
-
策略**与数据
采用一样的**,不过将特征数据换成了Barra的十个风格因子:
Beta, Size, Momentum, Residual Volatility, None-linear Size,
Value, Liquidity, Earning Yield, Leverage, Growth
-
算法
SVC,网格搜索
最长回撤期,最大回撤,年化收益率,Calmar比率,夏普比率,胜率