Codes and documents of the competition held by HOUFANG Investment
要求:
- 提供完整的选股逻辑和分析过程;
- 采用机器学习的方法,进行因子优选,构造多因子选股策略;
- 策略分析包括样本内和样本外,覆盖时间足够长,建议从 2005 年开始分析;
- 股票数量需要 50 只以上,同时可以分析每期持股数量 20,30,50,100 的情况;
需要更改项目进度可以点进编辑,然后在- []
里面写x,即- [x]
,就会变成已完成
示例:
- [x] 泳池派队
- 泳池派队
-
数据预处理
- 准备因子数据集
- 根据因子表现完成因子筛选
- 特征工程进行因子的进一步筛选
-
模型构建
- 机器学习模型构建
-
模型优化
-
策略回测与评估
-
研究报告
项目结构如下
├─factor_data 从数据库中获取的数据文件
│ ├─data_cleaned 清洗后的数据文件
│ │ └─README.md 见描述文件
│ ├─eod_price.gz 股票日行情数据
│ ├─basic_xx.gz 基础类因子数据
│ ├─value_factor.gz 价值类因子数据
│ ├─fa_factor.gz 财务与质量类因子
│ ├─trade_factor.gz 情绪类因子
│ └─risk_factor.gz 风险类因子
├─test_data 用来回测(与测试)的数据
├─code 项目代码
│ ├─factor
│ │ ├─因子清洗.py 对因子进行清洗
│ │ ├─get_data.ipynb 基于wind和joinquant数据库的数据提取
│ │ ├─factor_analysis.ipynb 因子分析
│ │ ├─LSTM 长短期记忆人工神经网络有关代码
│ │ └─backtesting.py 回测文件
│ ├─机器学习
│ └─项目优化
├─report 项目研究报告
└─README.md 项目整体描述文档