这是清华大学2024秋季学期金融大数据课程的期中项目,内容是复现研报【华安金工】市场日内动量——“学海拾珠”系列之八
的内容,以下是对这份研报的一部分的理解、实现步骤以及一些主要公式的呈现
graph
A[当天的前半小时的数据]
B[前一天的收盘价]
C[当天的前半小时的收益率]
D[当天的后半小时的收益率]
A-->C
B-->C
C-->|显著的正相关|D
- 非高频调仓
- 信息接收延迟 这两个因素导致了首个半小时和最后半小时交易的方向相同,使得收益率呈现正相关
利用日内动量进行的择时策略和均值-方差资产配置策略也可以带来理想收益。
使用实训平台的接口获取数据,对每支股票进行分析,时间范围为2021到2023三年
- 数据量较小的,在相关官方金融网站上人工查找、筛选、存档
- 数据量较大的,脚本爬取
graph TD
A[计算得到日内收益率]
B[筛选数据]
C[筛选出ST/退市的股票]
D[忽略NaN的数据]
E[进行复权操作]
F[处理特殊数据]
G[高成交量股票]
H[特殊日期情况]
A --> B
B --> C
B --> D
C --> E
D --> E
E --> F
F --> G
F --> H
对于每一支股票的每一天数据,清洗之后,取出编号为1,7,8的收益率加入到这支股票对应的列表r1
,r7
,r8
中,分别运用model1和model2拟合,获取相关数据
graph TD
A[获取全部股票的stock_code]
B[清洗数据]
C[获取列表r1,r7,r8]
D[拟合模型,获取R2]
E[一个列表,包含了每支股票对应的R2]
F[绘制分布图]
A-->|对于某支股票|B
B-->C
C-->D
D-->|循环|B
D-->|汇总输出|E
E-->F
获取相关金融信息,然后对金融信息和R2进行双向的作用分析
分析r1的正负对于相关性的影响,以及分析模型对于不同金融产品的稳定性
对比分析了多种模型的R2,分析相关模型的效果