/dHydra

股市量化交易分析框架,数据获取(新浪level2, 逐笔数据),tushare接口的mongodb存储解决方案

Primary LanguagePythonApache License 2.0Apache-2.0

dHydra - 量化九头蛇 二次开发框架

github页面https://github.com/Emptyset110/dHydra

**二次开发文档:**http://doc.dhydra.org

**问答社区:**http://www.dhydra.org

dHydra数据QQ群:458920407

传送门:如果是为了新浪Level2 10档盘口和逐笔推送实时行情来到这里的 直接参考:http://doc.dhydra.org/built-in-producers/sinalevel2ws.html

使用对象

  • 正在学习使用python进行数据分析/数据挖掘的同学
  • 对金融市场进行大数据分析的企业和个人
  • 量化投资分析师(Quant)

运行环境

  • python 3.4以上 (开发环境Ubuntu 15.10, python 3.5),不对python2.7提供支持,多版本虚拟环境安装请参考安装dHydra文档
  • mongodb 3.2

快速开始

部署

  • 从github下载源码的方式 将dHydra文件夹复制到你的工作区域(Workspace),你的目录结构应该是这样的——
dHydra工作区域
├─ <空>           自动生成框架目录前是空的
└─dHydra          框架核心目录(如果是采用pip安装,则工作目录下不需要有它)
    ├─            auto.py
    ├─            app.py
    ├─            core
    ├─            action
    └─            等等
  • 用pip安装的方式
pip install dHydra

更新到最新版本

pip install dHydra --upgrade

在你的workspace运行python脚本

import dHydra.auto as auto
auto.init()  # 新建目录结构
# 生成的app.py中默认运行的是PrintSinaL2(即打印新浪level2数据的action)
# ---
# 或者新建Demo来演示action与producer之间的流程——
auto.new_producer("Demo")
auto.new_action("Demo")
# 然后将app.py中的PrintSinaL2改为Demo

运行

在命令行下运行app.py

python app.py


Question & Answer

Q:为什么你这个代码写得乱成一陀屎啊,看着好烦啊?[2016-03-22]

我本来以为随便封装一两个API,写个mongodb存储过程就可以了。所以也没有用什么设计模式,类的设计和框架结构也没有做好。

目前正在想办法改进一下架构,让数据更加模块化,同时把生产者(数据产生)和消费者(策略使用)分离开来。

[2016.04.10 更新]

终于更新了版本,分离了数据获取和数据处理的模块,现在dHydra是一个二次开发框架了。详情请参考二次开发文档:http://doc.dhydra.org

Q:为什么已经有类似tushare这样的数据获取的项目,vnpy,easytrader等自动化交易框架,而你还要另外做一个dHydra?[2016-03-22]

唔,tushare确实是提供了很不错以及相当多的财经数据来源。在使用tushare的过程中我发现如果不做本地存储的话许多重要的功能是无法实现的(例如需要维护一份股票列表和基本面数据)。另外一方面是tushare和其他几个框架并没有获取level2数据的接口。

vnpy是一个很不错的量化交易框架(其中的事件引擎值得学习),easytrader的主要功能是在接入自动化交易券商上。不过dHydra并没有打算往“自动化交易”发展,只是想为量化交易提供数据分析方便。毕竟数据清洗,特征提取,机器学习算法的应用才是重点。

在必要的时候(在量化算法的部分做好的时候),我也会直接引用easytrader的券商连接方式,而不重复造轮子。

Q:所以你是打算抄vnpy和PyAlgoTrade,这你不否认了吧?[2016-03-22]

嗯,你说得不错

[2016.04.10 更新] 额,当然就目前的情况来看,似乎架构上还是和vnpy很不同的。

Q:我感觉你是个相当无聊的人!

不会啊,我还是很萌的好吗!


版本更新

  • ver 0.9.0 04-10-2016

    1. 突然就跳版本了。dHydra原本不是一个框架只是一些API,现在做成了一个二次开发框架了。
    2. 二次开发的文档请查看:http://doc.dhydra.org
  • ver 0.2.14 03-23-2016

    1. 解决了sina_l2_hist内存占用过高的bug
    2. 为sina level2原始数据添加了解析函数
  • ver 0.2.6 03-11-2016

    1. 将SinaFinance类在Stock类中实例化
    2. 增加猫眼电影数据
  • ver 0.2.0 03-08-2016

    1. 增加了新浪Level-2数据推送功能(包含实时10档盘口与Level2逐笔交易明细)
  • ver 0.1.0 02-22-2016

    1. dHydra第一个版本,包括获取基本数据与实时数据,导出csv接口