机器学习算法库,主要涉及:分类、回归、聚类(GMM)、主题模型、词(文档)向量、时间序列分析等方面。
###目前提供的binary包括:
- topic model (
lda
,hlda
,xlda
) - logistic regression(
lr
) - gradient boosting decision tree(
gblr
) - word2vec(
w2v
), doc2vec(d2v
) - clustering(
k2d
,kmeans
) - ...
###时间序列分析中主要涉及了:
- 时序比较(dp based methods)
- 时序平滑及异常点检测(loess)
- 时序断点检测(breakout)
- 时序数据集字典发现(pattern)