Pinned Repositories
analyzer-profile
多种分词器的封装,重点修改了原IK/MMSeg4j分词器,增加分词器对象共享池和Lucene/Solr封装,其中Lucene/Solr版本为5.5.0。
chinese-corpus
中文相关词典和语料库。
datamining-18algorithms
数据挖掘十大算法Java实现。
HanLP
HanLP项目修改,主要是为了可以在Maven下引用,引用该作者的项目,在此表示致谢。
kmeans-cluster
K-Means聚类算法的分布式实现。
naive-bayes
Naive Bayes基本实现以及分布式实现。
negative-sentiment
基于词典的负面舆情信息评分算法。
phrase-finding
新词发现分布式机器学习算法。
reddims-pca
主成分分析多语言实现、分布式实现,以及示例。
semantic-similarity
语义、情感、相似度分析。
ml-distribution's Repositories
ml-distribution/gibbs-sampling
Gibbs采样分布式算法实现。
ml-distribution/hdfs-affinity
Pairwise Affinities on Hadoop。
ml-distribution/graph-theory
图论相关算法的分布式实现。
ml-distribution/gradient-descent
随即梯度下降(Stochastic Gradient Descent)算法,基于分布式的实现。
ml-distribution/generic-algorithm
遗传算法分布式实现。
ml-distribution/ML_for_Hackers
Code accompanying the book "Machine Learning for Hackers"
ml-distribution/r-ninja
R语言忍者秘笈