GitHub上最流行的28个开源机器学习项目
- TensorFlow
GitHub项目地址:
https://github.com/tensorflow/tensorflow
TensorFlow是谷歌发布的第二代机器学习系统。
- Scikit-Learn
GitHub项目地址:
https://github.com/scikit-earn/scikit-learn
Scikit-Learn是用于机器学习的Python模块,它建立在SciPy之上。
- Caffe
GitHub项目地址:
Caffe是由神经网络中的表达式、速度、模块化产生的深度学习框架。
- PredictionIO
GitHub项目地址:
https://github.com/PredictionIO/PredictionIO
PredictionIO是面向开发人员和数据科学家的开源机器学习服务器。它支持事件采集、算法调度、评估,以及经由REST APIs的预测结果查询。
- Brain
GitHub项目地址:
https://github.com/harthur/brain
Brain是JavaScript中的神经网络库。
- Keras
GitHub项目地址:
https://github.com/fchollet/keras
Keras是极其精简并高度模块化的神经网络库,在TensorFlow或Theano上都能够运行,是一个高度模块化的神经网络库,支持GPU和CPU运算。
- CNTK
GitHub项目地址:
https://github.com/Microsoft/CNTK
CNTK(Computational Network Toolkit )是一个统一的深度学习工具包,该工具包通过一个有向图将神经网络描述为一系列计算步骤。
- Convnetjs
GitHub项目地址:
https://github.com/karpathy/convnetjs
ConvNetJS是利用Javascript实现的神经网络,同时还具有非常不错的基于浏览器的Demo。
- Pattern
GitHub项目地址:
https://github.com/clips/pattern
Pattern是Python的一个Web挖掘模块。
- NuPIC
GitHub项目地址:
https://github.com/numenta/nupic
NuPIC是一个实现了HTM学习算法的机器智能平台。
- Theano
GitHub项目地址:
https://github.com/Theano/Theano
Theano是一个Python库,它允许使用者有效地定义、优化和评估涉及多维数组的数学表达式,同时支持GPUs和高效符号分化操作。
- MXNet
GitHub项目地址:
MXNet是一个兼具效率和灵活性的深度学习框架。它允许使用者将符号编程和命令式编程相结合,以追求效率和生产力的最大化。
- Vowpal Wabbit
GitHub项目地址:
https://github.com/JohnLangford/vowpal_wabbit
Vowpal Wabbit是一个机器学习系统,该系统推动了如在线、散列、Allreduce、Learning2search、等方面机器学习前沿技术的发展。
- Ruby Warrior
GitHub项目地址:
https://github.com/ryanb/ruby-warrior
Ruby Warrior通过设计了一个游戏使得Ruby语言和人工智能学习更加有乐趣和互动起来。
- XGBoost
GitHub项目地址:
https://github.com/dmlc/xgboost
XGBoot是设计为高效、灵活、可移植的优化分布式梯度Boosting库。它实现了Gradient Boosting框架下的机器学习算法。
- GoLearn
GitHub项目地址:
https://github.com/sjwhitworth/golearn
GoLearn是Go语言中“功能齐全”的机器学习库,简单性及自定义性是其开发目标。
- ML_for_Hackers
GitHub项目地址:
https://github.com/johnmyleswhite/ML_for_Hackers
ML_for_Hackers是针对黑客机器学习的代码库,该库包含了所有针对黑客的机器学习的代码示例(2012)。
- H2O-2
GitHub项目地址:
https://github.com/h2oai/h2o-2
H2O使得Hadoop能够做数学运算!它可以通过大数据衡量统计数据、机器学习和数学。
- neon
GitHub项目地址:
https://github.com/NervanaSystems/neon
neon是Nervana基于Python语言的深度学习框架,在诸多常见的深层神经网络中都能够获得较高的性能,比如AlexNet、VGG或者GoogLeNet。
- Oryx 2
GitHub项目地址:
https://github.com/cloudera/oryx
开源项目Oryx提供了简单且实时的大规模机器学习、预测分析的基础设施。它可实现一些常用于商业应用的算法类:协作式过滤/推荐、分类/回归、集群等。
- Shogun
GitHub项目地址:
https://github.com/shogun-toolbox/shogun
Shogun是一个机器学习工具箱,由Soeren Sonnenburg 和GunnarRaetsch(创建,其重点是大尺度上的内核学习方法,特别是支持向量机SVM(Support Vector Machines)的学习工具箱。
- HLearn
GitHub项目地址:
https://github.com/mikeizbicki/HLearn
HLearn是由Haskell语言编写的高性能机器学习库,目前它对任意维度空间有着最快最近邻的实现算法。
- MLPNeuralNet
GitHub项目地址:
https://github.com/nikolaypavlov/MLPNeuralNet
MLPNeuralNet是一个针对iOS和Mac OS系统的快速多层感知神经网络库,可通过已训练的神经网络预测新实例。
- Apache Mahout
GitHub项目地址:
https://github.com/apache/mahout
Mahout是Apache Software Foundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。
- Seldon Server
GitHub项目地址: https://github.com/SeldonIO/seldon-server Seldon是一个开放式的预测平台,提供内容建议和一般的功能性预测。
- Datumbox – Framework
GitHub项目地址:
https://github.com/datumbox/datumbox-framework
Datumbox机器学习框架是用Java编写的一个开源框架,该框架的涵盖大量的机器学习算法和统计方法,并能够处理大尺寸的数据集。
- Jubatus
GitHub项目地址:
https://github.com/jubatus/jubatus
Jubatus库是一个运行在分布式环境中的在线机器学习框架,即面向大数据数据流的开源框架。
- Decider GitHub项目地址:
https://github.com/danielsdeleo/Decider
Decider是另一个Ruby机器学习库,兼具灵活性和可扩展性。