python机器学习开源工具库资源大全,划分子版块并梳理排行,每周自动更新
本资源清单包含820个python机器学习相关的开源工具资源,这些热门工具总共分成32个不同的子板块,这些项目目前在github上已经收到3.5M个点赞。所有的工具资源每周会自动从GitHub和工具维护平台采集信息,并更新排行展示。本清单参考best-of模板完成,内容参考了awesome-machine-learning,欢迎大家提PR丰富本清单。
- 机器学习框架 54 个项目
- 数据可视化 49 个项目
- 文本数据和NLP 82 个项目
- 图像数据与CV 49 个项目
- 图数据处理 29 个项目
- 音频处理 23 个项目
- 地理Geo处理 22 个项目
- 金融数据处理 23 个项目
- 时间序列 20 个项目
- 医疗领域 19 个项目
- 光学字符识别OCR 11 个项目
- 数据容器和结构 28 个项目
- 数据读写与提取 23 个项目
- 网页抓取和爬虫 1 个项目
- 数据管道和流处理 36 个项目
- 分布式机器学习 26 个项目
- 超参数优化和AutoML 45 个项目
- 强化学习 19 个项目
- 推荐系统 13 个项目
- 隐私机器学习 6 个项目
- 工作流程和实验跟踪 35 个项目
- 模型序列化和转换 11 个项目
- 模型的可解释性 46 个项目
- 向量相似度搜索(ANN) 12 个项目
- 概率统计 21 个项目
- 对抗学习与鲁棒性 7 个项目
- GPU实用程序 18 个项目
- Tensorflow实用程序 13 个项目
- Sklearn实用程序 17 个项目
- Pytorch实用程序 27 个项目
- 数据库客户端 1 个项目
- 中文自然语言处理 2 个项目
- Others 33 个项目
- 🥇🥈🥉 综合项目质量分
- ⭐️ github上star的数量
- 🐣 小于6个月的新项目
- 💤 非活跃项目(6个月未更新)
- 💀 沉寂项目(12个月未更新)
- 📈📉 项目趋势(向上or向下)
- ➕ 最近添加的项目
- ❗️ 警告(例如 项目没有license)
- 👨💻 项目的开发贡献者数量
- 🔀 项目被fork的数量
- 📋 项目issue的数量
- ⏱️ 项目包上次更新时间
- 📥 工具库被下载次数
- 📦 项目依赖的工具库数量
- Tensorflow相关项目
- Sklearn相关项目
- pytorch相关项目
- MxNet相关项目
- Apache Spark相关项目
- Jupyter相关项目
- PaddlePaddle相关项目
- Pandas相关项目
通用机器学习和深度学习框架。
Tensorflow (🥇44 · ⭐ 170K) - 适用于所有人的开源机器学习框架。Apache-2
-
GitHub (👨💻 4.1K · 🔀 70K · 📦 210K · 📋 35K - 5% open · ⏱️ 26.08.2022):
git clone https://github.com/tensorflow/tensorflow
-
PyPi (📥 14M / month):
pip install tensorflow
-
Conda (📥 3.6M · ⏱️ 20.07.2022):
conda install -c conda-forge tensorflow
-
Docker Hub (📥 67M · ⭐ 2K · ⏱️ 25.08.2022):
docker pull tensorflow/tensorflow
scikit-learn (🥇39 · ⭐ 51K) - scikit-learn:基于Python的机器学习工具库。BSD-3
PaddlePaddle (🥈32 · ⭐ 19K) - paddlepaddle机器学习与深度学习工具库。Apache-2
Jina (🥈32 · ⭐ 16K) - 在云端构建神经搜索的简便方法库。Apache-2
-
GitHub (👨💻 150 · 🔀 1.9K · 📦 350 · 📋 1.6K - 1% open · ⏱️ 25.08.2022):
git clone https://github.com/jina-ai/jina
-
PyPi (📥 88K / month):
pip install jina
-
Docker Hub (📥 1.1M · ⭐ 7 · ⏱️ 23.08.2022):
docker pull jinaai/jina
StatsModels (🥈32 · ⭐ 7.7K) - Statsmodels:Python中的统计建模和计量经济学工具库。BSD-3
Theano (🥈30 · ⭐ 9.6K · 💤) - Theano是一个Python神经网络工具库。❗Unlicensed
pytorch-lightning (🥈29 · ⭐ 20K · 📉) - 轻巧而具备高性能的PyTorch上层封装工具库。Apache-2
Vowpal Wabbit (🥈28 · ⭐ 8K) - Vowpal Wabbit是一个推动机器学习的机器学习系统。BSD-3
TFlearn (🥉27 · ⭐ 9.6K · 💀) - 深度学习库,基于TensorFlow构建上层简单易用的API。❗Unlicensed
tensorpack (🥉27 · ⭐ 6.2K) - TensorFlow上的神经网络训练接口。Apache-2
Turi Create (🥉25 · ⭐ 11K · 💤) - Turi Create简化了自定义机器学习的开发。BSD-3
NuPIC (🥉24 · ⭐ 6.3K · 💀) - Numenta智能计算平台。❗️AGPL-3.0
tensorflow-upstream (🥉24 · ⭐ 610) - TensorFlow ROCm端口。Apache-2
mlpack (🥉23 · ⭐ 4.1K) - mlpack:可扩展的C++机器学习库-。❗Unlicensed
Neural Network Libraries (🥉23 · ⭐ 2.6K) - 神经网络工具库。Apache-2
Neural Tangents (🥉23 · ⭐ 1.8K) - Python中的快速简便的无限神经网络。Apache-2
CNTK (🥉22 · ⭐ 17K · 💀) - Microsoft认知工具包(CNTK),一种开源的深度学习工具包。❗Unlicensed
Lasagne (🥉22 · ⭐ 3.8K · 💀) - 轻量级的库,用于在Theano中构建和训练神经网络。❗Unlicensed
SHOGUN (🥉22 · ⭐ 2.9K · 💀) - 统一高效的机器学习。BSD-3
-
GitHub (👨💻 250 · 🔀 1K · 📋 1.5K - 27% open · ⏱️ 08.12.2020):
git clone https://github.com/shogun-toolbox/shogun
-
Conda (📥 120K · ⏱️ 25.06.2018):
conda install -c conda-forge shogun
-
Docker Hub (📥 1.5K · ⭐ 1 · ⏱️ 31.01.2019):
docker pull shogun/shogun
Haiku (🥉21 · ⭐ 2.1K) - 基于JAX的神经网络库。Apache-2
-
GitHub (👨💻 63 · 🔀 170 · 📦 540 · 📋 180 - 26% open · ⏱️ 25.08.2022):
git clone https://github.com/deepmind/dm-haiku
mace (🥉20 · ⭐ 4.7K) - MACE是针对移动设备优化的深度学习推理框架。Apache-2
-
GitHub (👨💻 64 · 🔀 790 · 📥 1.4K · 📋 660 - 7% open · ⏱️ 30.05.2022):
git clone https://github.com/XiaoMi/mace
ThunderSVM (🥉19 · ⭐ 1.4K) - ThunderSVM:在GPU和CPU上的快速SVM库。Apache-2
Torchbearer (🥉19 · ⭐ 630 · 💀) - torchbearer:PyTorch的模型拟合库。MIT
ThunderGBM (🥉17 · ⭐ 640) - ThunderGBM:GPU上的快速GBDT和随机森林。Apache-2
NeoML (🥉15 · ⭐ 690) - neoml是可以用于深度学习和传统机器学习的工具库。Apache-2
-
GitHub (👨💻 32 · 🔀 110 · 📋 62 - 22% open · ⏱️ 24.08.2022):
git clone https://github.com/neoml-lib/neoml
StarSpace (🥉12 · ⭐ 3.8K · 💀) - 学习embedding嵌入用于分类,检索和排序。MIT
-
GitHub (👨💻 17 · 🔀 510 · 📋 200 - 24% open · ⏱️ 13.12.2019):
git clone https://github.com/facebookresearch/StarSpace
通用和特定于任务的数据可视化库。
Matplotlib (🥇36 · ⭐ 16K) - matplotlib:Python绘图工具库。❗Unlicensed
pandas-profiling (🥇33 · ⭐ 9.4K) - 从pandas DataFrame创建HTML分析报告。MIT
datashader (🥈29 · ⭐ 2.8K) - 快速准确地渲染大数据。BSD-3
D-Tale (🥈27 · ⭐ 3.6K) - pandas数据结构的可视化工具。❗️LGPL-2.1
data-validation (🥈27 · ⭐ 660) - 用于探索和验证机器学习的库。Apache-2
Facets Overview (🥉25 · ⭐ 7K · 💀) - 机器学习数据集的可视化。Apache-2
VisPy (🥉24 · ⭐ 2.9K) - 高性能交互式2D / 3D数据可视化库。❗Unlicensed
HyperTools (🥉24 · ⭐ 1.7K) - 一个Python工具箱,用于获得对高维的几何洞察力。MIT
pythreejs (🥉24 · ⭐ 830) - Jupyter-Three.js桥。❗Unlicensed
PyQtGraph (🥉23 · ⭐ 2.9K) - 用于科学/工程的快速数据可视化和GUI工具。❗Unlicensed
python-ternary (🥉23 · ⭐ 580) - 带有matplotlib的python三元绘图库。MIT
Perspective (🥉21 · ⭐ 4.8K) - 通过WebAssembly进行流式透视显示。Apache-2
Multicore-TSNE (🥉21 · ⭐ 1.7K · 💀) - 使用Python和Torch并行执行t-SNE。BSD-3
pivottablejs (🥉19 · ⭐ 470 · 💀) - Jupyter/IPython的Dragndrop数据透视表和图表。❗Unlicensed
Pandas-Bokeh (🥉18 · ⭐ 800) - pandas和GeoPandas的Bokeh绘图后端。MIT
animatplot (🥉18 · ⭐ 400 · 💀) - 用于在patpliblib上构建动画图的python程序包。MIT
data-describe (🥉14 · ⭐ 290 · 💤) - 数据描述:Pythonic EDA数据科学加速器。❗Unlicensed
用于处理,清理,处理和分析文本数据的库,以及用于NLP任务的库,例如语言检测,模糊匹配,文本分类,seq2seq学习,智能对话,关键字提取和机器翻译。
transformers (🥇37 · ⭐ 69K) - transformers:先进的自然语言模型库。Apache-2
gensim (🥇36 · ⭐ 13K) - 主题模型工具库。❗️LGPL-2.1
sentence-transformers (🥇34 · ⭐ 8.3K) - BERT和XLNet的句子嵌入。Apache-2
sentencepiece (🥇33 · ⭐ 6.1K) - 用于基于神经网络的文本的预处理器。Apache-2
ChatterBot (🥇32 · ⭐ 12K · 💀) - ChatterBot是机器学习的对话引擎。BSD-3
flair (🥈30 · ⭐ 12K) - 一个用于最先进的自然语言处理的非常简单的框架。❗Unlicensed
fuzzywuzzy (🥈30 · ⭐ 8.7K · 💤) - Python中的模糊字符串匹配。❗️GPL-2.0
TextDistance (🥈29 · ⭐ 2.9K) - 计算序列之间的距离,包含30多种算法。MIT
TensorFlow Text (🥈29 · ⭐ 980) - TensorFlow文本处理。Apache-2
DeepPavlov (🥈27 · ⭐ 5.8K) - 一个用于深度学习端到端对话的开源库。Apache-2
spacy-transformers (🥈27 · ⭐ 1.1K) - 使用经过预训练的transformer模型,例如BERT,XLNet和GPT-2。MIT
spacy
Tokenizers (🥈26 · ⭐ 5.8K) - 针对研究和应用进行了优化的快速最先进的分词器。Apache-2
stanza (🥈25 · ⭐ 6.2K) - 斯坦福NLP官方Python语言库,支持多种语言。❗Unlicensed
neuralcoref (🥈25 · ⭐ 2.6K · 💀) - 基于SpaCy的神经网络实现快速共指解析。MIT
PyTextRank (🥈25 · ⭐ 1.9K) - TextRank的Python实现。MIT
pyahocorasick (🥈25 · ⭐ 740) - Python文本工具库。BSD-3
Ciphey (🥈24 · ⭐ 11K) - 在不知道密钥或密码的情况下自动解密加密。MIT
-
GitHub (👨💻 46 · 🔀 650 · 📋 290 - 15% open · ⏱️ 28.06.2022):
git clone https://github.com/Ciphey/Ciphey
-
PyPi (📥 23K / month):
pip install ciphey
-
Docker Hub (📥 16K · ⭐ 8 · ⏱️ 27.05.2022):
docker pull remnux/ciphey
vaderSentiment (🥈24 · ⭐ 3.7K) - VADER情感分析。MIT
pytorch-nlp (🥈24 · ⭐ 2.1K · 💀) - PyTorch自然语言处理(NLP)的基本实用程序。BSD-3
snowballstemmer (🥉23 · ⭐ 580 · 💤) - Snowball编译器和词干算法。BSD-3
stop-words (🥉23 · ⭐ 140 · 💀) - 获取Python中各种语言的常用停用词表。BSD-3
textgenrnn (🥉22 · ⭐ 4.7K · 💀) - 轻松地训练自己的文本生成神经网络。❗Unlicensed
phonenumbers (🥉22 · ⭐ 3.1K) - Google的libphonenumber的Python端口。Apache-2
langid (🥉22 · ⭐ 2K · 💀) - 独立的语言识别系统。❗Unlicensed
scattertext (🥉22 · ⭐ 1.9K) - 文件之间语言分布的漂亮可视化效果。Apache-2
polyglot (🥉21 · ⭐ 2K · 💀) - 多语言文本(NLP)处理工具包。❗Unlicensed
YouTokenToMe (🥉21 · ⭐ 820 · 💀) - 用于基于神经网络的文本的预处理器。MIT
PyText (🥉20 · ⭐ 6.4K) - 基于PyTorch的自然语言建模框架。❗Unlicensed
NLP Architect (🥉20 · ⭐ 2.9K) - 用于探索最先进的深度学习的模型库。Apache-2
DELTA (🥉20 · ⭐ 1.5K · 💀) - DELTA是一个基于深度学习的自然语言和语音处理平台。Apache-2
-
GitHub (👨💻 41 · 🔀 290 · 📋 75 - 1% open · ⏱️ 17.12.2020):
git clone https://github.com/Delta-ML/delta
-
PyPi (📥 14 / month):
pip install delta-nlp
-
Docker Hub (📥 13K · ⏱️ 03.08.2021):
docker pull zh794390558/delta
pyfasttext (🥉20 · ⭐ 230 · 💀) - fastText的另一个Python接口。❗️GPL-3.0
gpt-2-simple (🥉18 · ⭐ 3K) - 可轻松重新训练OpenAI的GPT-2文本模型的Python软件包。❗Unlicensed
textacy (🥉18 · ⭐ 2K) - spaCy之前和之后的NLP。❗Unlicensed
DeepMatcher (🥉17 · ⭐ 440 · 💀) - 用于实体和文本匹配的Python包。BSD-3
OpenNRE (🥉14 · ⭐ 3.8K) - 神经关系提取(NRE)的开源软件包。MIT
-
GitHub (👨💻 10 · 🔀 950 · 📋 350 - 2% open · ⏱️ 06.04.2022):
git clone https://github.com/thunlp/OpenNRE
TransferNLP (🥉14 · ⭐ 290 · 💀) - 用于可重复的实验的NLP库。MIT
Headliner (🥉11 · ⭐ 230 · 💀) - 轻松训练和部署seq2seq模型。❗Unlicensed
用于图像和视频处理,操纵和扩充的库,以及用于计算机视觉任务(例如面部识别,对象检测和图像分类)的库。
Albumentations (🥇32 · ⭐ 11K) - 快速的图像增强库和易于使用的包装器。MIT
scikit-image (🥇32 · ⭐ 5K) - Python中的图像处理。❗Unlicensed
PyTorch Image Models (🥈31 · ⭐ 21K) - PyTorch图像模型,脚本,预训练权重。Apache-2
-
GitHub (👨💻 79 · 🔀 3.3K · 📥 1.7M · 📦 4.3K · 📋 570 - 9% open · ⏱️ 24.08.2022):
git clone https://github.com/rwightman/pytorch-image-models
MMDetection (🥈27 · ⭐ 21K) - OpenMMLab检测工具箱。Apache-2
-
GitHub (👨💻 350 · 🔀 6.9K · 📦 550 · 📋 6.2K - 9% open · ⏱️ 28.07.2022):
git clone https://github.com/open-mmlab/mmdetection
torchvision (🥈27 · ⭐ 12K) - 计算机视觉的数据集,转换和模型。BSD-3
InsightFace (🥈26 · ⭐ 12K) - MXNet和PyTorch上的人脸分析项目。MIT
Face Recognition (🥈25 · ⭐ 46K) - 简单的面部识别API。MIT
detectron2 (🥈25 · ⭐ 22K) - Detectron2是Facebook FAIR的高级目标检测平台。Apache-2
vit-pytorch (🥈25 · ⭐ 11K) - 实现视觉transformer,一种简单的方法。MIT
facenet-pytorch (🥈25 · ⭐ 3K · 💤) - 预训练的Pytorch人脸检测(MTCNN)和识别。MIT
opencv-python (🥈25 · ⭐ 2.9K · 📈) - 自动化的CI工具链可生成预编译的opencv-python。MIT
mahotas (🥈25 · ⭐ 770) - Python中的计算机视觉。❗Unlicensed
PyTorch3D (🥉23 · ⭐ 6.4K) - PyTorch3D是FAIR的深度学习可重用组件库。❗Unlicensed
Face Alignment (🥉23 · ⭐ 5.8K · 💤) - 使用pytorch构建2D和3D人脸对齐库。BSD-3
Image Deduplicator (🥉22 · ⭐ 4.1K · 💀) - 图像查重。Apache-2
PaddleDetection (🥉21 · ⭐ 8.3K) - 对象检测和实例分割工具箱。Apache-2
-
GitHub (👨💻 100 · 🔀 2.1K · 📦 30 · 📋 3.8K - 20% open · ⏱️ 16.08.2022):
git clone https://github.com/PaddlePaddle/PaddleDetection
segmentation_models (🥉21 · ⭐ 4K) - Segmentation models with pretrained backbones. Keras.. MIT
Image Super-Resolution (🥉21 · ⭐ 3.8K · 💀) - 图像超精度变换。Apache-2
-
GitHub (👨💻 10 · 🔀 630 · 📦 97 · 📋 200 - 45% open · ⏱️ 02.06.2021):
git clone https://github.com/idealo/image-super-resolution
-
PyPi (📥 4.5K / month):
pip install ISR
-
Docker Hub (📥 220 · ⏱️ 01.04.2019):
docker pull idealo/image-super-resolution-gpu
CellProfiler (🥉21 · ⭐ 700) - 生物图像分析的开源应用程序。❗Unlicensed
tensorflow-graphics (🥉20 · ⭐ 2.7K) - TensorFlow图神经网络:可微分的图layerApache-2
Classy Vision (🥉19 · ⭐ 1.5K) - 用于图像和视频的端到端PyTorch框架。MIT
DE⫶TR (🥉17 · ⭐ 9.6K) - End-to-End Object Detection with Transformers. Apache-2
-
GitHub (👨💻 25 · 🔀 1.7K · 📋 440 - 38% open · ⏱️ 07.03.2022):
git clone https://github.com/facebookresearch/detr
Pillow-SIMD (🥉17 · ⭐ 1.9K · 💤) - 友好的PIL fork。❗️PIL
PySlowFast (🥉16 · ⭐ 5K) - PySlowFast:来自FAIR的视频理解代码库。Apache-2
-
GitHub (👨💻 28 · 🔀 960 · 📦 10 · 📋 550 - 52% open · ⏱️ 25.08.2022):
git clone https://github.com/facebookresearch/SlowFast
image-match (🥉16 · ⭐ 2.8K · 💤) - 快速搜索数十亿张图像。❗Unlicensed
pycls (🥉15 · ⭐ 2K) - 用PyTorch编写的图像分类研究代码库。MIT
-
GitHub (👨💻 17 · 🔀 230 · 📦 6 · 📋 78 - 28% open · ⏱️ 12.07.2022):
git clone https://github.com/facebookresearch/pycls
Torch Points 3D (🥉14 · ⭐ 93 · 💤) - 用于在点云上进行深度学习的Pytorch框架。BSD-3
用于图数据处理,聚类,图嵌入和机器学习任务的库。
networkx (🥇32 · ⭐ 11K) - Python中的网络分析。❗Unlicensed
PyTorch Geometric (🥇28 · ⭐ 15K) - PyTorch的几何深度学习扩展库。MIT
StellarGraph (🥈25 · ⭐ 2.5K · 💤) - StellarGraph-图机器学习库。Apache-2
Karate Club (🥈23 · ⭐ 1.7K) - 面向API的开源Python框架。❗️GPL-3.0
pytorch_geometric_temporal (🥈23 · ⭐ 1.7K) - PyTorch Geometric Temporal: Spatiotemporal Signal.. MIT
AmpliGraph (🥈22 · ⭐ 1.8K · 💀) - 用于知识表示学习的Python库。Apache-2
Paddle Graph Learning (🥈22 · ⭐ 1.4K) - paddle图机器学习。Apache-2
pygal (🥈21 · ⭐ 2.5K · 💤) - PYthon svg GrAph绘图库。❗️LGPL-3.0
torch-cluster (🥈21 · ⭐ 560) - 优化图聚类的PyTorch扩展库MIT
PyTorch-BigGraph (🥉19 · ⭐ 3.1K) - 从大型图网络结构生成embedding嵌入。❗Unlicensed
DeepWalk (🥉19 · ⭐ 2.5K · 💀) - DeepWalk-图的深度学习。❗Unlicensed
GraphEmbedding (🥉16 · ⭐ 3K) - 图嵌入算法的实现和实验。MIT
-
GitHub (👨💻 9 · 🔀 860 · 📦 21 · 📋 57 - 59% open · ⏱️ 21.06.2022):
git clone https://github.com/shenweichen/GraphEmbedding
graph-nets (🥉15 · ⭐ 5.2K · 💀) - 在Tensorflow中构建图神经网络。Apache-2
DeepGraph (🥉15 · ⭐ 260 · 💀) - 使用基于pandas的网络分析数据。❗Unlicensed
GraphSAGE (🥉14 · ⭐ 2.8K · 💀) - 大型图上的表示学习。MIT
-
GitHub (👨💻 9 · 🔀 770 · 📋 160 - 62% open · ⏱️ 19.09.2018):
git clone https://github.com/williamleif/GraphSAGE
OpenNE (🥉14 · ⭐ 1.6K · 💀) - 神经关系提取(NRE)的开源软件包。MIT
-
GitHub (👨💻 10 · 🔀 480 · 📋 97 - 1% open · ⏱️ 12.08.2019):
git clone https://github.com/thunlp/OpenNE
OpenKE (🥉11 · ⭐ 3.2K · 💀) - 神经关系提取(NRE)的开源软件包。❗Unlicensed
-
GitHub (👨💻 10 · 🔀 900 · 📋 350 - 1% open · ⏱️ 06.04.2021):
git clone https://github.com/thunlp/OpenKE
用于音频分析,处理,转换和提取以及语音识别和音乐生成任务的库。
DeepSpeech (🥇30 · ⭐ 20K · 💤) - DeepSpeech是开源的语音转文本引擎。MPL-2.0
torchaudio (🥈27 · ⭐ 1.8K) - 音频信号的数据处理和转换。BSD-2
SpeechRecognition (🥈24 · ⭐ 6.5K) - 适用于Python的语音识别模块。BSD-3
pyAudioAnalysis (🥈24 · ⭐ 4.9K) - Python音频分析库。Apache-2
Essentia (🥈24 · ⭐ 2.2K) - C++库,用于音频和音乐分析,描述等。❗️AGPL-3.0
python-soundfile (🥉21 · ⭐ 470) - SoundFile是基于libsndfile,CFFI等的音频库。BSD-3
python_speech_features (🥉20 · ⭐ 2.1K · 💀) - This library provides common speech features for ASR.. MIT
TTS (🥉19 · ⭐ 6.2K · 💀) - 文本到语音的深度学习。MPL-2.0
-
GitHub (👨💻 56 · 🔀 930 · 📥 2.6K · 📋 540 - 0% open · ⏱️ 12.02.2021):
git clone https://github.com/mozilla/TTS
Madmom (🥉19 · ⭐ 950 · 💤) - Python音频和音乐信号处理库。❗Unlicensed
用于加载,处理,分析和写入geo地理数据的库,以及用于空间分析,地图可视化和地理编码的库。
ipyleaflet (🥈30 · ⭐ 1.3K) - Jupyter-Leaflet.js桥。MIT
Rasterio (🥉27 · ⭐ 1.8K) - Rasterio读写地理空间栅格数据集。❗Unlicensed
Cartopy (🥉26 · ⭐ 1.8K) - Rasterio读写地理空间栅格数据集。❗Unlicensed
ArcGIS API (🥉24 · ⭐ 1.4K) - ArcGIS API for Python的文档和示例。Apache-2
-
GitHub (👨💻 81 · 🔀 910 · 📥 5.2K · 📋 470 - 8% open · ⏱️ 17.08.2022):
git clone https://github.com/Esri/arcgis-python-api
-
PyPi (📥 45K / month):
pip install arcgis
-
Docker Hub (📥 7.2K · ⭐ 35 · ⏱️ 17.06.2022):
docker pull esridocker/arcgis-api-python-notebook
Sentinelsat (🥉22 · ⭐ 790) - 搜索和下载哥白尼前哨卫星图像。❗️GPL-3.0
geoplotlib (🥉19 · ⭐ 970 · 💀) - python工具箱,用于可视化地理数据和制作地图。MIT
用于算法股票/加密交易,风险分析,回测,技术分析以及其他金融数据任务的库。
backtrader (🥇27 · ⭐ 9.2K · 💀) - 用于交易策略的Python Backtesting库。❗️GPL-3.0
FinTA (🥉23 · ⭐ 1.7K) - 基于pandas实现的通用金融技术指标。❗️LGPL-3.0
arch (🥉23 · ⭐ 970) - Python中的ARCH模型。❗Unlicensed
TensorTrade (🥉22 · ⭐ 3.9K) - 一个开放源代码的强化学习框架。Apache-2
PyAlgoTrade (🥉22 · ⭐ 3.7K · 💀) - Python算法交易库。Apache-2
Alpha Vantage (🥉21 · ⭐ 3.7K · 💀) - 用于金融数据的Alpha Vantage API的python包装器。MIT
Enigma Catalyst (🥉21 · ⭐ 2.4K · 💤) - Python中加密资产的算法交易库。Apache-2
tf-quant-finance (🥉20 · ⭐ 3.2K) - 用于量化投资的高性能TensorFlow库。Apache-2
Crypto Signals (🥉19 · ⭐ 4.1K) - CryptoSignal量化交易技术。MIT
-
GitHub (👨💻 28 · 🔀 1.1K · 📋 260 - 20% open · ⏱️ 09.08.2022):
git clone https://github.com/CryptoSignal/crypto-signal
-
Docker Hub (📥 140K · ⭐ 7 · ⏱️ 03.09.2020):
docker pull shadowreaver/crypto-signal
stockstats (🥉19 · ⭐ 1K · 💤) - 提供StockDataFrame包装器❗Unlicensed
finmarketpy (🥉18 · ⭐ 3K) - Python库,用于回测交易策略和分析。Apache-2
Backtesting.py (🥉17 · ⭐ 2.8K) - 回溯Python中的交易策略。❗️AGPL-3.0
surpriver (🥉12 · ⭐ 1.5K · 💀) - 使用机器学习在股票大波动之前找到它。❗️GPL-3.0
-
GitHub (👨💻 6 · 🔀 280 · 📋 15 - 60% open · ⏱️ 21.09.2020):
git clone https://github.com/tradytics/surpriver
用于按时间序列和顺序数据进行预测,异常检测,特征提取和机器学习的库。
Darts (🥈25 · ⭐ 4.6K) - 一个易于操作和预测时间序列的python库。Apache-2
-
GitHub (👨💻 61 · 🔀 480 · 📦 92 · 📋 600 - 23% open · ⏱️ 25.08.2022):
git clone https://github.com/unit8co/darts
-
PyPi (📥 6.4K / month):
pip install u8darts
-
Docker Hub (📥 360 · ⏱️ 12.08.2022):
docker pull unit8/darts
pytorch-forecasting (🥈25 · ⭐ 2.2K) - 使用PyTorch进行时间序列预测。MIT
matrixprofile-ts (🥉17 · ⭐ 690 · 💀) - 一个用于检测模式和异常的Python库。Apache-2
atspy (🥉13 · ⭐ 450 · 💤) - AtsPy:Python中的自动时间序列模型。❗Unlicensed
用于处理和分析MRI,EEG,基因组数据和其他医学成像格式等医学数据的库。
NiBabel (🥈28 · ⭐ 490) - Python软件包,用于访问神经影像文件格式。❗Unlicensed
Nilearn (🥈24 · ⭐ 880) - Python中NeuroImaging的机器学习。❗Unlicensed
DIPY (🥈24 · ⭐ 540) - DIPY是Python中的Paragon 3D/4D +影像库。❗Unlicensed
DeepVariant (🥉22 · ⭐ 2.6K) - DeepVariant是使用深度神经网络的分析管道。BSD-3
Brainiak (🥉18 · ⭐ 280 · 💀) - 脑成像分析套件。Apache-2
-
GitHub (👨💻 34 · 🔀 130 · 📦 16 · 📋 200 - 37% open · ⏱️ 28.05.2021):
git clone https://github.com/brainiak/brainiak
-
PyPi (📥 180 / month):
pip install brainiak
-
Docker Hub (📥 760 · ⭐ 1 · ⏱️ 15.10.2020):
docker pull brainiak/brainiak
MedicalTorch (🥉15 · ⭐ 790 · 💀) - Pytorch的医学成像框架。Apache-2
MedicalNet (🥉14 · ⭐ 1.4K · 💀) - Transfer Learning for 3D Medical Image Analysis的论文实现。MIT
-
GitHub (🔀 370 · 📋 70 - 78% open · ⏱️ 27.08.2020):
git clone https://github.com/Tencent/MedicalNet
Medical Detection Toolkit (🥉14 · ⭐ 1.1K) - Medical Detection Toolkit包含2D + 3D。Apache-2
-
GitHub (👨💻 3 · 🔀 280 · 📋 120 - 30% open · ⏱️ 04.04.2022):
git clone https://github.com/MIC-DKFZ/medicaldetectiontoolkit
用于光学字符识别(OCR)和从图像或视频中提取文本的库。
pdftabextract (🥉19 · ⭐ 2K) - 一组用于从PDF文件提取表格的工具。Apache-2
attention-ocr (🥉19 · ⭐ 920 · 💤) - 用于文本识别的Tensorflow模型。MIT
Mozart (🥉11 · ⭐ 400) - 光学音乐识别(OMR)系统。Apache-2
-
GitHub (👨💻 5 · 🔀 58 · 📋 12 - 25% open · ⏱️ 24.08.2022):
git clone https://github.com/aashrafh/Mozart
通用数据容器和结构以及pandas的实用程序和扩展。
sklearn-pandas (🥈29 · ⭐ 2.6K) - pandas与sklearn集成。❗️Zlib
datasketch (🥈29 · ⭐ 1.8K) - MinHash, LSH, LSH Forest, Weighted MinHash, HyperLogLog等实现。MIT
Bottleneck (🥈29 · ⭐ 780) - 用C编写的快速NumPy数组函数。BSD-2
Arctic (🥉24 · ⭐ 2.8K) - Arctic是用于数字数据的高性能数据存储。❗️LGPL-2.1
Pandaral·lel (🥉24 · ⭐ 2.4K) - A simple and efficient tool to parallelize Pandas.. BSD-3
bcolz (🥉24 · ⭐ 940 · 💀) - 可以压缩的列式数据容器。❗Unlicensed
StaticFrame (🥉22 · ⭐ 310) - 类似Pandas的DataFrame的不可变且仅增长的高效数据结构实现。MIT
Pandas Summary (🥉16 · ⭐ 430) - pandas Dataframe的describe函数功能扩展。Apache-2
PandaPy (🥉10 · ⭐ 510 · 💤) - PandaPy:具有NumPy的速度,性能高于pandas的表格数据实现。❗Unlicensed
用于从各种数据源和格式加载,收集和提取数据的库。
python-magic (🥈29 · ⭐ 2.2K) - 用于libmagic的python包装器。❗Unlicensed
xlrd (🥈29 · ⭐ 2K · 💤) - xlrd是python语言中用于读取excel表格内容的库。❗Unlicensed
TensorFlow Datasets (🥈28 · ⭐ 3.4K) - TFDS是一个高级数据集合。Apache-2
smart-open (🥈26 · ⭐ 2.6K) - 用于大文件(S3,HDFS,gzip,bz2 ...)流传输的实用程序。MIT
SDV (🥉23 · ⭐ 980) - 用于表格,关系和时间序列数据的综合数据生成。❗Unlicensed
tabulator-py (🥉22 · ⭐ 230 · 💀) - 用于读取和写入图像数据的Python库。MIT
pyexcel-xlsx (🥉22 · ⭐ 110 · 💀) - 一个包装器库,用于在xlsx和xlsm等文件格式中读取,操作和写入数据。❗Unlicensed
messytables (🥉21 · ⭐ 380 · 💀) - 解析混乱的表格数据的工具。❗Unlicensed
rows (🥉20 · ⭐ 810) - 通用美观的表格数据界面。❗️LGPL-3.0
Camelot (🥉19 · ⭐ 3.3K · 💀) - Camelot:简单的PDF表提取。❗Unlicensed
pandas-datareader (🥉19 · ⭐ 2.4K) - 从各种各样的网络来源中提取数据。❗Unlicensed
datatest (🥉19 · ⭐ 260 · 💤) - 用于测试驱动的数据整理和数据验证的工具。❗Unlicensed
Singer (🥉17 · ⭐ 1K · 💀) - 在数据库,Web API,文件,队列等之间移动数据的标准。❗️AGPL-3.0
openpyxl (🥉16 · ⭐ 45) - 一个用于读取/写入Excel 2010 xlsx/xlsm文件的Python库。MIT
-
PyPi (📥 35M / month):
pip install openpyxl
-
GitLab (🔀 0 · 📋 1.9K - 12% open · ⏱️ 07.07.2022):
git clone https://foss.heptapod.net/openpyxl/openpyxl
-
Conda (📥 98K · ⏱️ 07.07.2022):
conda install -c anaconda openpyxl
-
Docker Hub (📥 1.2K · ⏱️ 13.09.2018):
docker pull openpyxl/openpyxl-ci
用于Web抓取、爬虫,下载和挖掘的库以及库。
🔗 Python Web Scraping ( ⭐ 1.6K) - Collection of web-scraping and crawling libraries.
用于数据批处理和流处理,工作流自动化,作业调度和其他数据管道任务的库。
Celery (🥇36 · ⭐ 20K) - 基于分布式消息传递的异步任务队列/作业队列。❗Unlicensed
rq (🥇32 · ⭐ 8.5K) - 适用于Python的简单作业队列。❗Unlicensed
Airflow (🥈29 · ⭐ 28K) - 代码实现的创建,安排和监视工作流的平台。Apache-2
-
GitHub (👨💻 2.5K · 🔀 11K · 📥 340K · 📋 6K - 11% open · ⏱️ 25.08.2022):
git clone https://github.com/apache/airflow
-
PyPi (📥 8.9M / month):
pip install apache-airflow
-
Conda (📥 700K · ⏱️ 25.08.2022):
conda install -c conda-forge airflow
-
Docker Hub (📥 82M · ⭐ 380 · ⏱️ 23.08.2022):
docker pull apache/airflow
PyFunctional (🥈26 · ⭐ 2.1K) - 用于创建具有链功能的数据管道的Python库。MIT
Great Expectations (🥈25 · ⭐ 7.1K) - 通过数据测试,文档编制和性能分析,帮助数据团队加速流水线效率。Apache-2
faust (🥈25 · ⭐ 6.3K · 💀) - Python流处理。❗Unlicensed
streamparse (🥉24 · ⭐ 1.5K) - 在Apache Storm拓扑中运行Python。 Pythonic API,CLI 等。Apache-2
pysparkling (🥉20 · ⭐ 250 · 💀) - Apache Spark的RDD和DStream的纯Python实现。❗Unlicensed
spark-deep-learning (🥉17 · ⭐ 1.9K) - 适用于Apache Spark的深度学习管道。Apache-2
-
GitHub (👨💻 17 · 🔀 460 · 📦 24 · 📋 100 - 74% open · ⏱️ 21.03.2022):
git clone https://github.com/databricks/spark-deep-learning
Mara Pipelines (🥉17 · ⭐ 1.9K) - 一个轻量级的ETL框架。MIT
Databolt Flow (🥉15 · ⭐ 940 · 💤) - Python库,用于构建高效的数据科学工作流程。MIT
flupy (🥉14 · ⭐ 170) - python中的流利数据管道。❗Unlicensed
bodywork-core (🥉13 · ⭐ 400) - MLOps工具,用于将机器学习项目部署到Kubernetes。❗️AGPL-3.0
Botflow (🥉12 · ⭐ 1.2K · 💀) - 适用于数据管道工作的Python快速数据流编程框架。❗Unlicensed
提供在大型计算基础架构中分布和并行化机器学习任务的功能的库。
horovod (🥇30 · ⭐ 13K) - 基于TensorFlow,Keras,PyTorch,MXNet等的分布式训练框架。❗Unlicensed
dask.distributed (🥇30 · ⭐ 1.4K) - Dask的分布式任务调度规划程序。BSD-3
DeepSpeed (🥈28 · ⭐ 7.7K) - DeepSpeed是一个深度学习优化库。MIT
-
GitHub (👨💻 130 · 🔀 830 · 📦 340 · 📋 980 - 48% open · ⏱️ 25.08.2022):
git clone https://github.com/microsoft/DeepSpeed
-
PyPi (📥 220K / month):
pip install deepspeed
-
Docker Hub (📥 14K · ⭐ 3 · ⏱️ 06.06.2022):
docker pull deepspeed/deepspeed
DEAP (🥈27 · ⭐ 4.8K) - Python中的分布式进化算法。❗️LGPL-3.0
BigDL (🥈26 · ⭐ 4K) - BigDL:适用于Apache Spark的分布式深度学习框架。Apache-2
-
GitHub (👨💻 170 · 🔀 970 · 📦 38 · 📋 1.4K - 30% open · ⏱️ 26.08.2022):
git clone https://github.com/intel-analytics/BigDL
-
PyPi (📥 4K / month):
pip install bigdl
-
<dependency> <groupId>com.intel.analytics.bigdl</groupId> <artifactId>bigdl-SPARK_2.4</artifactId> <version>[VERSION]</version> </dependency>
TensorFlowOnSpark (🥉23 · ⭐ 3.8K) - TensorFlowOnSpark将TensorFlow程序引入Spark。Apache-2
analytics-zoo (🥉23 · ⭐ 2.5K) - Apache上的分布式Tensorflow,Keras和PyTorch。Apache-2
Apache Singa (🥉19 · ⭐ 2.7K) - 分布式深度学习平台。Apache-2
-
GitHub (👨💻 79 · 🔀 780 · 📦 1 · 📋 79 - 21% open · ⏱️ 01.06.2022):
git clone https://github.com/apache/singa
-
Conda (📥 510 · ⏱️ 09.08.2021):
conda install -c nusdbsystem singa
-
Docker Hub (📥 690 · ⭐ 4 · ⏱️ 31.05.2022):
docker pull apache/singa
TensorFrames (🥉19 · ⭐ 760 · 💀) - 用于DataFrames的Tensorflow包装器。Apache-2
ipyparallel (🥉18 · ⭐ 2.3K) - Python中的交互式并行计算。❗Unlicensed
BytePS (🥉16 · ⭐ 3.3K) - 分布式DNN训练的高性能通用框架。Apache-2
-
GitHub (👨💻 19 · 🔀 450 · 📋 260 - 38% open · ⏱️ 10.02.2022):
git clone https://github.com/bytedance/byteps
-
PyPi (📥 19 / month):
pip install byteps
-
Docker Hub (📥 1.3K · ⏱️ 03.03.2020):
docker pull bytepsimage/tensorflow
LazyCluster (🥉13 · ⭐ 43 · 💤) - 分布式机器学习框架。Apache-2
用于超参数优化,自动机器学习和神经体系结构搜索的库。
Keras Tuner (🥇30 · ⭐ 2.6K) - 简单易用的超参数调整。Apache-2
scikit-optimize (🥇30 · ⭐ 2.4K · 💤) - SMBO模型优化实现。BSD-3
TPOT (🥈29 · ⭐ 8.7K) - Python自动化机器学习工具。❗️LGPL-3.0
auto-sklearn (🥈29 · ⭐ 6.5K) - 使用scikit-learn的自动化机器学习。BSD-3
Bayesian Optimization (🥈29 · ⭐ 6.2K) - 全局优化的Python实现。MIT
Hyperopt (🥈28 · ⭐ 6.4K · 💤) - Python中的分布式异步超参数优化。❗Unlicensed
mljar-supervised (🥈24 · ⭐ 2K) - 使用scikit-learn的自动化机器学习。MIT
featuretools (🥈22 · ⭐ 6.3K) - 一个用于自动化特征工程的开源python库。BSD-3
Orion (🥈22 · ⭐ 240) - 异步分布式超参数优化。❗Unlicensed
MLBox (🥉21 · ⭐ 1.3K · 💀) - MLBox是功能强大的自动机器学习python库。❗Unlicensed
HpBandSter (🥉20 · ⭐ 540) - 分布式自动化机器学习库。BSD-3
auto_ml (🥉19 · ⭐ 1.6K · 💀) - [UNMAINTAINED] Automated machine learning for analytics & production. MIT
lazypredict (🥉19 · ⭐ 380) - Lazy Predict帮助您无需大量代码即可构建许多基本模型。MIT
SMAC3 (🥉18 · ⭐ 730) - Sequential Model-based算法的配置。❗Unlicensed
sklearn-deap (🥉18 · ⭐ 700 · 💀) - 使用进化算法而非gridsearch的超参数优化。MIT
Auto Tune Models (🥉17 · ⭐ 520 · 💀) - 自动调整模型。MIT
featurewiz (🥉16 · ⭐ 270) - 自动化特征工程并进行特征选择的工具库。Apache-2
Advisor (🥉15 · ⭐ 1.5K · 💀) - Google Vizier的超参数开源实现。Apache-2
-
GitHub (👨💻 11 · 🔀 260 · 📋 32 - 59% open · ⏱️ 11.11.2019):
git clone https://github.com/tobegit3hub/advisor
-
PyPi (📥 34 / month):
pip install advisor
-
Docker Hub (📥 1.7K · ⏱️ 11.11.2019):
docker pull tobegit3hub/advisor
HyperparameterHunter (🥉15 · ⭐ 690 · 💀) - 轻松进行超参数优化和自动结果评估。MIT
ENAS (🥉13 · ⭐ 2.6K · 💀) - Efficient Neural Architecture Search的Pytorch实现。Apache-2
-
GitHub (👨💻 6 · 🔀 470 · 📋 44 - 84% open · ⏱️ 16.06.2020):
git clone https://github.com/carpedm20/ENAS-pytorch
Auptimizer (🥉13 · ⭐ 190 · 💀) - 自动ML模型优化工具。❗️GPL-3.0
Devol (🥉11 · ⭐ 940 · 💀) - 使用Keras进行遗传神经体系结构搜索。MIT
-
GitHub (👨💻 18 · 🔀 110 · 📋 27 - 25% open · ⏱️ 05.07.2020):
git clone https://github.com/joeddav/devol
Hypertunity (🥉10 · ⭐ 120 · 💀) - 黑盒超参数优化的工具集。Apache-2
用于构建和评估强化学习和基于agent的系统的库。
OpenAI Gym (🥇36 · ⭐ 28K) - 开发和比较强化学习的工具包。MIT
ViZDoom (🥈23 · ⭐ 1.4K) - 人工智能强化学习工具库。❗Unlicensed
TensorForce (🥈22 · ⭐ 3.2K) - Tensorforce:一个基于TensorFlow的强化学习库。Apache-2
TensorLayer (🥉21 · ⭐ 7.1K) - 深度学习和强化学习库。❗Unlicensed
Stable Baselines (🥉20 · ⭐ 3.6K · 💤) - OpenAI Baselines的一个分支,强化学习的实现。MIT
ReAgent (🥉17 · ⭐ 3.2K) - 推理系统平台。BSD-3
-
GitHub (👨💻 140 · 🔀 460 · 📋 100 - 25% open · ⏱️ 25.08.2022):
git clone https://github.com/facebookresearch/ReAgent
DeepMind Lab (🥉15 · ⭐ 6.7K) - 可定制的3D平台,用于agent-based AI研究。❗Unlicensed
-
GitHub (👨💻 8 · 🔀 1.3K · 📋 220 - 25% open · ⏱️ 09.06.2022):
git clone https://github.com/deepmind/lab
用于建立和评估推荐系统的库。
TF Recommenders (🥇26 · ⭐ 1.4K) - TensorFlow Recommenders是一个用于构建推荐系统的工具库。Apache-2
TF Ranking (🥈23 · ⭐ 2.5K) - 在TensorFlow中学习推荐排序。Apache-2
scikit-surprise (🥉22 · ⭐ 5.5K) - 用于构建和分析推荐算法的Python scikit工具库。BSD-3
Recommenders (🥉21 · ⭐ 14K) - 推荐系统最佳实践。MIT
-
GitHub (👨💻 120 · 🔀 2.4K · 📥 230 · 📦 33 · 📋 710 - 20% open · ⏱️ 20.07.2022):
git clone https://github.com/microsoft/recommenders
fastFM (🥉19 · ⭐ 1K · 💀) - fastFM:用于分解机的工具库。❗Unlicensed
recmetrics (🥉19 · ⭐ 420) - 用于评估推荐系统的度量标准库。MIT
Case Recommender (🥉17 · ⭐ 420 · 💤) - Case Recommender:灵活且可扩展的Python推荐系统工具库。MIT
使用联合学习和差异隐私之类的方法进行加密和保留隐私的机器学习的库。
TensorFlow Privacy (🥈23 · ⭐ 1.6K) - 用于训练机器学习模型的库。Apache-2
FATE (🥉22 · ⭐ 4.4K) - 工业级联邦学习框架。Apache-2
-
GitHub (👨💻 74 · 🔀 1.3K · 📋 1.3K - 36% open · ⏱️ 15.04.2022):
git clone https://github.com/FederatedAI/FATE
TFEncrypted (🥉20 · ⭐ 1K) - TensorFlow中的加密机器学习框架。Apache-2
跟踪和可视化机器学习实验的工具库整理。
Tensorboard (🥇37 · ⭐ 6K) - TensorFlow的可视化工具包。Apache-2
SageMaker SDK (🥇33 · ⭐ 1.7K) - 一个用于训练和部署机器学习的库。Apache-2
wandb client (🥇32 · ⭐ 4.6K) - 用于可视化和跟踪机器学习的工具。MIT
tensorboardX (🥈31 · ⭐ 7.4K) - pytorch(和链接器,mxnet,numpy,...)的张量板。MIT
ClearML (🥈29 · ⭐ 3.5K) - ClearML-自动精简工具套件。Apache-2
-
GitHub (👨💻 52 · 🔀 460 · 📥 500 · 📦 290 · 📋 600 - 44% open · ⏱️ 23.08.2022):
git clone https://github.com/allegroai/clearml
-
PyPi (📥 94K / month):
pip install clearml
-
Docker Hub (📥 30K · ⏱️ 05.10.2020):
docker pull allegroai/trains
ml-metadata (🥈26 · ⭐ 490) - 用于记录和检索与ML相关的元数据。Apache-2
AzureML SDK (🥈25 · ⭐ 3.4K) - 带有ML的Python笔记本和带有Azure的深度学习示例。MIT
livelossplot (🥉23 · ⭐ 1.2K) - Jupyter Notebook for Keras的实时训练loss图。MIT
knockknock (🥉22 · ⭐ 2.5K · 💀) - 当您的训练结束后通知您。MIT
hiddenlayer (🥉20 · ⭐ 1.6K · 💀) - 神经网络图和训练指标。MIT
TensorWatch (🥉19 · ⭐ 3.2K · 💀) - Python机器学习的调试,监视和可视化。MIT
quinn (🥉17 · ⭐ 350 · 💀) - pyspark方法可提高开发人员的工作效率。❗Unlicensed
TensorBoard Logger (🥉15 · ⭐ 620 · 💀) - 简易TensorBoard日志记录库。MIT
SKLL (🥉14 · ⭐ 530 · 💤) - SciKit学习实验室(SKLL)使机器学习易于操作。❗Unlicensed
ModelChimp (🥉14 · ⭐ 120 · 💤) - 机器和深度学习项目的实验跟踪。BSD-2
-
GitHub (👨💻 3 · 🔀 12 · 📋 14 - 28% open · ⏱️ 01.08.2021):
git clone https://github.com/ModelChimp/modelchimp
-
PyPi (📥 43 / month):
pip install modelchimp
-
Docker Hub (📥 660 · ⏱️ 09.04.2019):
docker pull modelchimp/modelchimp-server
用于将模型序列化为文件,在各种模型格式之间进行转换以及优化模型以进行部署的库。
Core ML Tools (🥇25 · ⭐ 2.8K) - 核心ML工具包含用于核心ML模型的支持工具。BSD-3
TorchServe (🥈24 · ⭐ 2.8K) - 在PyTorch上进行模型服务。Apache-2
-
GitHub (👨💻 120 · 🔀 570 · 📥 2K · 📋 970 - 14% open · ⏱️ 25.08.2022):
git clone https://github.com/pytorch/serve
-
PyPi (📥 17K / month):
pip install torchserve
-
Conda (📥 33K · ⏱️ 13.05.2022):
conda install -c pytorch torchserve
-
Docker Hub (📥 1M · ⭐ 15 · ⏱️ 19.07.2022):
docker pull pytorch/torchserve
Hummingbird (🥉22 · ⭐ 3K) - 蜂鸟将训练有素的机器学习模型编译为张量计算,以用于..MIT
sklearn-porter (🥉20 · ⭐ 1.2K) - 将经过训练的scikit-learn估计器转换为C,Java等。BSD-3
pytorch2keras (🥉18 · ⭐ 810 · 💤) - PyTorch到Keras模型转换器。MIT
Larq Compute Engine (🥉17 · ⭐ 210) - 高度优化的二值化推理引擎。Apache-2
用于可视化,解释,调试,评估和解释机器学习模型的库。
InterpretML (🥇28 · ⭐ 4.9K) - 拟合可解释的模型。对机器学习黑匣子进行解释。MIT
scikit-plot (🥈26 · ⭐ 2.2K · 💀) - 一个直观的库,可向其中添加绘图功能。MIT
explainerdashboard (🥈26 · ⭐ 1.3K) - 快速构建可显示内部信息的可解释AI仪表板。MIT
Model Analysis (🥈26 · ⭐ 1.2K) - TensorFlow的模型分析工具。Apache-2
Fairness 360 (🥈24 · ⭐ 1.8K) - 一整套用于数据集的公平度量标准。Apache-2
Explainability 360 (🥈24 · ⭐ 1.1K) - 数据和机器学习的可解释性。Apache-2
yellowbrick (🥈22 · ⭐ 3.7K) - 可视化分析和诊断工具,方便机器使用。Apache-2
tf-explain (🥉21 · ⭐ 940) - 使用Tensorflow 2.x的tf.keras模型的可解释性方法。MIT
random-forest-importances (🥉21 · ⭐ 510 · 💀) - 随机森林特征重要度计算。MIT
sklearn-evaluation (🥉21 · ⭐ 340) - 机器学习模型评估变得容易。MIT
TreeInterpreter (🥉20 · ⭐ 720 · 💀) - 解释scikit-learn决策树的程序包。BSD-3
What-If Tool (🥉19 · ⭐ 740 · 💤) - What-If工具的源代码/网页/演示。Apache-2
model-card-toolkit (🥉19 · ⭐ 300) - 模型解释与分析卡片工具库。Apache-2
fairness-indicators (🥉19 · ⭐ 270) - Tensorflow的公平性评估和可视化。Apache-2
iNNvestigate (🥉18 · ⭐ 1K) - 神经网络预估分析工具箱。BSD-2
FlashTorch (🥉17 · ⭐ 680 · 💀) - PyTorch中用于神经网络的可视化工具包。MIT
ExplainX.ai (🥉17 · ⭐ 320 · 💀) - 适用于数据科学家的可解释AI框架。MIT
contextual-ai (🥉13 · ⭐ 81 · 💤) - AI 模型可解释性工具。Apache-2
Attribution Priors (🥉11 · ⭐ 100 · 💀) - 训练可解释模型的工具。MIT
bias-detector (🥉11 · ⭐ 40 · 💤) - Bias Detector是用于检测机器偏差的python软件包。MIT
用于近似最近邻居搜索和向量索引/相似性搜索的库。
🔗 ANN Benchmarks ( ⭐ 3K) - Benchmarks of approximate nearest neighbor libraries in Python.
Milvus (🥇29 · ⭐ 12K) - 一个开源的embedding嵌入向量相似度搜索引擎。Apache-2
-
GitHub (👨💻 220 · 🔀 1.4K · 📥 44K · 📋 5.7K - 4% open · ⏱️ 26.08.2022):
git clone https://github.com/milvus-io/milvus
-
PyPi (📥 130K / month):
pip install pymilvus
-
Docker Hub (📥 1.3M · ⭐ 21 · ⏱️ 26.08.2022):
docker pull milvusdb/milvus
PyNNDescent (🥈28 · ⭐ 660) - 适用于近似最近邻查找的Python库。BSD-2
PySparNN (🥉11 · ⭐ 900 · 💀) - C++/Python中的近似最近邻居实现,并针对内存使用进行了优化。BSD-3
-
GitHub (👨💻 5 · 🔀 140 · 📋 29 - 51% open · ⏱️ 31.01.2018):
git clone https://github.com/facebookresearch/pysparnn
提供概率编程/推理,贝叶斯推理,高斯过程或统计信息的功能的库。
patsy (🥈27 · ⭐ 850) - 使用符号公式描述Python中的统计模型。❗Unlicensed
PyMC3 (🥈26 · ⭐ 6.9K) - Python中的概率编程。❗Unlicensed
pomegranate (🥈26 · ⭐ 2.9K) - 在Python中快速,灵活且易于使用的概率建模。MIT
tensorflow-probability (🥉24 · ⭐ 3.8K) - 概率推理与统计分析。Apache-2
Edward (🥉23 · ⭐ 4.7K · 💀) - TensorFlow中的一种概率编程语言。❗Unlicensed
Orbit (🥉21 · ⭐ 1.5K) - 用于贝叶斯预测的Python软件包,具有面向对象的设计。❗Unlicensed
scikit-posthocs (🥉20 · ⭐ 250) - Python中的多个成对比较(Post Hoc)测试。MIT
ZhuSuan (🥉14 · ⭐ 2.1K · 💀) - TensorFlow中的一种概率编程语言。MIT
-
GitHub (👨💻 20 · 🔀 400 · 📋 60 - 11% open · ⏱️ 05.08.2019):
git clone https://github.com/thu-ml/zhusuan
用于测试机器学习模型抵抗攻击性/恶意示例的鲁棒性的库。
CleverHans (🥈26 · ⭐ 5.6K · 💤) - 一个用于构造攻击的对抗性示例库。MIT
TextAttack (🥈26 · ⭐ 2.1K) - TextAttack是用于对抗攻击,数据的Python框架。MIT
advertorch (🥉18 · ⭐ 1.1K) - 对抗性鲁棒性研究的工具箱。❗️GPL-3.0
robustness (🥉17 · ⭐ 720) - 一个用于实验,训练和评估神经网络的库。MIT
需要并利用CUDA / GPU系统功能来优化数据处理和机器学习任务的库。
CuPy (🥇32 · ⭐ 6.3K) - CUDA加速了与NumPy兼容的数组库。MIT
-
GitHub (👨💻 310 · 🔀 590 · 📥 42K · 📦 1.2K · 📋 1.8K - 21% open · ⏱️ 23.08.2022):
git clone https://github.com/cupy/cupy
-
PyPi (📥 20K / month):
pip install cupy
-
Conda (📥 1.8M · ⏱️ 29.07.2022):
conda install -c conda-forge cupy
-
Docker Hub (📥 55K · ⭐ 8 · ⏱️ 28.07.2022):
docker pull cupy/cupy
PyCUDA (🥈22 · ⭐ 1.4K) - 适用于Python的CUDA集成,有着出色的功能。❗Unlicensed
scikit-cuda (🥉20 · ⭐ 910) - GPU工具库的python接口。❗Unlicensed
Vulkan Kompute (🥉18 · ⭐ 920) - 适用于跨供应商的通用GPU计算框架。Apache-2
DALI (🥉17 · ⭐ 4K) - GPU加速的库,其中包含高度优化的构建块。Apache-2
-
GitHub (👨💻 77 · 🔀 500 · 📋 1.2K - 15% open · ⏱️ 25.08.2022):
git clone https://github.com/NVIDIA/DALI
nvidia-ml-py3 (🥉17 · ⭐ 86 · 💀) - NVIDIA Management Library的Python3接口。❗Unlicensed
BlazingSQL (🥉15 · ⭐ 1.8K · 💤) - BlazingSQL是一种用于GPU的轻量级,GPU加速的引擎。Apache-2
SpeedTorch (🥉14 · ⭐ 660 · 💀) - 用于更快的Pytorch中CPU-GPU传输的工具库。MIT
cuSignal (🥉14 · ⭐ 610) - GPU加速信号处理。Apache-2
-
GitHub (👨💻 39 · 🔀 96 · 📋 140 - 11% open · ⏱️ 10.08.2022):
git clone https://github.com/rapidsai/cusignal
ipyexperiments (🥉11 · ⭐ 150 · 💤) - jupyter/ipython实验容器。❗Unlicensed
TensorFlow的拓展工具库。
tensor2tensor (🥇31 · ⭐ 13K) - 设计深度学习模型和数据集的库。Apache-2
tensorflow-hub (🥇31 · ⭐ 3.2K) - 通过重用部分库来进行迁移学习的库。Apache-2
TensorFlow Transform (🥈30 · ⭐ 930 · 📈) - 输入管道框架。Apache-2
TF Model Optimization (🥈29 · ⭐ 1.3K) - 用于优化ML模型以进行部署的工具包。Apache-2
Neural Structured Learning (🥉26 · ⭐ 930) - 用结构化信号训练神经模型。Apache-2
TensorFlow I/O (🥉25 · ⭐ 570) - Dataset, streaming, and file system extensions.. Apache-2
efficientnet (🥉24 · ⭐ 2K · 💀) - EfficientNet模型的实现。Apache-2
TensorFlow Cloud (🥉23 · ⭐ 330) - TensorFlow Cloud存储库提供的API。Apache-2
TensorNets (🥉20 · ⭐ 1K · 💀) - 具有预先训练的权重的高级网络定义。MIT
TF Compression (🥉19 · ⭐ 640) - TensorFlow中的数据压缩。Apache-2
scikit-learn的拓展工具库。
imbalanced-learn (🥇32 · ⭐ 6K) - 一个解决不平衡类别数据建模的Python程序包。MIT
MLxtend (🥇30 · ⭐ 4.1K) - 用于Python数据的扩展和帮助程序模块库。❗Unlicensed
category_encoders (🥇30 · ⭐ 2K) - A library of sklearn compatible categorical variable.. BSD-3
fancyimpute (🥈25 · ⭐ 1.1K · 💤) - 多元插补和矩阵补全算法。Apache-2
scikit-multilearn (🥈24 · ⭐ 770) - 基于scikit-learn的多标签等模块。BSD-2
scikit-opt (🥈23 · ⭐ 3.5K) - 遗传算法,粒子群优化等实现。MIT
scikit-lego (🥈22 · ⭐ 880) - scikit学习管道的额外块。MIT
iterative-stratification (🥈22 · ⭐ 710) - scikit-learn交叉验证器。BSD-3
sklearn-crfsuite (🥈22 · ⭐ 410 · 💀) - 用于CRFsuite的scikit-learn启发式API。❗Unlicensed
skope-rules (🥉20 · ⭐ 480 · 💀) - 使用Python中的逻辑规则进行机器学习。❗Unlicensed
sklearn-contrib-lightning (🥉19 · ⭐ 1.6K · 💤) - 大规模线性分类,回归分析等。❗Unlicensed
scikit-tda (🥉16 · ⭐ 360) - Python的拓扑数据分析。❗Unlicensed
Pytorch的拓展工具库。
pretrainedmodels (🥇27 · ⭐ 8.6K · 💀) - pytorch预训练的ConvNets:NASNet,ResNeXt等BSD-3
pytorch-optimizer (🥇26 · ⭐ 2.5K · 💤) - torch-optimizer - pytorch的优化器集合。Apache-2
pytorch-summary (🥈25 · ⭐ 3.6K · 💀) - PyTorch中的模型摘要类似于`model.summary()`。MIT
torchdiffeq (🥈24 · ⭐ 4.2K) - 具有完整GPU支持的可微分ODE求解器。MIT
SRU (🥈22 · ⭐ 2.1K · 💀) - 与CNN一样快地训练RNN(https://arxiv.org/abs/1709.02755)。MIT
EfficientNet-PyTorch (🥈21 · ⭐ 7.1K · 💀) - EfficientNet等模型的PyTorch实现Apache-2
EfficientNets (🥈21 · ⭐ 1.5K · 💀) - 预训练的EfficientNet,EfficientNet-Lite,MixNet等Apache-2
Pytorch Toolbelt (🥈21 · ⭐ 1.3K) - PyTorch扩展用于快速研发原型和Kaggle实验。MIT
PyTorch Sparse (🥈21 · ⭐ 710) - 优化图聚类的PyTorch扩展库MIT
reformer-pytorch (🥉20 · ⭐ 1.8K) - Reformer,Pytorch中高效的transformer实现。MIT
torch-scatter (🥉20 · ⭐ 1.1K) - 优化图聚类的PyTorch扩展库MIT
Performer Pytorch (🥉20 · ⭐ 860) - Performer的实现。MIT
Poutyne (🥉20 · ⭐ 530) - PyTorch的简化框架和实用程序。❗️LGPL-3.0
Antialiased CNNs (🥉19 · ⭐ 1.6K · 💤) - pip安装antialiased-cnns以提高稳定性等。❗️CC BY-NC-SA 4.0
tinygrad (🥉17 · ⭐ 6.5K) - You like pytorch? You like micrograd? You love tinygrad!. MIT
-
GitHub (👨💻 62 · 🔀 650 · 📦 3 · 📋 110 - 14% open · ⏱️ 23.08.2022):
git clone https://github.com/geohot/tinygrad
Tensor Sensor (🥉17 · ⭐ 650) - 该库的目标是为numpy/pytorch矩阵代数表达式生成更有用的异常消息。MIT
Lambda Networks (🥉16 · ⭐ 1.5K · 💀) - LambdaNetworks的实现。MIT
torchsde (🥉16 · ⭐ 1K · 💀) - 具有GPU支持且高效的可微分SDE求解器。Apache-2
-
GitHub (👨💻 5 · 🔀 110 · 📦 19 · 📋 50 - 18% open · ⏱️ 26.07.2021):
git clone https://github.com/google-research/torchsde
Pywick (🥉14 · ⭐ 370 · 💤) - 更高层次的pytorch神经网络训练库。❗Unlicensed
Torch-Struct (🥉13 · ⭐ 1K · 💤) - 快速,通用和经过测试的微分结构化预测。MIT
-
GitHub (👨💻 16 · 🔀 83 · 📋 54 - 44% open · ⏱️ 30.01.2022):
git clone https://github.com/harvardnlp/pytorch-struct
用于连接,操作和查询数据库的库。
🔗 Python DB Clients ( ⭐ 7 · 💤) - Collection of database clients for python.
SymPy (🥇35 · ⭐ 9.5K) - 用纯Python编写的计算机代数系统。❗Unlicensed
Cython BLIS (🥈28 · ⭐ 190) - 快速矩阵乘法库。❗Unlicensed
carla (🥈27 · ⭐ 8.2K · 💤) - 用于自动驾驶研究的开源模拟器。❗Unlicensed
metric-learn (🥉26 · ⭐ 1.3K) - Python中的度量学习算法。MIT
causalml (🥉24 · ⭐ 3.2K) - 利用机器学习提升建模和因果推理。❗Unlicensed
pyclustering (🥉24 · ⭐ 990 · 💀) - pyclustring是Python,C++数据挖掘库。BSD-3
pyopencl (🥉22 · ⭐ 910) - 适用于Python的OpenCL集成。❗Unlicensed
River (🥉20 · ⭐ 3.6K) - Python中的在线机器学习。BSD-3
-
GitHub (👨💻 81 · 🔀 380 · 📦 160 · 📋 370 - 1% open · ⏱️ 24.08.2022):
git clone https://github.com/online-ml/river
StreamAlert (🥉19 · ⭐ 2.7K) - StreamAlert是无服务器的实时数据分析框架。Apache-2
-
GitHub (👨💻 33 · 🔀 320 · 📋 340 - 24% open · ⏱️ 20.07.2022):
git clone https://github.com/airbnb/streamalert
Feature Engine (🥉16 · ⭐ 22) - 具有sklearn类功能的功能工程包。BSD-3
cleanlab (🥉13 · ⭐ 49 · 🐣) - 机器学习的标准软件包。❗️AGPL-3.0
- Python资源汇集列表: 周更新的各种应用方向与主题的资源汇集列表
- [**p