- ⚡修正部分已知文字错误和代码错误
- 🤗添加在线文档
- 2023.09.12添加章节:组合和堆叠方法、可重复代码和模型方法
Abhishek Thakur,很多 kaggler 对他都非常熟悉,2017 年,他在 Linkedin 发表了一篇名为Approaching (Almost) Any Machine Learning Problem的文章,介绍他建立的一个自动的机器学习框架,几乎可以解决任何机器学习问题,这篇文章曾火遍 Kaggle。
Abhishek 在 Kaggle 上的成就:
- Competitions Grandmaster(17 枚金牌,世界排名第 3)
- Kernels Expert (Kagglers 排名前 1%)
- Discussion Grandmaster(65 枚金牌,世界排名第 2)
目前,Abhishek 在挪威 boost 公司担任首席数据科学家的职位,这是一家专门从事会话人工智能的软件公司。
本文对Approaching (Almost) Any Machine Learning Problem进行了中文翻译,由于本人水平有限,且未使用机器翻译,可能有部分言语不通顺或本土化程度不足,也请大家在阅读过程中多提供宝贵意见。另附上书籍原项目地址,转载请一定标明出处!
本项目支持在线阅读,方便您随时随地进行查阅。
因为有几章内容太过基础,所以未进行翻译,详细情况请参照书籍目录:
- 准备环境(未翻译)
- 无监督和有监督学习(未翻译)
- 交叉检验(已翻译)
- 评估指标(已翻译) -
- 组织机器学习(已翻译)
- 处理分类变量(已翻译)
- 特征工程(已翻译)
- 特征选择(已翻译)
- 超参数优化(已翻译)
- 图像分类和分割方法(未翻译)
- 文本分类或回归方法(未翻译)
- 组合和堆叠方法(已翻译)
- 可重复代码和模型方法(已翻译)
我将会把完整的翻译版 Markdown
文件上传到 GitHub,以供大家免费下载和阅读。为了最佳的阅读体验,推荐使用 PDF 格式或是在线阅读进行查看
若您在阅读过程中发现任何错误或不准确之处,非常欢迎通过提交 Issue 或 Pull Request 来协助我进行修正。
随着时间推移,我可能会继续翻译尚未完成的章节。如果您觉得这个项目对您有帮助,请不吝给予 Star 或者进行关注。