本项目是基于 Jeremy Howard 与 Sylvain Gugger 所著的「Deep Learning for Coders with fastai & PyTorch:Al Applications Without a PhD」的开源版 Fastbook,感谢 Jeremy Howard 对项目的授权与支持。
本项目由单博士与王程序共同创建并维护
- 单博士( Helen Shan)承担了同 Jeremy Howard 对接,及翻译工作。
- 王程序 负责技术、评审工作。
本项目是讲授深度学习快速实现的教程,并包含工程代码。用于帮助那些有志挑战深度学习,但苦于没有深厚的工程或数学背景,及英文不是非常精通的朋友们。
很多人认为,想要利用深度学习取到很好的结果需要各种难以获取的资源,但是通过这本书您会发现这种想法是错误的。下表列举了几项,即便是世界级的深度学习任务也是完全不需要具备。
误解(不需要) | 真相 |
---|---|
大量专业数学知识 | 高中数学就足够了 |
海量数据 | 我们曾见过用不到50条的数据取得破纪录结果 |
大量昂贵的算力 | 你可以免费获得最先进的工作成果 |
记住,你不需要任何特定的学术背景就能在深度学习中取得成功。许多重要的突破都是由没有博士学位的人在研究和实践中取得的,比如这篇论文“基于深度卷积生成对抗网络的无监督表示学习”,这是过去十年中最具影响力的论文之一,引用次数超过5000次,是亚历克·雷德福(Alec Radford)在读本科的时候撰写的。即使在特斯拉,他们正在努力解决制造自动驾驶汽车这一极其艰巨的挑战,首席执行官埃隆·马斯克说:
“绝对不要求必须具有博士学位。重要的是对人工智能的深刻理解和具备采用切实有效的方法来实现神经网络的能力(后者才是真正的难点)。高中毕业也无所谓的。”
然而,要想成功,你需要做的是将你在本书中学到的东西应用到个人项目中,并始终坚持下去。
graph LR
Helen[单博士翻译]
YHWang[王程序评审]
Disc[遗留问题]
Conf[共同评审]
ReQ[合并主线]
subgraph 翻译工作
Helen -->|提交| YHWang -.->|反馈| Helen
end
subgraph 共同讨论
YHWang --> Disc --> Conf
end
subgraph 内容产出
Conf --> ReQ
end
每个合并到主线版本的内容,都会走这个工作流程。几乎每天我们都会花大量的时间对分歧点进行讨论,有翻译语法、技术层面、算法理解、专业术语等,在我们能力范围内,力求给大家呈现出相对准确的内容。如大家发现偏差或错误可以提 Issues ,我们共同完善。
本项目对硬件的要求不是特别挑剔,如动手能力强可以选择自己喜欢的硬件。但本项目是讲授深度学习的,为了聚焦学习内容本身,避免出现因环境问题而导致实践代码训练模型出错(真的会出现)而分散学习精力,强烈建议使用配有英伟达GPU的计算机。
-
利用Anaconda配置一个虚拟运行环境,安装教程参见机器学习环境配置系列三之Anaconda。如果感觉Anaconda太大,且对命令交互情有独钟,可以安装miniforge来配置环境,可达到同样的效果。
-
创建您的运行环境
conda create -n 环境名 python=版本号
如,定义环境名为smartbook,使用python的版本为3.10.6:
conda create -n smartbook python=3.10.6
-
激活您的运行环境
conda activate 环境名
如,激活命名为smartbook的环境:
conda activate smartbook
-
安装所需的依赖包。
pip install -r requirements.txt
如果感觉安装速度慢,可以使用国内源,如下所示pip install -r requirements.txt -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
在运行本项目实践代码时,如提示依赖包缺失的问题,可以单独安装。
pip install 依赖包名
-
安装Jupyter Notebook命令。
pip install notebook
-
现在可以启动您的Jupyter来运行本项目了,命令如下:
jupyter notebook
注意:务必进入本项目文件夹后运行Jupyter,否则您会找不到运行文件。
-
截至第6步您可以在本地环境运行本项目了。因本项目需要运行模型训练实践代码,对机器性能有一定的要求,如果您有自己的GPU服务器,并在上面配置运行环境,需要远程登陆Jupyter Notebook服务来运行本项目,可以参见机器学习环境配置系列六之jupyter notebook远程访问配置教程。
第一章 开启深度学习之旅(完成)
第二章 产品(校对中)
第三章 数据伦理(未开始)
第四章 mnist基础(未开始)
第五章 基于宠物品种的图像分类(未开始)
第六章 多标签分类(未开始)
第七章 数据尺寸和测试数据增强(未开始)
第八章 协同过滤(未开始)
第九章 表格模型(未开始)
第十章 自然语言处理(未开始)
第十一章 数据处理中级API(未开始)
第十二章 自然语言处理深潜(未开始)
第十三章 卷积(未开始)
第十四章 残差网络(未开始)
第十五章 应用架构深入研究(未开始)
第十六章 加速随机梯度下降(未开始)
第十七章 基础神经网络(未开始)
第十八章 类激活映射(未开始)
第十九章 学习器(未开始)
第二十章 总结思考(未开始)
如您希望与更多的伙伴交流切磋,可扫描下方二维码申请加群。
ps:务必扫码添加备注【人工智能学习交流】