/MLDLRL

一些AI相关笔记(ML、DL、RS、RL)

Primary LanguageHTML

PDF与Word的内容一般是一样的,但PDF可能落后一些版本,因为我懒得每次写完转PDF,但是PDF确实方便阅读。

html是markdown直接导出的,方便阅读。

以PDF为例,本笔记的整个结构与描述是:

.
├── 数学基础.pdf        [√]主要是线代与概率论,参考的鸢尾花书、雷明
├── 数据分析-Code.pdf   [√]之前的练手的,能run,但是正在整理与重构中,请参考我的Easier_DataScience仓库
├── 机器学习.pdf        [正在更新]机器学习(含DL)的原理推导(一般不推导纯数学公式)
├── 推荐系统.md         [正在更新]推荐系统的一些原理
├── 深度学习.md         [正在更新]对深度学习的一些总结,具体部分是在机器学习.pdf中
├── LaTex.md           记录一些LaTeX语法
├── git.md             记录一些git语法
├── 代码基础.pdf        [×]刚学的时候记录的,还没翻新,逻辑可能混乱
├── 数据处理-Code.pdf   [×]虽然数据处理很重要,但是我比较懒,还没翻新,而且也可以在Easier_DataScience中找到

建议将数学基础当做查阅,

机器学习的还是可以的(自认为),

数据分析的代码请参考Easier_DataScience(基本所有的机器学习、深度学习等的代码都会整合到里面去,形成统一而便捷的api调用或是demo),

推荐系统正在学习中。

1.最主要、最好的的参考资料与个人的一点推荐:

  1. 《鸢尾花书》 - 从加减乘除到机器学习
    • 推荐理由:配图极其优秀,整体逻辑比较连贯,原理讲解很棒。
    • 缺陷:有些啰嗦,没办法速通,代码写的也是一坨,甚至不肯格式化一下。
  2. 《动手学深度学习》 - 面向中文读者的能运行、可讨论的深度学习教科书,简称d2l
    • 推荐理由:深度学习实操,除了部分大一点的模型我的电脑太辣鸡直接爆显存之外,基本都能直接运行,而且原理的讲解确实牛逼,社区也不错。
    • 缺陷:虽然是中文,但是很有机翻的感觉。什么都放在d2l.py里了,代码逻辑比较混乱,需要自己重构一部分代码,但是起码也算是我目前见过的代码写得比较好的了。
  3. Easier_DataScience - [自荐]我写的一些便于MLDL等AI相关的module或是一些demo,希望调用或复用的时候更方便
    • 推荐理由:方便调用,不用每次都写一遍
    • 缺陷:还在更新中,有些模块还没写完或者还没测试,部分代码逻辑可能不够清晰
  4. 雷明-机器学习的数学 - 机器学习的数学基础
    • 推荐理由:数学推导比较详细,适合想要深入了解的人。
    • 缺陷:没图,全是公式。另外目前还没在网上找到电子书,我是买的纸质的。

2.其余推荐资料 (我是动手学的狗):

打○的就是我没看过,阿巴阿巴~

中文社区的资料就这鬼样子,真的烂大街的我肯定不会放上来了。

以下排名分先后(我没看的不算):

  1. 李宏毅深度学习教程 LeeDL Tutorial
    • 不是入门书,可以先看d2l再看这个。这个书提及了很多细节与问题,更多的是启发性思考,书中主要是讲解一些深度学习的原理,不过没有代码实现。
    • 我的评价是神中神!
  2. AI数学笔记 Liang's BlogAI算法工程师手册 huaxiaozhuan
    • 比较难的公式推导都有,按需查阅。
    • 感觉挺全面的。
  3. 动手学ML
    • 电子书,免费。
    • 不是入门书,适合有一定基础的看。
    • 部分公式存在严重错误,但是讲解还可以,需要有自己的判断能力。
    • 习题答案可以参考:motewei
  4. 文亮-推荐系统技术原理与实践
    • 有电子书(需要异步会员,但是异步会员可以通过已经购买了的纸质书兑换),相当于半白嫖。
    • 整体讲解还可以,最好搭配FunRec一起看。
    • 举例大部分是阿里巴巴的模型,难道阿里巴巴给他打钱了?
  5. 动手学NLP
    • 无电子版(异步都没电子版),买了纸质书,书挺好的,但我现在被劝退了,我不适合学NLP,感觉NLP的理论不美。
  6. 王晓华-从零开始大模型开发与微调:基于PyTorch与ChatGLM
    • 有电子版,付费,跟纸质版价格差不多。有神秘链接,但是要快手关注才能拿密码,我又没下。。。
    • 这本书不适合0基础,而是适合学了一点之后再看。其号称“通俗易懂”的原因是难的都不讲,都让读者“自行在网上查阅”。
    • 没有原理讲解,代码写的屎到不行而且有些感觉直接copy的连注释都是英文(我见过的最烂的),唯一的优势是新且比较实用。
  7. 动手学CV
    • 无电子版,而且github仓库都没建好,纸质书好像也没了,所以我没看
  8. 动手学RL
    • 有电子版,据说好
  9. 带注释的pytorch论文实现
    • 个人感觉翻译得非常差,但是类似的其他资源还没找到更好的
  10. 强化学习导论
  11. 人大LLM-Book
    • 可下载阅读

以下请避雷:

  1. 扩散原理从入门到实战-异步图书:没有原理讲解,我看完了还是一知半解的状态,代码是英文原版的机翻。另外其实这是个开源的书,感觉不如看这个开源资料
  2. 自动机器学习入门与实践-华中科技大学出版社:没有原理讲解,大部分是ML而非autoML,代码就是英文原版的一个字都没改。

3.部分大型的开源学习资源

  1. Datawhale-github或者Datawhale-官网 好像都是免费,质量还挺不错的(但是因为显然每一章节的作者不相同,导致逻辑连贯性不够强、符号使用不太统一),但是感觉最近更新的不多。整体来说,我觉得Datawhale的质量还是比较高的,并且有些教程确实是独一无二的,比如plt的我就没在其他地方看到研究得这么细致的。
  2. boyuai-github或者boyuai-官网 有付费内容,但是动手学系列都是免费的,但是动手学NLP,CV的不知道为什么没有电子书了。

4.视频

  1. B站-这是我已经看完了的视频教程的一个收藏夹 主要包括:
  • BV1T84y167U9 机器学习(传统的机器学习算法基本都有)。虽然我不推荐看唐宇迪的视频来学机器学习,但是他的视频确实简单,拿个二倍速过一遍当入门就行。
  • BV1RT411G7jJ 机器学习(侧重统计学习)。内容不是很多,但是讲的都很好
  • BV15V411W7VB 机器学习(侧重神经网络)。跟上面一个一样,内容讲的很不错,能启发思考。
  1. 李沐、李宏毅、吴恩达等大佬的视频,这里不给出链接了,我自己还没看多少。

5.对于我阅读较久的书籍&视频的一些打分

书籍 整体印象1 阅读舒适度2 实用性3 逻辑性4 启发性5 语言6
《动手学深度学习》 9 ★★★★★ ★★★★☆ ★★★★☆ ★★★★☆ ★★★☆☆
《鸢尾花书》 8.5 ★★★★☆ ★★★☆☆ ★★★★☆ ★★★★★ ★★★★★
《机器学习的数学》 8 ★★★☆☆ ★★★★☆ ★★★★☆ ★★★☆☆ ★★★★☆
动手学ML 7 ★★★☆☆ ★★★☆☆ ★★★★☆ ★★★☆☆ ★★★☆☆
BV1T84y167U9 5 ★★★★☆ ★★★★☆ ★★☆☆☆ ★☆☆☆☆ ★★★☆☆

以上是我觉得还不错的资料的评分。评分十分主观,仅供参考,应当根据自己的学习目的与风格选择适合自己的学习资料。

Footnotes

  1. 整体印象是我的主观感受。

  2. 阅读舒适度是能不能让人有继续阅读的冲动。

  3. 实用性主要是看代码写的好不好。

  4. 逻辑性主要看作者的思维。

  5. 启发性主要看作者能否给我带来启发。

  6. 语言是指作者的语言表达能力,不是指代码的语言。包括:是否是母语或者翻译得是否是个正常人、描述是否清晰、用词是否准确。