今年2月的时候开始学习台大林轩田老师的机器学习课程,感觉讲的非常好,课程的参考教材是learning from data,网上查阅资料的时候发现关于这本书的笔记几乎没有,所以想自己做一个学习笔记,记录教材中的习题的解法,一来可以加深自己的理解,而来也可以给后来学习的小伙伴一些参考。这份笔记主要以learning from data的习题解析为主,笔记形式为Markdown以及Jupyter Notebook结合的形式。因为笔者水平有限,难免有些错误,欢迎指出。
参考资料:
https://blog.csdn.net/a1015553840/article/details/51085129
http://www.vynguyen.net/category/study/machine-learning/page/6/
http://book.caltech.edu/bookforum/index.php
补充说明:由于Jupyter Notebook比较卡,后续就不上传Jupyter Notebook文件了,代码已存在子目录代码文件夹内,前两章的代码后续也会保存下来,推荐使用pdf加代码来查阅。
2018/6/1
- 上传Chapter1
2018/6/15
- 上传Chapter2
- 2018/10/8日更新:根据网友RingoTC提醒(链接),修改problem 2.2并对一些排版做了一些调整。
2018/7/1
- 上传Chapter3
2018/7/15
- 上传Chapter4,Chapter5
2018/7/31
- 上传Chapter8
2018/9/5
- 上传Chapter7
2018/11/29
- 感谢黄博的推广,最近star的小伙伴逐渐增多,我后续会抽空对资料进行一些优化,如果大家发现什么问题可以直接发issue,希望能借助大家的力量把这份资料做的更好,谢谢!另外最后两个章节已经完成了一部分,争取年底左右完成。
2018/12/4
- 上传Chapter6,Chapter9的草稿,其中Chaper6大部分已经完成,Chapter9只完成了一部分,后续部分会尽快给出解答。
2018/12/12
- 完成Chapter9绝大多数内容,剩余少部分等有空再解答。
2018/12/14
- 完成Chapter6绝大多数内容,剩余少部分等有空再解答。
前后历时半年多,总算把LFD的习题整理完了,除了第六章,第八章和第九章少部分习题以外,其他所有习题均已完成。总的来说,教材的上半部分(第一章到第五章)是精髓,补充部分(第六章到第九章)略逊一筹,而且有一些错误,其中第九章如果是初学可以忽略。
这本书是台大林轩田老师的机器学习课程配套教材,内容通俗易懂,非常精彩,不是单纯罗列公式,是一本非常适合入门的机器学习书籍。但是尽管该书是一本入门书籍,要吃透这本书还是需要相当多的时间,尤其是课后习题部分,有的难度非常大,所以我在学习的过程中将习题都整理了一遍,方便自己以后查阅和他人参考。
后续的计划是明年初将课本再复习一遍,并对自己整理的资料再优化一下,完成剩余少部分缺的题目,有时间的话会写一些学习笔记,将课本中的算法自己都实施一遍。
章节 | 总共习题 | 完成习题 | 剩余部分 |
---|---|---|---|
Chapter 1 | 25 | 25 | 无 |
Chapter 2 | 32 | 32 | 无 |
Chapter 3 | 35 | 35 | 无 |
Chapter 4 | 38 | 38 | 无 |
Chapter 5 | 11 | 11 | 无 |
Chapter 6 | 43 | 36 | Problem 12,13,14,16,17,24,25 |
Chapter 7 | 35 | 35 | 无 |
Chapter 8 | 35 | 31 | Problem 15-18 |
Chapter 9 | 46 | 41 | Exercise 18,Problem 17,26,27,28 |
总计 | 300 | 284 |