利用Python进行数据分析 2017 第二版（Python for Data Analysis, 2nd Edition）中文翻译笔记

这本书的英文版github仓库：pydata-book

作者Wes McKinney是pandas的创作者，所以书中关于pandas的讲解也是最实用的部分。我也直接联系过了Wes本人，这个笔记不会有任何版权问题，当然，也不会用于任何商业用途。

这本书自2013年第一版发行后，就广受好评。第一版的时候作者用的是Python2，不过随着Python2的维护年限将近（2020），以及Python3的推广，整个社群向Python3转变已经成为不可扭转的趋势。所以在第二版里，作者使用了Python3.6。而我实际写的代码则是基于Python3.5，使用上没有任何差别。

2017第二版主要更新：

所有代码，包括Python教程，都升级到了Python3.6（第一版用的是Python2.7）

更新了Python的安装介绍。这次改用Anaconda Python发行版，以及其他一些需要的Python包

使用了最新的2017版pandas

新增了一章，用来介绍pandas的高级应用工具，和其他一些有用的小贴士

简单介绍了如何使用statsmodels和scikit-learn

本来很早就知道这本书了，直到最近才终于有时间，打算把这本书完整过一遍，顺便用jupyter做成笔记方便以后查阅。结果我在看第一版第三章的时，突然发现作者已经在2017年推出了第二版，不过暂时还没有中文版。想了想反正也要做成笔记，索性直接把英文翻译成中文，做一个简洁版的Notebook版本分享出来好了，也算是为开源世界做点小贡献。

在写笔记的时候，我尽量写中文，不过有一些专有名字我是直接写英文，然后配上中文翻译，毕竟有时候知道英文单词的话查找英文的文档也方便一些，而且我相信这样做对提升中文和英文专业名字的对照关系有帮助。毕竟在程序员的世界里，不懂英语会很艰难，即使是一些简单的单词，也是我们走向新世界的起点。

另外我并不是逐字逐句翻译，因为这样翻译出来的效果洋味十足，很难懂。我尽可能按方便理解的方式进行翻译，其他一些没有用的话我不进行翻译。这本书中的翻译并不是经过特别考究的，内容上也会有很多个人的解释。推荐大家等正式的中文版推出后进行购买，翻译质量肯定会比我的有保障。不过因为是一个人在翻译整本书，工作量比较大，难免有错误和疏漏的地方，或者有读起来觉得奇怪的地方，如果有发现的话不要客气，请尽管说出来，欢迎任何改进和Pull Request。

声明

我的翻译行为完全是出于自己的兴趣，并没有经过国内出版社的授权。经一些朋友的提醒，国外的作者本人是不享有翻译权的，即使我获得了原作者的许可，也不能私自进行翻译。而且国内已经有译者获得了本书的翻译权，中文版也快要面世了。所以我会和国内的出版社联系，看能否给本书的出版出一份力，如果无法合作的话，我会删除整个项目。希望大家支持正版，尊重国内译者的劳动成果。

License

The code in this repository, including all code samples in the notebooks listed above, is released under the MIT license. Read more at the Open Source Initiative.

kinsluck/pydata-notebook

利用Python进行数据分析 2017 第二版 （Python for Data Analysis, 2nd Edition）中文翻译笔记

声明

License

利用Python进行数据分析 2017 第二版（Python for Data Analysis, 2nd Edition）中文翻译笔记