/pydata-notebook

利用Python进行数据分析 第二版 (2017) 中文翻译笔记

Primary LanguageJupyter Notebook

利用Python进行数据分析 2017 第二版 (Python for Data Analysis, 2nd Edition)笔记

这里是作者的英文版github地址

可以直接购买英文版:Buy the book on Amazon

2017第二版主要更新:

  1. 所有代码,包括Python教程,都升级到了Python3.6(第一版用的是Python2.7)
  2. 更新了Python的安装介绍。这次改用Anaconda Python发行版,以及其他一些需要的Python包
  3. 使用了最新的2017版pandas
  4. 新增了一章,用来介绍pandas的高级应用工具,和其他一些有用的小贴士
  5. 简单介绍了如何使用statsmodels和scikit-learn

作者Wes McKinney是pandas的创作者,所以说,还有什么比作者本人来直接告诉你pandas哪些用法更实用的呢。我也直接联系过了Wes本人,这个笔记不会有任何版权问题,当然,也不会用于任何商业用途。

这本书自2013年第一版发行后,就广受好评。最近打算把这本书完整过一遍,顺便通过jupyter记录下笔记分享给大家。

我在做第一版第三章的笔记时,才发现作者已经在2017年推出了第二版,不过暂时还没有中文版。所以这里我打算直接把书里的内容翻译成中文,做一个简洁版的Notebook版本。

第一版的时候作者用的是Python2,不过随着Python2的维护年限将近(2020),以及Python3的推广,整个社群向Python3转变已经成为不可扭转的趋势。 所以在第二版里,作者使用了Python3.6。而我实际写的代码则是基于Python3.5,使用上没有任何差别。

在写笔记的时候,我尽量写中文,不过有一些专有名字我是直接写英文,然后配上中文翻译,毕竟有时候知道英文单词的话查找英文的文档也方便一些,而且我相信这样做对提升中文和英文专业名字的对照关系有帮助。毕竟在程序员的世界里,不懂英语会很艰难,即使是一些简单的单词,也是我们走向新世界的起点。

另外我并不是逐字逐句翻译,因为这样翻译出来的结果就是洋味十足,看不懂。我尽量按方便理解的方式进行翻译,其他一些没有用的话我不进行翻译,就像上面说的,这是一个简洁版的笔记,只翻译书中有用的东西。不过因为是一个人在翻译整本书,工作量比较大,难免有错误和疏漏的地方,或者有读起来觉得奇怪的地方,不要客气,请尽管说出来,欢迎任何改进和pull request。

如果觉得有帮助的话,就点个Star吧:)

Jupyter Notebooks:

License

Code

The code in this repository, including all code samples in the notebooks listed above, is released under the MIT license. Read more at the Open Source Initiative.