研究方向

  主要研究机器翻译、文本分类、生成摘要等方向。对序列标注、语言模型、实体关系抽取、目标检测、异常检测、知识蒸馏、数据增强等方向也感兴趣。

博客:甘南第一勇士 微信公众号:源码上门取算法码上到

Python起源

  Python 的创立者,Guido van Rossum,荷兰人。1982 年,Guido 从阿姆斯特丹大学获得了数学和计算机硕士学位。然而,尽管他算得上是一位数学家,但他更加享受计算机带来的乐趣。用他的话说,尽管拥有数学和计算机双料资质,他总趋向于做计算机相关的工作,并热衷于做任何和编程相关的活儿。

  Python 的创始人吉多・范罗苏姆(Guido van Rossum),在 1989 年 12 月的圣诞节期间,为了打发时间,决定开发一种新的脚本解释程序,作为 ABC 语言的继承。1991 年 2 月,第一个 Python 编译器诞生。现在,python 以其优美,清晰,简单的特性在全世界广泛流行,成为最主流的编程语言之一。

Python 的发展历史

  • Python 3.9 - 2020/10/05
  • Python 3.8 - 2019/10/15
  • Python 3.7 - 2018/06/27
  • Python 3.6 - 2016/12/23
  • Python 3.5 - 2015/09/13
  • Python 3.4 - 2014/03/16
  • Python 3.3 - 2012/09/29
  • Python 3.2 - 2011/02/20
  • Python 3.1 - 2009/06/27
  • Python 3.0 - 2008/12/03
  • Python 2.7 - 2010/07/0
  • Python 2.6 - 2008/10/1
  • Python 2.5 - 2006/09/19
  • Python 2.4 – 2004/11/30,同年目前最流行的 WEB 框架 Django 诞生
  • Python 2.0 - 2000/10/16,加入了内存回收机制,构成了现在 Python 语言框架的基础
  • 1999 年 Python 的 web 框架之祖——Zope 1 发布
  • Python 1.0 - January 1994 增加了 lambda, map, filter and reduce.
  • 1991 年,第一个 Python 编译器诞生。它是用 C 语言实现的,并能够调用 C 语言的库文件。从一出生,Python已经具有了:类,函数,异常处理,包含表和词典在内的核心数据类型,以及模块为基础的拓展系统。
  • 1989 年的圣诞节,Guido 开始编写 Python 语言的编译器。

Python 语言的特点

  • 简单易学: Python 语言简洁、优雅,相比其他程序语言(比如:Java,C++ 等),Python 语言更容易阅读和编写。Python语言使用起来很有趣,且该语言更多的是专注于解决方案而不是语法本身。初学者学 Python,不但入门容易,而且将来深入下去,可以编写那些非常非常复杂的程序。
  • 开源且免费: Python 是一门开源的编程语言,可以免费使用,甚至可以用于商业用途。当然,你也可以提交相关贡献代码。Python 有一个庞大的社区来维护并保持快速发展。
  • 可移植性: Python 是跨平台的编程语言,它可以运行在 windows、Mac 和各种 Linux/Unix 系统上。也就是说,假设在windows 系统下编写的 Python 程序,在 Mac 或 Linux 系统下也是可以运行的。
  • 开发效率非常高: Python 有非常强大的第三方库,基本上你想通过计算机实现任何功能,Python 官方库里都有相应的模块进行支持,直接下载调用后,在基础库的基础上再进行开发,大大降低开发周期,避免重复造轮子。
  • 高级语言: 当你用 Python 语言编写程序的时候,你无需考虑诸如如何管理你的程序使用的内存以及垃圾回收一类的底层细节。
  • 可扩展性: 如果你需要你的一段关键代码运行得更快或者希望某些算法不公开,你可以把你的部分程序用 C 或 C++ 编写,然后在你的 Python 程序中使用它们。
  • 可嵌入性: 你可以把 Python 代码嵌入你的 C/C++ 程序,从而向你的程序用户提供脚本功能。
  • 面向对象: Python 中的一切都是对象。面向对象编程(OOP)可以帮助您直观地解决复杂的问题。有了 OOP,你可以通过创建对象把这些复杂的问题划分成更小的集合。

Python 语言的应用领域

  • 数据科学: 数据科学涉及领域很广,涉及到当前火热的人工智能领域。Python 的数据科学包括数据分析、数据可视化、数据挖掘、自然语言处理、机器学习、深度学习等。典型的 Python 库有:Numpy,Scipy,Pandas,Matplotlib,Seaborn,Scikit-learn,tensorflow 等。
  • 云计算: 典型应用—— Python 开发的 OpenStack
  • WEB 开发: 众多优秀的 WEB 框架,比如:Django、flask、tornado
  • 网络爬虫: 使用 Python 可以便捷的编写网络爬虫,从网页上爬取相关信息,常用的Python 库包括:Requests,BeautifulSoup,Scrapy 等。
  • 系统运维: 运维人员必备,slatstack(系统自动化配置和管理工具),Ansible(自动化运维工具)
  • 图形界面开发: wxPython、PyQT、TKinter

使用 Python 的部分知名公司

  • Google - Google Groups、Gmail、Google Maps、AlphaGo 等,Google App Engine 支持 python 作 为开发语言
  • NASA - 美国宇航局,从 1994 年起把 python 作为主要开发语言
  • Dropbox - 美国最大的在线云存储网站,全部用 Python 实现,每天网站处理 10 亿个文件的上传和下载
  • 豆瓣网 - 图书、唱片、电影等文化产品的资料数据库网站
  • BitTorrent - bt 下载软件客户端
  • gedit - Linux 平台的文本编辑器
  • GIMP - Linux 平台的图像处理软件 (Linux 下的 PS)
  • 知乎(国外的 Quora)- 社交问答网站,国内最大的问答社区,通过 Python 开发
  • Autodesk Maya - 3D 建模软件,支持 python 作为脚本语言
  • YouTube: 世界上最大的视频网站 YouTube 就是用 Python 开发的
  • Facebook: 大量的基础库均通过 Python 实现的
  • Redhat: 世界上最流行的 Linux 发行版本中的 yum 包管理工具就是用 python 开发的

  除上面之外,还有搜狐、金山、腾讯、盛大、网易、百度、阿里、淘宝、土豆、新浪、果壳等公司都在使用 Python完成各种各样的任务。

Python 语言的一些缺点

  • 速度慢,Python 的运行速度相比 C 语言确实慢很多,跟 JAVA 相比也要慢一些,因此这也是很多所谓的大牛不屑于使用 Python 的主要原因,但其实这里所指的运行速度慢在大多数情况下用户是无法直接感知到的,必须借助测试工具才能体现出来,比如你用 C 运一个程序花了 0.01s, 用 Python 是 0.1s, 这样 C 语言直接比 Python 快了 10 倍,算是非常夸张了,但是你是无法直接通过肉眼感知的,因为一个正常人所能感知的时间最小单位是 0.15-0.4s 左右。其实在大多数情况下 Python 已经完全可以满足你对程序速度的要求,除非你要写对速度要求极高的搜索引擎等,这种情况下,当然还是建议你用 C 去实现的。随着硬件设备及计算力的增强,运行速度慢的这个缺点相对来说有所改善。在编写代码所花时间与程序运行所用时间进行平衡后,很多企业都开始选择使用 Python。
  • 代码不能加密,因为 PYTHON 是解释性语言,它的源码都是以明文形式存放的,不过我不认为这算是一个缺点,如果你的项目要求源代码必须是加密的,那你一开始就不应该用 Python 来去实现。

项目说明

  在数据时代,我们每个人既是数据的生产者,也是数据的使用者,然而初次获取和存储的原始数据杂乱无章、信息冗余、价值较低。今天AI算法和应用百花齐放,给我们带来了非常多的梦想;而这几年整个行业的起起伏伏,背后也有许多弯路和故事。今天我们已经习惯了刷脸支付,但是似乎有一些更加高冷的梦想,比如像无人驾驶,都还只在路上。   我们做过软件工程师,从各种各样的框架,像Torch、Theano、Caffe开始,到今天大家耳熟能详的Tensorflow和Pytorch,我们相当于在不断重新设计一套又一套语言,让我们能够把算法高效地实现出来。我们做过数据工程师,把图片、语音、自然语言、用户各种行为等数据做清洗做标注,把它放在无论是磁盘还是数仓的各种地方,然后再输入到各种算法当中去来做应用。    八年前我们说能够训练一个图像识别模型然后搭一个小的demo,就已经是一个顶级的AI开发者了。今天我们所面对的需求是将AI 的数据、算法和场景结合起来,去构建一个完整而且更加复杂的解决方案,来解决各行各业当中的实际问题。

  • 从开发的角度来说,从我们想写第一行代码开始,到写下第一个AI模型需要多久?
  • 从应用的角度来说,从我们看到一个需求到prototype上线和服务需要多久?

   作为一个学习 Python 的技术人,在这里使用Python强大的功能实现各种好玩的程序为大家提供各种全面Demo,从深度沟通的定制本地化解决方案,到可以处理各种Task的自动化工具,包括NLP和CV领域中各种预处理方法的实现、对图像的各种操作、数据可视化;另外涵盖了Excel、Word、PPT、ODF、PDF、邮件、微信、文件处理等所有能在办公场景实现自动化的库。

  • tool 中存储了各种相关工具的Demo;
  • book 中存储了各种相关学习的资料。

搭建环境

  Python 是跨平台的编程语言,它可以运行在 windows、Mac 和各种 Linux/Unix 系统上。也就是说,假设在windows 系统下编写的 Python 程序,在 Mac 或 Linux 系统下也是可以运行的。若你想获取各种绿色版的官方安装包,请你关注如下微信公众号,并回复“Python安装包”,即可获取所有的安装包。另外,可以关注我的博客【甘南第一勇士】及时获取最新的分享,欢迎你的关注和提问。 源码上门取算法码上到