nlp-source

学习计划

学习资源

简书

CS224d: Deep Learning for Natural Language Processing(Previous)
CS224n: Natural Language Processing with Deep Learning(Now)

网易云课堂

cs231
http://study.163.com/course/introduction/1003223001.htm#/courseDetail

牛津deepnlp

https://github.com/oxford-cs-deepnlp-2017/lectures

gan教程

nlp课程:

马萨诸塞大学自然语言处理课程

网盘资源

推荐书籍

快速入门

自然语言处理快速入门

数据挖掘、机器学习、自然语言处理这三者是什么关系?这几个怎么入门啊?国内到底是阿里还是百度大数据最好?

自学过程

  1. 先各种课件,加那本自然语言的书,搞清楚自然语言大概都有哪些问题,主要是为了解决什么问题的。
  2. 基于某个问题看博士论文,了解来龙去脉。然后follow业界进度。
  3. 找各种资源,会议的,期刊的,博客http://52nlp.cn(不是打广告,我不是博主,不过博客真心不错)
  4. 微博上关注各种这个领域的大牛,他们有时候会推荐很多有用的资料。
  5. 当然,数学之美 我也读了,确实不错。

与姚佳讨论学习:

1.分词器、词性标注、句法树
2. 情感分析、文本分类
3. 机器学习:lr (逻辑回归(Logistic Regression)) svm(支持向量机) nb(朴素贝叶斯) hmm(隐马尔科夫模型) crf等(主要关注模型在nlp上的应用)

博客

  • CSDN,博客园,知乎,quora

用到的数学基础

矩阵计算,数据分析,最优化,数理统计,随机过程,代数,微积分。。。

概率论与数理统计,线性代数,基础的高等数学肯定也是必须的。

现在的自然语言处理很大程度上基于统计的方法,所以机器学习也是必须的,可以基于机器学习方面的资料选择一下需要补充的数学知识的。

就像其它学科一样,自然语言处理也会分为若干子问题,其中的每一个子问题可以用不同的方法来处理(数学的方法或非数学的方法)。

自然语言处理的子问题中,一些问题可以等价为分类问题(文本分类、倾向性分析),还有一些子问题可以等价为序列标注问题(中文分词,信息抽取)。单就前两个子问题而言,了解一些常用的分类器(朴素贝叶斯、SVM、最大熵)相关知识是对文本分类有益的;对于序列标注,隐马尔科夫等概率图模型也是有用的。另外由于自然语言处理常常涉及语言模型的处理,此时一些概率论的基本知识会很重要。

回到楼主的问题来,数学仅仅是工具,还是要由问题来引导方法。我也只能回答“粗略了解或简单实现自然语言处理涉及哪些数学知识”这个问题并在前文给出了我的答案,可是由于自然语言处理的子问题跨度不小,我觉得单列出常用的数学知识是没有太大意义的。

最后推荐一个自然语言处理的博客http://www.52nlp.org/,里面有很多入门或深度的讨论。

其它分享

我平时看过的的一些论文和资料放在OneDrive云上,实时更新,有需要的可以下载,但是OneDrive分享页面在一些网络环境下可能需要科学上网才能打开。

我为上一个优等生互助班整理的资料(包括一些直播课录播)放在网盘上了,已停止更新:

我的邮箱:466532329@qq.com 我的GitHub:https://github.com/LeanderLXZ


https://www.cnblogs.com/pinard/p/5970503.html


学习小tips:
遇到问题多提问
论坛答案找起来
做完项目就提交
约个导师来帮你:https://calendly.com/nd101

  • 已经完成5个项目但未看到证书的小伙伴请联系Sherry处理

————————
【学习干货】
Reviewer项目指导:https://leolei.com/ (建议PC端查看)

直播回顾系列:
项目一(神经网络)直播回顾:https://m.qlchat.com/topic/2000000163780713.htm?preview=Y&intoPreview=Y
项目二(图像分类)直播回顾:https://m.qlchat.com/topic/2000000431711321.htm?preview=Y&intoPreview=Y
项目三(生成电视剧剧本)直播回顾:https://m.qlchat.com/topic/2000000540007243.htm?preview=Y&intoPreview=Y
项目四(语言翻译)直播回顾:https://m.qlchat.com/topic/2000000625137260.htm?preview=Y&intoPreview=Y
项目五(生成人脸)直播回顾:https://m.qlchat.com/wechat/page/topic-intro?topicId=2000000671252948&preview=Y&intoPreview=Y

论坛文字指导:
通用常见基本问题http://t.cn/RCvTDzp
P1神经网络常见问题:http://t.cn/RQofmtO
P2图像分类常见问题:http://t.cn/RQofdqi
P3生成电视剧剧本常见问题:http://t.cn/RQofFFE
P4语言翻译常见问题:http://t.cn/RQoIwbl
P5生成人脸常见问题:http://t.cn/RQoIU6V


[万门]45讲人工智能与Python入门课程链接 一、16讲人工智能入门:

《人工智能、大数据与复杂系统概论》:

https://st.h5.xiaoe-tech.com/st/9poH1yoVT

《深度学习和神经网络》:

https://st.h5.xiaoe-tech.com/st/9p5tCRYb2

《你不知道的Python》:

https://st.h5.xiaoe-tech.com/st/8pExAAVzN

二、29讲Python入门:

https://h5.xiaoeknow.com/content_page/eyJ0eXBlIjoyLCJyZXNvdXJjZV90eXBlIjozLCJyZXNvdXJjZV9pZCI6InZfNWE1MzQ4YzNhMzZhNl9wVkdESjRYTCIsInByb2R1Y3RfaWQiOiJwXzVhNGM0NTI2OTAxYjFfbHNTOUhrbUYiLCJhcHBfaWQiOiJhcHBncDZFRFYxdzY5MzYifQ