Linguistics Ninja
Hub for linguistics Ninjas from MIT. We focus on solving NLP problems by machine learning~
M78
Pinned Repositories
chinese_wordseg_keras
基于深度学习的中文分词尝试
cncorpus
中文语料爬取爬虫
corpusZh
一个中文的已标注词性的语料库
HanLP
自然语言处理 中文分词 词性标注 命名实体识别 依存句法分析 关键词提取 新词发现 短语提取 自动摘要 文本分类 拼音简繁
hello_application
jieba
结巴中文分词
jieba-analysis
结巴分词(java版)
THULAC
An Efficient Lexical Analyzer for Chinese
webdict
一个中文词库
WeiboSpider
:zap: 分布式微博爬虫,部署简单,接口丰富,文档详细,演示视频支持,可灵活定制满足自己的需求。已实现内容包括微博用户资料、微博信息、评论信息和转发信息抓取。目前专注于程序本身的健壮性和易用性,正在快速迭代,欢迎watch跟进,star支持
Linguistics Ninja's Repositories
Linguistics-Ninja/WeiboSpider
:zap: 分布式微博爬虫,部署简单,接口丰富,文档详细,演示视频支持,可灵活定制满足自己的需求。已实现内容包括微博用户资料、微博信息、评论信息和转发信息抓取。目前专注于程序本身的健壮性和易用性,正在快速迭代,欢迎watch跟进,star支持
Linguistics-Ninja/chinese_wordseg_keras
基于深度学习的中文分词尝试
Linguistics-Ninja/cncorpus
中文语料爬取爬虫
Linguistics-Ninja/corpusZh
一个中文的已标注词性的语料库
Linguistics-Ninja/HanLP
自然语言处理 中文分词 词性标注 命名实体识别 依存句法分析 关键词提取 新词发现 短语提取 自动摘要 文本分类 拼音简繁
Linguistics-Ninja/hello_application
Linguistics-Ninja/jieba
结巴中文分词
Linguistics-Ninja/jieba-analysis
结巴分词(java版)
Linguistics-Ninja/THULAC
An Efficient Lexical Analyzer for Chinese
Linguistics-Ninja/webdict
一个中文词库