Pinned Repositories
Medical-named-entity-recognition
本项目是针对医疗数据,进行命名实体识别。项目中有600份标注好的电子病历文本,共需识别含解剖部位、独立症状、症状描述、手术和药物五类实体。该领域的命名实体识别问题是自然语言处理中经典的序列标注问题。
NewsSpider
该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地
public-opinion-analysis
从舆情系统中爬取出了5000条关于电商评价的数据,人工进行对这5000条数据标注,分为正面和负面。做情感分析。训练模型,对后面爬取出的电商评论进行预测
textCnn-and-BERT-based-text-classification
该项目是在英文数据集上,分别使用textcnn模型和BERT模型进行分类。比较效果
F-debug's Repositories
F-debug/Medical-named-entity-recognition
本项目是针对医疗数据,进行命名实体识别。项目中有600份标注好的电子病历文本,共需识别含解剖部位、独立症状、症状描述、手术和药物五类实体。该领域的命名实体识别问题是自然语言处理中经典的序列标注问题。
F-debug/public-opinion-analysis
从舆情系统中爬取出了5000条关于电商评价的数据,人工进行对这5000条数据标注,分为正面和负面。做情感分析。训练模型,对后面爬取出的电商评论进行预测
F-debug/NewsSpider
该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地
F-debug/textCnn-and-BERT-based-text-classification
该项目是在英文数据集上,分别使用textcnn模型和BERT模型进行分类。比较效果