/Bayes-Classify

一种利用贝叶斯定理判断文本类型的方式,包含文章和代码等

Primary LanguagePython

基于贝叶斯公式的特定文本性质判断与分类

介绍

尝试利用python语言结合特定文本(爬虫获取的微博或新闻摘要等)实现语言性质的分析,根据语言用词等方面倒退文本是否具有侮辱和诽谤性质,并根据用语程度推断是否需要进行删除处理等,关于具体方法和分析请参考paper文件夹下的论文原文,本文为修读《概率论与数理统计》课程时完成的期中大作业

文件说明

  1. 论文原文请直接查看paper文件夹,其中md扩展名文件推荐使用Typora软件查看,pdf扩展名文件使用Acrobat Reader DC软件查看
  2. src-Code文件夹为进行文本判定时使用的源代码
  3. src-Text文件夹为进行模型训练时使用的源文本
  4. Excel文件夹中文件为论文中使用的统计数据