/DataScience-Research

数据库学基础大作业

Primary LanguagePython

dataScience_finalTask

这里是2019级南京大学软件学院学生赵宇舟、林正顺、陶泽华在2020年秋《数据科学基础》课程中完成的大作业

  • 通过疫情期间公众社会在各类媒体上的新闻、评论等信息,利用各种分析手段,对疫情期间公众心态变化趋势进行刻画与深描
  • 利用网络爬虫、XPath等技术,通过在各大新闻网站、微博、bilibili等平台爬取数据
  • 使用朴素贝叶斯模型,训练得到用于疫情期间公众心态分析的机器学习模型
  • 对数据及公众心态进行卡方拟合优度检验及相关性检验分析与数据可视化,并制作可视化面板

详情见finalReport. 可视化网址:https://linzs148.github.io/Visualization/