zhihu_lunwen

说明

为本人论文《数据挖掘技术在问答社区中的应用-以知乎为例》主要代码

结构

  • 第三章 知乎爬虫及数据预处理程序(数据爬取与预处理文件夹)

    • Crawl.py 文件:数据爬取与数据存储文件
    • Eda.py文件:数据预处理及部分统计分析文件
    • 数据预处理.Rmd:部分统计分析文件
    • 问题四分类数据预处理.R:问题四分类预处理
  • 第四章 网络数据处理与分析程序(网络分析文件夹)

    • ForGephi.py:网络数据
    • Web文件夹:网络可视化文件
  • 第五章 文本挖掘程序(文本挖掘文件夹)

    • text_EDA.Rmd:文本分析及可视化文件