/IR-Homework

Primary LanguageJupyter Notebook

2021-2022年度 深圳大学《信息检索》课程实验

  • 实验环境:Python 3.9

实验1:倒排索引

实验2:带跳表的倒排索引,文本编辑距离

实验3:文本数据集统计,索引构建与压缩

实验4:基于向量空间模型,使用TF-IDF和cosine similarity计算文本相似度

实验5:基于互信息和chi-square计算文本特征,使用Naive Bayes模型训练文本分类模型

实验6:PageRank,HITS等链接分析算法实现