项目介绍 MiniSearchEngine是python大作业,通过NLTK将数据集进行分词检索,使用BM25算法对结果进行排序,数据集来源目前只有老师给,自己写的爬虫属于中文分词,暂未实现。 网站分类 音乐 电影 图书 后端技术栈 python 3.8.5 scrapy 2.4 数据库 MySQL