项目介绍

MiniSearchEngine是python大作业,通过NLTK将数据集进行分词检索,使用BM25算法对结果进行排序,数据集来源目前只有老师给,自己写的爬虫属于中文分词,暂未实现。

网站分类

  1. 音乐
  2. 电影
  3. 图书

后端技术栈

  • python 3.8.5
  • scrapy 2.4
  • 数据库
    • MySQL