- 能自动获取指定类别,指定日期范围的arxiv论文数据
- 支持embedding的query-title的检索
- download ranker model, 将下载好的模型放置到项目路径下,也可以自行选择是否使用其他的模型。
- 创建本地缓存目录
mkdir cache_data
pip install -r requirements.txt
可自定切换国内源- 如果未在本地部署大模型,则修改
paper_reader/load_data.py
,将paper_data_obj = PaperData(use_llm=False)
streamlit run app.py