/aiops24-RAG-demo

用于AIOPS24挑战赛的Demo

Primary LanguageShell

Important

本分支用于Qwen2-7b为基础模型的赛道,使用智谱清言API为基础模型的赛道,请参考glm分支

快速开始

克隆本仓库后,运行run.sh安装ollama和qwen-2-7b-instruct,以及初始化嵌入模型BAAI/bge-small-zh-v1.5

bash run.sh

前置需求

Ollama 用于对LLM推理。

向量数据库选用了Qdrant,可以使用in-memory模式进行调试

依赖安装

所有python依赖都在demo/requirements.txt

框架和使用说明

将转换为txt的文档放置于data目录下,其文件结构如下

> tree -L 3 -d data/
data/
└── output
    ├── director
    │   ├── License申请操作指南
    │   ├── TCF部署TECS Director
    │   ├── nodes
    │   ├── 备份
    │   ├── 安全
    │   ├── 容灾
    │   ├── 性能FTP北向接口规范
    │   ├── 日志FTP北向接口规范
    │   ├── 告警SNMP北向接口规范
    │   ├── 产品描述
    │   ├── 例行维护
    │   ├── 对接指南
    │   ├── 操作指南
    │   ├── 故障处理
    │   ├── 硬件配置
    │   ├── 配置指南
    │   ├── 文档包简介
    │   ├── 性能指标参考
    │   ├── 租户操作指南
    │   ├── 隐私保护声明
    │   ├── 中兴云操作指南
    │   ├── 告警与通知处理
    │   ├── 性能计数器参考
    │   ├── 端口和服务清单
    │   └── 技术服务使用指南
    └── rcp
        ├── CommonS_HTTP_LB
        ├── CommonS_IPS
        ├── CommonS_OAM
        ├── CommonS_SIG
        ├── CommonS_TMSP
        ├── Namf
        ├── Nausf
        ├── Nbsf
        ├── Nchf
        ├── Ncudr_Access
        ├── Ncudr_AccessManagement
        ├── Ncudr_SystemManagement
        ├── Nnrf
        ├── Nnssf
        ├── Npcf
        ├── Npcf_LOG
        ├── Npcf_LogStoreUnit
        ├── Npcf_PolicyManagement
        ├── Npcf_SIGLB
        ├── Npcf_SMPolicyControl
        ├── Npcf_SystemManagement
        ├── Nsmf
        ├── Nsmsf
        ├── Nudm
        ├── ZUF-59-55-051 VoNR
        └── nodes

55 directories

.env.example复制为.env并修改相应设置,然后运行

python main.py

第一次运行会进行文档的切块和嵌入,时间较久,后续过程如果需要重新嵌入,可以设置reindex=True

生成的答案会放置在./submit_result.jsonl