使用ChatGLM+langchain实现文档问答,使用gradio搭建简单UI,支持实时上传文档。
详见:chatglm_document_qa_READM.md
利用yolo和CLIP模型生成图片描述,基于生成的图片描述进行图文问答。界面使用streamlit编写。
基于Vit模型提取图像embedding,使用向量数据库进行相似度搜索,以实现图搜图功能。
使用ChatGLM+langchain实现文档问答,使用gradio搭建简单UI,支持实时上传文档。
详见:chatglm_document_qa_READM.md
利用yolo和CLIP模型生成图片描述,基于生成的图片描述进行图文问答。界面使用streamlit编写。
基于Vit模型提取图像embedding,使用向量数据库进行相似度搜索,以实现图搜图功能。