Pinned Repositories
-DLXSimulator0051-
none
dataharvest
DataHarvest 是一个专为构建大型语言模型数据集而设计的工具集。它提供了一系列的数据获取、清洗和处理的pipeline,旨在为中文大模型提供高质量的训练数据。
transformers_llava
Umi-OCR
OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
self-refine
LLMs can generate feedback on their work, use it to improve the output, and repeat this process iteratively.
hexixiang's Repositories
hexixiang/dataharvest
DataHarvest 是一个专为构建大型语言模型数据集而设计的工具集。它提供了一系列的数据获取、清洗和处理的pipeline,旨在为中文大模型提供高质量的训练数据。
hexixiang/-DLXSimulator0051-
none
hexixiang/transformers_llava