fzp0515's Stars
zwhe99/MAPS-mt
[TACL 2024] MAPS enables LLMs🤖 to mimic the human😁 translation process.
CUHK-ARISE/EmotionBench
Benchmarking LLMs' Emotional Alignment with Humans
marsoyang1/weixin_ocr
微信聊天截图OCR识别聊天内容,可以分清楚对方发送信息还是自己发送的内容,个人对话消息识别准确率99%
felixonmars/fcitx5-pinyin-zhwiki
Fcitx 5 Pinyin Dictionary from zh.wikipedia.org
modelscope/data-juicer
Making data higher-quality, juicier, and more digestible for foundation models! 🍎 🍋 🌽 ➡️ ➡️🍸 🍹 🍷为大模型提供更高质量、更丰富、更易”消化“的数据!
esbatmop/MNBVC
MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。
chenking2020/FindTheChatGPTer
ChatGPT爆火,开启了通往AGI的关键一步,本项目旨在汇总那些ChatGPT的开源平替们,包括文本大模型、多模态大模型等,为大家提供一些便利
rossning92/Blackhole
A blackhole simulation using OpenGL / C++.