Pinned Repositories
Alpaca-CoT
We extend CoT data to Alpaca to boost its reasoning ability. We are constantly expanding our collection of instruction-tuning data, and integrating more LLMs together for easy use. (我们将CoT数据扩展到Alpaca以提高其推理能力,同时我们将不断收集更多的instruction-tuning数据集,并在我们框架下集成进更多的LLM。)
ColossalAI
Making large AI models cheaper, faster and more accessible
cube
📊 Cube — The Semantic Layer for Building Data Applications
Fay
这是一个完整的数字人项目,包含Python内核及UE数字人模型,可以用于做数字助理及抖音自动直播,又或者作为你的应用入口也很帅.
MNBVC
MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。
moyuwin's Repositories
moyuwin/cube
📊 Cube — The Semantic Layer for Building Data Applications
moyuwin/Alpaca-CoT
We extend CoT data to Alpaca to boost its reasoning ability. We are constantly expanding our collection of instruction-tuning data, and integrating more LLMs together for easy use. (我们将CoT数据扩展到Alpaca以提高其推理能力,同时我们将不断收集更多的instruction-tuning数据集,并在我们框架下集成进更多的LLM。)
moyuwin/ColossalAI
Making large AI models cheaper, faster and more accessible
moyuwin/MNBVC
MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。
moyuwin/Fay
这是一个完整的数字人项目,包含Python内核及UE数字人模型,可以用于做数字助理及抖音自动直播,又或者作为你的应用入口也很帅.