xidianwang412's Stars
EbookFoundation/free-programming-books
:books: Freely available programming books
public-apis/public-apis
A collective list of free APIs
vinta/awesome-python
An opinionated list of awesome Python frameworks, libraries, software and resources.
d2l-ai/d2l-zh
《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。
chinese-poetry/chinese-poetry
The most comprehensive database of Chinese poetry 🧶最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。
mli/paper-reading
深度学习经典、新论文逐段精读
karpathy/llama2.c
Inference Llama 2 in one file of pure C
HKUDS/LightRAG
"LightRAG: Simple and Fast Retrieval-Augmented Generation"
pwxcoo/chinese-xinhua
:orange_book: 中华新华字典数据库。包括歇后语,成语,词语,汉字。
shibing624/pycorrector
pycorrector is a toolkit for text error correction. 文本纠错,实现了Kenlm,T5,MacBERT,ChatGLM3,Qwen2.5等模型应用在纠错场景,开箱即用。
jingyaogong/minimind
🚀🚀 「大模型」3小时完全从0训练26M的小参数GPT!🌏 Train a 26M-parameter GPT from scratch in just 3 hours!
CLUEbenchmark/CLUEDatasetSearch
搜索所有中文NLP数据集,附常用英文NLP数据集
wainshine/Chinese-Names-Corpus
中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。
shibing624/MedicalGPT
MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型,实现了包括增量预训练(PT)、有监督微调(SFT)、RLHF、DPO、ORPO。
WangRongsheng/awesome-LLM-resourses
🧑🚀 全世界最好的LLM资料总结 | Summary of the world's best LLM resources.
eric-mitchell/direct-preference-optimization
Reference implementation for DPO (Direct Preference Optimization)
datawhalechina/tiny-universe
《大模型白盒子构建指南》:一个全手搓的Tiny-Universe
hefengbao/jingmo
『京墨』开源的中华文化宝典 APP,诗(词)文(名句)、汉字、成语、词语、歇后语、绕口令、传统节日、传统色、节气、人物等。
charent/ChatLM-mini-Chinese
中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调,给出三元组信息抽取微调示例。
garychowcmu/daizhigev20
殆知阁古代文献
NiuTrans/Classical-Modern
非常全的文言文(古文)-现代文平行语料
facebookresearch/MobileLLM
MobileLLM Optimizing Sub-billion Parameter Language Models for On-Device Use Cases. In ICML 2024.
TinyLLaVA/TinyLLaVA_Factory
A Framework of Small-scale Large Multimodal Models
NanBox/PiPiName
根据三才五格和古诗文给宝宝起名
mapull/chinese-dictionary
中文汉语拼音辞典,汉字拼音字典,词典,成语词典,常用字、多音字字典数据库
wdndev/tiny-llm-zh
从零实现一个小参数量中文大语言模型。
asahi417/lmppl
Calculate perplexity on a text with pre-trained language models. Support MLM (eg. DeBERTa), recurrent LM (eg. GPT3), and encoder-decoder LM (eg. Flan-T5).
BangBOOM/Classical-Chinese
古文现代文翻译平行语料库
LLM360/amber-data-prep
Data preparation code for Amber 7B LLM
CNMan/XDHYDCD
《现代汉语大词典》字词头