Pinned Repositories
chaizi
漢語拆字字典
chinese-gen
中文生成式预训练模型
CNSD
中文自然语言推理数据集(A large-scale Chinese Nature language inference and Semantic similarity calculation Dataset)
Cool-NLPCV
Some Cool NLP and CV Repositories and Solutions (收集NLP中常见任务的开源解决方案、数据集、工具、学习资料等)
FinBERT
leetcode-linghu-templete
算法面试必备,推荐刷题网站www.lintcode.com。北大学霸的《LeetCode刷题模板》+V领取: jiuzhangfeifei
Mengzi
Mengzi Pretrained Models
NLPer-Arsenal
收录NLP相关竞赛经验贴(当前赛事、往期赛事、训练赛)、NLP会议时间、常用自媒体、GPU推荐等,持续更新中
python_interview_question
关于python的面试题
Semantic-Similarity-Match
此开源hub基于Tensorflow2.x实现文本相似度匹配、知识蒸馏、交互模型、双塔sbert
UCAS's Repositories
xuyongfu/agent-zero
Agent Zero AI framework(非常好,值得研究)
xuyongfu/baby-llama2-chinese
用于从头预训练+SFT一个小参数量的中文LLaMa2的仓库;24G单卡即可运行得到一个具备简单中文问答能力的chat-llama2.
xuyongfu/blog
Public repo for HF blog posts(最全最好的大模型知识 🌟🌟🌟)
xuyongfu/dclm
DataComp DCLM开源数据处理
xuyongfu/DecryptPrompt
总结Prompt&LLM论文,开源数据&模型,AIGC应用
xuyongfu/evalscope
一个高效的大模型评估和性能基准测试的简化可定制框架(非常好🌟🌟)
xuyongfu/Financial-Knowledge-Graphs
小型金融知识图谱构建流程(neo4j / python / cypher / KG)
xuyongfu/GeneralAgent
A python native agent framework
xuyongfu/gpt-neox
基于Megatron和DeepSpeed库,在GPU上实现模型并行Transformers模型训练。(非常好)
xuyongfu/langchain-glm
基于 Langchain,快速集成GLM-4 AllTools 功能的插件(非常值得学习⭐⭐)
xuyongfu/LazyLLM
比较好的项目
xuyongfu/llama-agentic-system
Agentic components of the Llama Stack APIs(llama的agent,推荐学习)
xuyongfu/llama3-Chinese-chat
Llama3 中文仓库(聚合资料,各种网友及厂商微调、魔改版本有趣权重 & 训练、推理、评测、部署教程视频 & 文档)
xuyongfu/llama3-from-scratch
llama3 implementation one matrix multiplication at a time
xuyongfu/LLM101n-CN
LLM101n: Let's build a Storyteller 中文版
xuyongfu/llms-from-scratch-cn
仅需Python基础,从0构建大语言模型;从0逐步构建GLM4\Llama3\RWKV6, 深入理解大模型原理
xuyongfu/minimind
【大模型】3小时完全从0训练一个仅有26M的小参数GPT,最低仅需2G显卡即可推理训练!(非常好🌟🌟🌟)
xuyongfu/nano-graphrag
A simple, easy-to-hack GraphRAG implementation(非常好🌟)
xuyongfu/nanoGPT
The simplest, fastest repository for training/finetuning medium-sized GPTs.
xuyongfu/open_lm
中等规模语言模型研究的存储库-DCLM预训练开源代码
xuyongfu/Perplexica
Perplexica是一款由人工智能驱动的搜索引擎。它是Perplexity AI的开源替代品。
xuyongfu/Qwen-Agent
Agent framework and applications built upon Qwen2, featuring Function Calling, Code Interpreter, RAG, and Chrome extension.
xuyongfu/RAG_Techniques
展示了检索增强生成(RAG)系统的各种先进技术(最全面最好的,必看🌟🌟🌟)
xuyongfu/ragas
Evaluation framework for your Retrieval Augmented Generation (RAG) pipelines
xuyongfu/RAGLAB
RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation
xuyongfu/Steel-LLM
开源中文预训练语言模型Steel-LLM
xuyongfu/tiny-universe
《大模型白盒子构建指南》:一个全手搓的Tiny-Universe
xuyongfu/transformer-explainer
Transformer Explained: Learn How LLM Transformer Models Work with Interactive Visualization
xuyongfu/translation-agent
吴恩达老师的开源项目Translation Agent: Agentic translation using reflection workflow
xuyongfu/XuanYuan
轩辕:度小满中文金融对话大模型