Pinned Repositories
chatcard-admin
FangkuaiXiaoXiaoLe
使用Unity制作的一款休闲类消消乐游戏
HanLP
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
LLM-RLHF-Tuning-with-PPO-and-DPO
Comprehensive toolkit for Reinforcement Learning from Human Feedback (RLHF) training, featuring instruction fine-tuning, reward model training, and support for PPO and DPO algorithms with various configurations for the Alpaca, LLaMA, and LLaMA2 models.
ManagerSystem
一个纯Django项目
programming-dp
RGAN-main
init
Test
UniversalNER
Xwin-LM
Xwin-LM: Powerful, Stable, and Reproducible LLM Alignment
nowphp206150's Repositories
nowphp206150/chatcard-admin
nowphp206150/FangkuaiXiaoXiaoLe
使用Unity制作的一款休闲类消消乐游戏
nowphp206150/HanLP
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
nowphp206150/LLM-RLHF-Tuning-with-PPO-and-DPO
Comprehensive toolkit for Reinforcement Learning from Human Feedback (RLHF) training, featuring instruction fine-tuning, reward model training, and support for PPO and DPO algorithms with various configurations for the Alpaca, LLaMA, and LLaMA2 models.
nowphp206150/ManagerSystem
一个纯Django项目
nowphp206150/programming-dp
nowphp206150/RGAN-main
init
nowphp206150/Test
nowphp206150/UniversalNER
nowphp206150/Xwin-LM
Xwin-LM: Powerful, Stable, and Reproducible LLM Alignment