yuki-younai/transformers-code

手把手带你实战 Huggingface Transformers 课程视频同步更新在B站与YouTube

Jupyter Notebook

简介

手把手带你实战Transformers课程的代码仓库

代码适配

torch==2.2.1+cu118
transformers==4.42.4
peft==0.11.1
datasets==2.20.0
accelerate==0.32.1
bitsandbytes==0.43.1
faiss-cpu==1.7.4
tensorboard==2.14.0

课程规划

基础入门篇：Transformers入门，从环境安装到各个基础组件的介绍，包括Pipeline、Tokenizer、Model、Datasets、Evaluate、Trainer，并通过一个最基本的文本分类实例将各个模块进行串讲
实战演练篇：Transformers实战，通过丰富的实战案例对Transformers在NLP任务中的解决方案进行介绍，包括命名实体识别、机器阅读理解、多项选择、文本相似度、检索式对话机器人、掩码语言模型、因果语言模型、摘要生成、生成式对话机器人
高效微调篇：Transformers模型高效微调，以PEFT库为核心，介绍各种常用的参数高效微调方法的原理与实战，包括BitFit、Prompt-tuning、P-tuning、Prefix-Tuning、Lora和IA3
低精度训练篇：Transformers模型低精度训练，基于bitsandbytes库，进行模型的低精度训练，包括LlaMA2-7B和ChatGLM2-6B两个模型的多个不同精度训练的实战演练，包括半精度训练、8bit训练、4bit训练（QLoRA）
分布式训练篇：Transformers模型分布式训练，基于accelerate库讲解transformers模型的分布式训练解决方案，介绍分布式训练的基本原理以及accelerate库的基本使用方式，包括与Deepspeed框架的集成
对齐训练篇: ...
性能优化篇: ...
系统演示篇: ...

课程地址

课程视频发布在B站与YouTube，代码与视频会逐步进行更新，目前课程主要更新在B站，YouTube后续会持续更新

Transformers 基础入门篇 (已更新完成)

01- 基础知识与环境安装
- 视频地址：Bilibili | YouTube
02 基础组件之 Pipeline |
- 视频地址：Bilibili | YouTube
03 基础组件之 Tokenizer
- 视频地址：Bilibili | YouTube
04 基础组件之 Model(上) 基本使用
- 视频地址：Bilibili | YouTube
04 基础组件之 Model(下) BERT文本分类代码实例
- 视频地址：Bilibili | YouTube
05 基础组件之 Datasets
- 视频地址：Bilibili | YouTube
06 基础组件之 Evaluate
- 视频地址：Bilibili | YouTube
07 基础组件之 Trainer
- 视频地址：Bilibili | YouTube

Transformers 实战演练篇 (已更新完成)

08 基于 Transformers的 NLP解决方案
- 视频地址：Bilibili | YouTube
09 实战演练之命名实体识别
- 视频地址：Bilibili | YouTube
10 实战演练之机器阅读理解（上，过长截断策略）
- 视频地址：Bilibili | YouTube
10 实战演练之机器阅读理解（下，滑动窗口策略）
- 视频地址：Bilibili | YouTube
11 实战演练之多项选择
- 视频地址：Bilibili | YouTube
12 实战演练之文本相似度（上，基于交互策略）
- 视频地址：Bilibili | YouTube
12 实战演练之文本相似度（下，基于匹配策略）
- 视频地址：Bilibili | YouTube
13 实战演练之检索式对话机器人
- 视频地址：Bilibili | YouTube
14 实战演练之预训练模型
- 视频地址：Bilibili | YouTube
15 实战演练篇之文本摘要（上，基于T5模型）
- 视频地址：Bilibili | YouTube
15 实战演练篇之文本摘要（下，基于GLM模型）
- 视频地址：Bilibili | YouTube
16 实战演练篇之生成式对话机器人（基于Bloom）
- 视频地址：Bilibili | YouTube

Transformers 参数高效微调篇 (已更新完成)

17 参数高效微调与BitFit实战
- 视频地址：Bilibili | YouTube
18 Prompt-Tuning 原理与实战
- 视频地址：Bilibili | YouTube
19 P-Tuning 原理与实战
- 视频地址：Bilibili | YouTube
20 Prefix-Tuning 原理与实战
- 视频地址：Bilibili | YouTube
21 LoRA 原理与实战
- 视频地址：Bilibili | YouTube
22 IA3 原理与实战
- 视频地址：Bilibili | YouTube
23 PEFT 进阶操作
- 视频地址：Bilibili | YouTube

Transformers 低精度训练篇（已更新完成）

24 低精度训练与模型下载
- 视频地址：Bilibili | YouTube
25 半精度模型训练（上，基于LLaMA2的半精度模型训练）
- 视频地址：Bilibili | YouTube
25 半精度模型训练（下，基于ChatGLM3的半精度模型训练）
- 视频地址：Bilibili | YouTube
26 量化与8bit模型训练
- 视频地址：Bilibili | YouTube
27 4bit量化与QLoRA模型训练
- 视频地址：Bilibili | YouTube

Transformers 分布式训练篇（已更新完成）

28 分布式训练基础与环境配置
- 视频地址：Bilibili | YouTube
29 Data Parallel原理与应用
- 视频地址：Bilibili | YouTube
30 Distributed Data Parallel原理与应用
- 视频地址：Bilibili | YouTube
31 Accelerate 分布式训练入门
- 视频地址：Bilibili | YouTube
32 Accelerate 使用进阶（上）
- 视频地址：Bilibili | YouTube
32 Accelerate 使用进阶（下）
- 视频地址：Bilibili | YouTube
33 Accelerate + Deepspeed
- 视频地址：Bilibili | YouTube

Transformers 番外技能篇

基于Optuna的Transformers模型自动调参
- 视频地址：Bilibili | YouTube

Star History

请作者喝杯奶茶