/My-LLaMA-Factory

LLaMA-Factory使用经验记录

Primary LanguageJupyter NotebookApache License 2.0Apache-2.0

My-LLaMA-Factory

LLaMA-Factory使用经验记录,请查看 文件简介 根据个人情况,选择合适的内容学习。

文件简介:

主文件:

文件夹名称 作用 训练方式 备注
data 数据集示例
data_structure 数据集格式解释 仅介绍Alpaca格式
easy_to_use 直接加载模型进行测试,体验LLaMA-Factory的使用 Colab方式
easy_to_train_model 使用项目本身数据集训练模型 LoRA Colab方式
custom_dataset_train 使用自定义数据集训练模型 LoRA 服务器启动UI方式
command_parse 讲解llamafactory-cli命令的执行逻辑 追踪到代码层,确定命令对应的代码
how_to_debug 介绍如何通过debug方式启动llamafactory 笔者使用的vscode
cuda_docker_run 介绍以docker方式启动llamafactory 适用于CUDA用户

utils文件夹下文件解释:

文件名称 作用 备注
split_dataset.py 切分数据集 用于Alpaca格式
update_self_awareness.py 更新模型自我认知数据集 注意修改文件中的模型名称、作者名称
glm4_stream_cli_demo.py transformers 后端以命令行进行模型推理 流式输出
glm4_stream_web_demo.py transformers 后端以web界面进行模型推理 流式输出

项目依赖:

(myenv) root@ubuntu22:/data/LLaMA-Factory-main# llamafactory-cli env

- `llamafactory` version: 0.8.4.dev0
- Platform: Linux-6.2.0-35-generic-x86_64-with-glibc2.35
- Python version: 3.11.9
- PyTorch version: 2.4.0+cu121 (GPU)
- Transformers version: 4.43.4
- Datasets version: 2.20.0
- Accelerate version: 0.32.0
- PEFT version: 0.12.0
- TRL version: 0.9.6
- GPU type: NVIDIA A100-PCIE-40GB

鸣谢:

感谢 hiyouga 的贡献,才能有 LLaMA-Factory 这么方便的工具。