My-LLaMA-Factory

LLaMA-Factory使用经验记录，请查看 文件简介 根据个人情况，选择合适的内容学习。

My-LLaMA-Factory

文件简介:

主文件:

文件夹名称	作用	训练方式	备注
data	数据集示例
data_structure	数据集格式解释		仅介绍Alpaca格式
easy_to_use	直接加载模型进行测试，体验LLaMA-Factory的使用		Colab方式
easy_to_train_model	使用项目本身数据集训练模型	LoRA	Colab方式
custom_dataset_train	使用自定义数据集训练模型	LoRA	服务器启动UI方式
command_parse	讲解`llamafactory-cli`命令的执行逻辑		追踪到代码层，确定命令对应的代码
how_to_debug	介绍如何通过debug方式启动llamafactory		笔者使用的vscode
cuda_docker_run	介绍以docker方式启动llamafactory		适用于CUDA用户

utils文件夹下文件解释:

文件名称	作用	备注
split_dataset.py	切分数据集	用于Alpaca格式
update_self_awareness.py	更新模型自我认知数据集	注意修改文件中的模型名称、作者名称
glm4_stream_cli_demo.py	transformers 后端以命令行进行模型推理	流式输出
glm4_stream_web_demo.py	transformers 后端以web界面进行模型推理	流式输出

项目依赖:

(myenv) root@ubuntu22:/data/LLaMA-Factory-main# llamafactory-cli env

- `llamafactory` version: 0.8.4.dev0
- Platform: Linux-6.2.0-35-generic-x86_64-with-glibc2.35
- Python version: 3.11.9
- PyTorch version: 2.4.0+cu121 (GPU)
- Transformers version: 4.43.4
- Datasets version: 2.20.0
- Accelerate version: 0.32.0
- PEFT version: 0.12.0
- TRL version: 0.9.6
- GPU type: NVIDIA A100-PCIE-40GB

鸣谢:

感谢 hiyouga 的贡献，才能有 LLaMA-Factory 这么方便的工具。

peilongchencc/My-LLaMA-Factory

My-LLaMA-Factory

文件简介:

主文件:

utils文件夹下文件解释:

项目依赖:

鸣谢: