使用 AI 实现文章续写。项目基于魔改的 GPT 模型,在不牺牲效果的前提下,将传统 GPT 模型的硬件门槛降低了1000倍,实现写作机器人的定制。本项目为 AI Writer 的 Model 端,集成了数据集、模型训练、模型推理,实现模型定制。
- AI Writer 的 Web 项目
- 参考项目 BlinkDL/RWKV-LM
.
|-- README.md # 项目说明文件
|-- src # 模型文件夹
|-- data # 数据文件夹
|-- log # 日志文件夹
|-- model # 模型存储文件夹
|-- pictures # 相关图片
|-- init.sh # 环境初始化文件
|-- config.py # 配置文件
`-- main.py # 训练和测试的主文件
项目支持模型定制和模型效果展示。
如果想要训练一个自己期望的模型,请进行如下操作:
- 使用
sh init.sh
实现环境初始化 - 进入 data 目录,参考 t 数据集的格式来创建自己的数据集文件夹 my_data ,并将数据集文件命名为 train.txt 放置到 data 目录下的 my_data 文件夹中
- 修改 config 文件中的参数
DATA_NAME
的值为my_data
,并调整模型的其他参数 - 运行 main.py 文件,训练好的模型存储在
./model/my_data/
- 修改 config 文件中的参数
TRAINED_MODEL
,表示展示哪一个模型 - 修改 config 文件中的参数
TASK
值为test
,表示任务类型 - 运行 main.py 即可以看到模型预测结果