不知道怎么运行(纯小白)
Liugazn opened this issue · 10 comments
我把我的问题说的详细点哈,之前是在ai studio上跟着您的步骤一步步运行,但是每次训练量太大了就导致我的算力值不够,然后我把代码搬运到自己装的paddle里运行总会报错AssertionError: config file(configs/config.yaml) is not exist。不知道该怎么改,想问问如果要在pycharm里运行的话我要怎么做呢 万分感谢您的帮助!
D:\Anaconda\envs\paddle_env\python.exe D:\pythonProject1\Smart_container-master\Smart_container\PaddleClas\tools\train.py
D:\pythonProject1\Smart_container-master\Smart_container\PaddleClas\ppcls\arch\backbone\model_zoo\vision_transformer.py:15: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated since Python 3.3, and in 3.10 it will stop working
from collections import Callable
D:\pythonProject1\Smart_container-master\Smart_container\PaddleClas\ppcls\data\preprocess\ops\timm_autoaugment.py:40: DeprecationWarning: BILINEAR is deprecated and will be removed in Pillow 10 (2023-07-01). Use Resampling.BILINEAR instead.
_RANDOM_INTERPOLATION = (Image.BILINEAR, Image.BICUBIC)
D:\pythonProject1\Smart_container-master\Smart_container\PaddleClas\ppcls\data\preprocess\ops\timm_autoaugment.py:40: DeprecationWarning: BICUBIC is deprecated and will be removed in Pillow 10 (2023-07-01). Use Resampling.BICUBIC instead.
_RANDOM_INTERPOLATION = (Image.BILINEAR, Image.BICUBIC)
Traceback (most recent call last):
File "D:\pythonProject1\Smart_container-master\Smart_container\PaddleClas\tools\train.py", line 28, in
config = config.get_config(
File "D:\pythonProject1\Smart_container-master\Smart_container\PaddleClas\ppcls\utils\config.py", line 178, in get_config
assert os.path.exists(fname), ### (
AssertionError: config file(configs/config.yaml) is not exist
进程已结束,退出代码1
我把我的问题说的详细点哈,之前是在ai studio上跟着您的步骤一步步运行,但是每次训练量太大了就导致我的算力值不够,然后我把代码搬运到自己装的paddle里运行总会报错AssertionError: config file(configs/config.yaml) is not exist。不知道该怎么改,想问问如果要在pycharm里运行的话我要怎么做呢 万分感谢您的帮助!
是这样:
- 本Repo(即:Smart_container)其实是一个工程部署的demo,并非是一个模型训练的代码仓库,因此如果您想训练模型,采用本仓库的代码是不合理的;
- 若您想要进行模型训练,建议参考以下几个链接:
- Goods_Recognition:提供使用教程
- PaddleClas:具体的代码仓库
这两个代码仓库会帮助您训练模型。
基于上述两个仓库,您需要做的是: - clone PaddleClas的代码;
- 根据Goods_Recognition的说明,修改相关配置文件,进行操作。
- 根据您的算力,我在AIStudio的项目是完全可以跑完全程的。我仍然建议您先在AIStudio上跑通我的项目,熟悉具体的流程,再在本地进行相关尝试。
您好
1.根据Goods_Recognition的说明,修改相关配置文件,进行操作。 关于这一点,我在您的AIStudio上不知道该修改哪一块,举个例子吧:
Head:
name: ArcMargin
embedding_size: 512
class_num: 358 #此处表示类别数
就上面这部分我找到了好几个head函数, 分别在
1)PaddleClas/ppcls/configs/GeneralRecognition/GeneralRecognition_PPLCNet_x2_5_binary.yaml
2)PaddleClas/ppcls/configs/GeneralRecognition/GeneralRecognition_PPLCNet_x2_5_dml.yaml
3)PaddleClas/ppcls/configs/GeneralRecognition/GeneralRecognition_PPLCNet_x2_5_udml.yaml
4)PaddleClas/ppcls/configs/GeneralRecognition/GeneralRecognition_PPLCNet_x2_5.yaml
这四个路径中,我不知道是要修改这四个的文件里的每一个看到的head函数还是只用修改其中一个,(因为我是纯小白,看到您的项目很好就想着手运行着试试,但是专业知识太差劲了)
2.您说的算力问题,我尝试过跑,在训练到70/120时算力就用完了(十几个小时,我用的是算力消耗0.5/小时的)我不知道是我的运行方式是否有问题
非常感谢您的耐心指导!不论成功与否已经在您这里收获颇丰了,再次感谢!
奥对了 忘记补充一点,我当时算力值用完以后 他说我的main.ipynb无法保存 就也很无奈 内核也无法重启,
您好 1.根据Goods_Recognition的说明,修改相关配置文件,进行操作。 关于这一点,我在您的AIStudio上不知道该修改哪一块,举个例子吧: Head: name: ArcMargin embedding_size: 512 class_num: 358 #此处表示类别数 就上面这部分我找到了好几个head函数, 分别在 1)PaddleClas/ppcls/configs/GeneralRecognition/GeneralRecognition_PPLCNet_x2_5_binary.yaml 2)PaddleClas/ppcls/configs/GeneralRecognition/GeneralRecognition_PPLCNet_x2_5_dml.yaml 3)PaddleClas/ppcls/configs/GeneralRecognition/GeneralRecognition_PPLCNet_x2_5_udml.yaml 4)PaddleClas/ppcls/configs/GeneralRecognition/GeneralRecognition_PPLCNet_x2_5.yaml 这四个路径中,我不知道是要修改这四个的文件里的每一个看到的head函数还是只用修改其中一个,(因为我是纯小白,看到您的项目很好就想着手运行着试试,但是专业知识太差劲了)
2.您说的算力问题,我尝试过跑,在训练到70/120时算力就用完了(十几个小时,我用的是算力消耗0.5/小时的)我不知道是我的运行方式是否有问题
非常感谢您的耐心指导!不论成功与否已经在您这里收获颇丰了,再次感谢!
- 修改第四个即可;
- 可以把epochs调小一点。
您好,根据您的方法,我已经训练成功了,想问问这个有训练完成后的结果图、测试图或者损失函数的曲线图,我这边只能看到损失函数的参数,
您好,根据您的方法,我已经训练成功了,想问问这个有训练完成后的结果图、测试图或者损失函数的曲线图,我这边只能看到损失函数的参数,
- yaml文件中将
use_visualdl
设置为True
,然后在output文件中找到生成的.vdl文件用visualdl打开即可看到曲线图; - 结果图可以使用predict_system.py推理可得.
可视化中的logdir设置的是PaddleClas/output/vdl,模型文件不知道是不是要设置predict_system.py 因为我添加他显示的是添加失败,于是我添加了PaddleClas/output/RecModel/latest.pdopt(因为在训练部分他最后提示
[2023/03/06 21:00:12] root INFO: Already save model in ./output/RecModel/epoch_10
[2023/03/06 21:00:13] root INFO: Already save model in ./output/RecModel/latest)
根据在网上搜索的教程 在终端操作后报错ModuleNotFoundError: No module named 'ffmpy'
是我曲解了您的意思了吗
好了 解决了 谢谢您的项目