本代码参考github链接
环境python+cuda+cuDNN+pytorch(还有其他一些杂七杂八的,报错提示有别的库没下就自己下一下) 在frcnn.py文件中,有如下代码:
class FRCNN(object):
_defaults = {
"model_path" : 'logs/Epoch49-Total_Loss0.2045-Val_Loss0.4614.pth',
"classes_path" : 'model_data/slide_class.txt',
"confidence" : 0.5,
"iou" : 0.3,
"backbone" : "resnet50",
"cuda" : True,
}
.....
model_path表示你选择的权重文件的路径,这是一个训练好的提取码:f7ww,下载好后放到logs文件夹下 运行predict.py,输入文件路径即可进行测试
resnet预训练权重百度网盘地址:提取码vs9n 预训练权重文件放到model_data文件夹下
landslide_train.txt文件每一行记录了图片的相对路径,以及标识框的坐标,类别(本例中只有一个类就是滑坡,数值位0) 运行train.py进行训练 训练过程中每一次迭代生成的权重文件会自动保存到logs文件夹下,这些权重文件就是训练出来的模型。理论上迭代次数最多的模型性能越好
数据集百度网盘地址:提取码mnd6 resnet预训练权重百度网盘地址:提取码vs9n 把下载好的数据集中的所有图片复制到项目LandSlide_Detection_Faster-RCNN\LandSlideDataSet\images文件夹下 预训练权重文件放到model_data文件夹下
详细教程可以参考bilibili视频链接 voc2frcnn用于在LandSlideDataSet/ImageSets文件下生成train.txt文件 voc_annotation用于在项目文件夹下生成landslide_train.txt