首先如果你沒有資料庫的話要先下載下來 下載方法如下方所示
cd dataset
wget ftp://guest:GU.205dldo@ftp.softronics.ch/mvtec_anomaly_detection/mvtec_anomaly_detection.tar.xz
tar xvf mvtec_anomaly_detection.tar.xz
這邊包含了 5 個步驟
- 先把圖片轉換乘 1024 的大小
- 把圖片切成 64 x 64 的小圖給 vgg19 抽取特徵
- 將步驟 2 的小圖進行分群
- 生成 groundtruth
- 這步我其實還是不知道在幹嘛,我相信你比我清楚
- 執行方式只需跑
./preprocess.sh
- 如果遇到他說那個檔案不能跑的話先執行
chmod +x preprocess.sh
- preprocess.sh 裡面記得更改成你要跑的資料庫
參數部分請自己調整,如果你懶的話也可以把這個指令加到 preprocess.sh 的最後,這樣
preprocess.sh
就會一條龍的幫你執行完,但是效果要看你的運氣囉CUDA_VISIBLE_DEVICES=0,1 python model_weightSample.py --train_batch 16 --kmeans=128 --data=wood --type=good --epoch 40 &
- 基本上檔案結構我沒什麼改,只有把所有前處理資料都塞進去 preprocessData 裡面,此外有一個 config.py 的檔案,裡面有你的 root 也就是你的 bag_of_words 這個資料夾的絕對路徑,如果你要搬去其他地方執行的話記得要更改這個地方
- preprocess.py and convert.py 裡面的 dataset 路徑也要記得修改
- 我們的 dataset 一共有 15 種不同的類型,目前剩下最後兩種 (wood, zipper) 還沒跑實驗