本專案包含多個經典的深度學習神經網路模型,適用於影像分類與分割等任務。以下簡要介紹各模型架構、特色與應用場景。
- 簡介:
- AlexNet 是 2012 年 ImageNet 競賽冠軍模型,開啟了深度卷積神經網路在圖像分類領域的熱潮。
- 架構特色:
- 多層卷積層與池化層,搭配 ReLU 激活函數。
- 使用 Dropout 防止過擬合。
- 支援 GPU 並行運算。
- 應用場景:
- 圖像分類、特徵提取。
- 使用方式:
- 請參考
alexnet_example.py進行訓練與推論。
- 請參考
- 簡介:
- ResNet(Residual Network)於 2015 年提出,通過殘差連接(skip connection)解決深層網路訓練困難的問題。
- 架構特色:
- 引入殘差塊(Residual Block),允許訊息直接跨層傳遞。
- 支援極深的網路結構(如 ResNet-18、ResNet-34、ResNet-50 等)。
- 應用場景:
- 圖像分類、物件偵測、特徵學習等。
- 使用方式:
- 請參考
resnet.py,可直接呼叫resnet18()建立模型。
- 請參考
- 簡介:
- U-Net 是專為生醫影像分割設計的網路架構,具有對稱的編碼器-解碼器結構。
- 架構特色:
- 編碼器(收縮路徑)提取特徵,解碼器(擴張路徑)恢復空間細節。
- 跳躍連接(skip connection)保留高解析度資訊。
- 適合少量資料下的精細分割。
- 應用場景:
- 醫學影像分割、衛星影像分割、一般語意分割任務。
- 使用方式:
- 請參考
u-net.py,可直接建立UNet類別並進行訓練與推論。
- 請參考
- Python 3.7 以上
- PyTorch 1.7 以上
- 其他依賴請參考
requirements.txt
如有問題歡迎提出 issue 或聯絡作者。