/ToolWithImageNet

利用ImageNet的資源,進行關鍵字比對、下載圖檔、清理下載圖檔,最後將圖檔製作成單一HDF5檔

Primary LanguageJavaMIT LicenseMIT

圖像資料蒐集小工具

這是一個利用 image-net.org 資源所寫的小工具,

從使用者打關鍵字到製作成HDF5檔案以便機器學習使用。


  • 頁面一:自行下載(開瀏覽器)、自動下解解壓縮、關鍵字串分割產生wnid 圖一
  • 頁面二:利用上一步wnid查找、產生下載連結 圖一
  • 頁面三:利用上一步下載連結,用多執行緒下載圖檔 圖一
  • 頁面四:利用上一步下載的圖檔,進行清理作業(clean data) 圖一
  • 頁面五:利用上一步的clean data,進行資料包裝、單一化以便後續處理 圖一

環境

Ubuntu 16.04

Java SDK 1.8.0_151

imagemagick 6.8.9-9 (identify)

  • use Runtime.getRuntime().exec(command) in WalkingFileTree.java in CleanImages.java

Libraries

OpenCV 3.3.0

jarhdf5-3.3.2

slf4j-api-1.7.5

slf4j-simple-1.7.5

tika-app-1.16

xmpcore-5.1.2


編譯成jar執行程式後,需要加入hdf5和opencv的.so檔library路徑如下:

Command line 執行程式:

java -Djava.library.path=/native/library/path -jar JavaFXApp.jar

License

MIT