Downsampled ImageNet Path Fixer

The official ImageNet website (https://image-net.org/) provides a downsampled ImageNet (resolution is reduced to 8x8, 16x16, 32x32, or 64x64) for faster training.
However, using Downsampled ImageNet in PyTorch is inconvenient since its file structure is different from the original ImageNet.

This repo provides a script that converts the Downsampled ImageNet provided in https://image-net.org to the structure for ImageFolder in PyTorch.

Step 1: Download Downsampled ImageNet

First download the downsampled ImageNet, and unzip *.zip files.
After upzipping the downloaded files, we can obtain files as follow:

train_data_batch_1   train_data_batch_2  train_data_batch_4  train_data_batch_6  train_data_batch_8  val_data
train_data_batch_10  train_data_batch_3  train_data_batch_5  train_data_batch_7  train_data_batch_9

Step 2: Run Script

Before running the script, we have to install depencendies:

$ pip install -r requirements.txt

Then, we run fix_pathes.py with params. See fix_pathes.py for detail params.

$ python fix_pathes.py -d path/to/downloaded_data -o path/to/output

Procedures in overall

# Download files
$ wget <imagenet32_train_download_path>
$ wget <imagenet32_val_download_path>

# Create dir and unzip files into the dir
$ mkdir tmp
$ unzip Imagenet32_train.zip -d tmp
$ unzip Imagenet32_val.zip -d tmp

# Intall depencendies and run script
$ pip install -r requirements.txt
$ python fix_pathes.py -d tmp -o imagenet_32_32

# Check results
$ ls imagenet_32_32
$ ls imagenet_32_32/val

# Remove old files
$ rm Imagenet32_train.zip Imagenet32_val.zip
$ rm -rf tmp

How to use in PyTorch

We can load Downsampled ImageNet using ImageFolder like original ImageNet.

import os
import torch
import torchvision
import torchvision.transforms as transforms


def get_loaders(datapath, args):
    traindir = os.path.join(datapath, 'train')
    valdir = os.path.join(datapath, 'val')
    normalize = transforms.Normalize(mean=[0.4810, 0.4574, 0.4078],
                                     std=[0.2146, 0.2104, 0.2138])

    trainset = torchvision.datasets.ImageFolder(traindir, transforms.Compose([
        transforms.RandomHorizontalFlip(),
        transforms.ToTensor(),
        normalize,
    ]))
    trainloader = torch.utils.data.DataLoader(trainset, batch_size=args.batch_size, shuffle=True)

    testset = torchvision.datasets.ImageFolder(valdir, transforms.Compose([
        transforms.ToTensor(),
        normalize,
    ]))
    testloader = torch.utils.data.DataLoader(testset, batch_size=128, shuffle=False)

    return trainloader, testloader

Prev/downsampled-imagenet-path-fixer

Downsampled ImageNet Path Fixer

Step 1: Download Downsampled ImageNet

Step 2: Run Script

Procedures in overall

How to use in PyTorch

Reference