happy2048/mnist-pytorch

Python

pytorch-mnist-dist

使用方式

build 运行时的镜像

# docker build -f Dockerfile -t ${YOUR_IMAGE_REPO}/pytorch-with-tensorboard:1.5.1-cuda10.1-cudnn7-runtime ./
docker build -f Dockerfile -t registry.cn-huhehaote.aliyuncs.com/lumo/pytorch-with-tensorboard:1.5.1-cuda10.1-cudnn7-runtime ./

在当前目录本地启动一个镜像

# docker run -itd --name pytorch-1.5 -v $PWD:/workspace ${YOUR_IMAGE_REPO}/pytorch-with-tensorboard:1.5.1-cuda10.1-cudnn7-runtime bash
docker run -itd --name pytorch-1.5 -v $PWD:/workspace registry.cn-huhehaote.aliyuncs.com/lumo/pytorch-with-tensorboard:1.5.1-cuda10.1-cudnn7-runtime bash

进入容器
```
docker exec -it pytorch-1.5 bash
```

执行以下命令

#gloo
python mnist.py --backend gloo
#nccl
python mnist.py --backend nccl
#mpi（pytorch 在编译的时候需要指定 mpi）
python mnist.py --backend mpi

说明

MNIST/ 存放的是 mnist 数据集
mpi 的分布式需要 pytorch 编译的时候支持 mpi, 并且在有 mpi 的环境中才能执行