/dl4j

DL4J jupyter notebooks

Deep Learning 4J

Repositório para armazenamento dos notebooks do Zeppelin utilizados no TCC da Especialização de BigData & DataScience da UFRGS.

GCloud

Foram criados vários clusters diferentes conforme cada um dos experimentos do trabalho. Abaixo seguem os scripts de criação utilizados:

Modelos conhecidos

Comando do gcloud para criação dos clustes usados no capítulo de datasets e modelos conhecidos.

gcloud dataproc clusters create neuwaldcluster --initialization-actions gs://ufrgsneuwald/zeppelin/zeppelin.sh --zone us-central1-b --master-machine-type n1-standard-8 --master-boot-disk-size 25 --num-workers 6 --worker-machine-type c2-standard-4 --worker-boot-disk-size 25 --image-version 1.1

Comandos do gcloud para criação dos clustes usados no capítulo de avaliação de performance em diferentes clusters.

gcloud dataproc clusters create tcc2 --initialization-actions gs://ufrgsneuwald/zeppelin/zeppelin.sh --master-machine-type n1-standard-8 --master-boot-disk-size 25 --num-workers 2 --worker-machine-type n1-standard-8 --worker-boot-disk-size 25 --image-version 1.1

gcloud dataproc clusters create tcc --initialization-actions gs://ufrgsneuwald/zeppelin/zeppelin.sh --zone southamerica-east1-b --master-machine-type n1-standard-8 --master-boot-disk-size 25 --num-workers 2 --worker-machine-type n1-standard-8 --worker-boot-disk-size 25 --image-version 1.1

gcloud dataproc clusters create tccn2 --initialization-actions gs://ufrgsneuwald/zeppelin/zeppelin.sh --zone us-central1-a --master-machine-type n1-standard-2 --master-boot-disk-size 25 --num-workers 6 --worker-machine-type n2-standard-2 --worker-boot-disk-size 25 --image-version 1.1

gcloud dataproc clusters create tcc6 --initialization-actions gs://ufrgsneuwald/zeppelin/zeppelin.sh --zone us-central1-a --master-machine-type n1-standard-2 --master-boot-disk-size 25 --num-workers 6 --worker-machine-type n1-standard-2 --worker-boot-disk-size 25 --image-version 1.1

gcloud dataproc clusters create tcc6h --initialization-actions gs://ufrgsneuwald/zeppelin/zeppelin.sh --zone us-central1-a --master-machine-type n1-standard-4 --master-boot-disk-size 25 --num-workers 6 --worker-machine-type n1-standard-4 --worker-boot-disk-size 25 --image-version 1.1

gcloud dataproc clusters create tcc12 --initialization-actions gs://ufrgsneuwald/zeppelin/zeppelin.sh --zone us-central1-a --master-machine-type n1-standard-4 --master-boot-disk-size 25 --num-workers 12 --worker-machine-type n1-standard-2 --worker-boot-disk-size 25 --image-version 1.1

gcloud dataproc clusters create tcc6 --initialization-actions gs://ufrgsneuwald/zeppelin/zeppelin.sh --zone us-central1-a --master-machine-type n1-standard-4 --master-boot-disk-size 25 --num-workers 12 --worker-machine-type n1-standard-2 --worker-boot-disk-size 25 --image-version 1.1

Script para mudar arquivo de hosts

Os dados do DL4J 0.9.1 não estão mais disponíveis no endereço antigo. Para usar os exemplos antigos é necessário mudar o arquivo de hosts.

sudo su
echo "52.229.32.188 benchmark.deeplearn.online" >> /etc/hosts
exit

Ajustar memória do Zeppelin

sudo su
cd /etc/zeppelin/conf
vi zeppelin-env.sh
-Xms10g -Xmx10g -XX:MaxPermSize=6g
service zeppelin restart

VPN

gcloud compute ssh tcc-m \
  --project=hidden-analyzer-249419 \
  --zone=southamerica-east1-b -- -D 1080 -N
gcloud compute ssh tcc6w-m \
  --project=hidden-analyzer-249419 \
  --zone=us-central1-a -- -D 1080 -N

Google Chrome

"/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" \
  --proxy-server="socks5://localhost:1080" \
  --user-data-dir="/tmp/tcc-m" http://tcc-m:8088
"/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" \
  --proxy-server="socks5://localhost:1080" \
  --user-data-dir="/tmp/tcc6w-m" http://tcc6w-m:8088