Schemat eksperymentów

Proponujemy schemat eksperymentów z wykorzystaniem:

  • paczki Pytorch Lightning - do porządkowania kodu Pytorch-a
  • Hydra - do porządkowania configów
  • WandB - do logowania

Przykład użycia znajduje się w notatniku. Szczegółowy opis schematu TUTAJ.

UWAGA: Trenowanie DDP (użycie wielu GPU) nie działa w notatnikach. Do tego celu można użyć skryptu:

python run.py

Plik run.py znajduje się w .gitignore, przykładowa zawartość w pliku _run_example.py. Skryptu można używać też po prostu zamiast notatnika, chociaż tracimy wtedy interaktywność i łatwy wgląd w architekturę modeli albo dane. Jeśli chcemy odpiąć proces z konkretnej sesji terminala, możemy użyć screen, przykładowo:

screen -S <nazwa eksperymentu>
<odpalenie eksperymentu>
<ctrl + a>
<d> - detach okna

Gotowe środowisko na kulfonie

Na Kulfonie jest postawione środowisko dl_template (/opt/tljh/user/envs/dl_template), aktywacja przez:

source /opt/tljh/user/bin/activate
conda activate dl_template

W środowisku są zainstalowane wszystkie potrzebne paczki; jest ono także dostępne z poziomu JupyterHub. Są też ustawione zmienne środowiska condowego WANDB_API_KEY oraz WANDB_BASE_URL, dzięki którym działa logowanie do lokalnej instancji wandb. Można sprawdzić, odpalając z poziomu środowiska dl_template:

conda env config vars list

Wyniki logowania można podejrzeć na localhost:8081 po zalogowaniu jako user portal. Wyniki są zebrane w projekcie dl_template_example.

Pozostałe