Dane przestrzenne w uczeniu maszynowym
To repozytorium zawiera materiały do warsztatu "Dane przestrzenne w uczeniu maszynowym - środowisko R" przeprowadzonego podczas konferencji Geoinformacja: Nauka – Praktyka – Edukacja (02.12.2022 r.).
R jest jednym z najbardziej popularnych języków programowania używanych do analizy danych. R znalazł szczególne zastosowanie w takich dziedzinach jak ekologia, leśnictwo, hydrologia czy teledetekcja dzięki swojej prostocie, możliwości automatyzacji powtarzalnych zadań oraz ogromnemu wsparciu przez jego społeczność. R stanowi świetną alternatywę dla standardowych aplikacji GIS znacząco rozszerzając ich możliwość w kontekście statystycznej analizy danych i uczenia maszynowego.
Wymagania
Warsztat skierowany jest do osób, które posiadają podstawową wiedzę i doświadczenie w środowisku R. Wymagana jest również podstawowa wiedza z zakresu GIS oraz teledetekcji satelitarnej.
Jeśli jesteś osobą początkującą i chcesz rozszerzyć (lub odnowić) swoją wiedzę odnośnie środowiska R, to polecam bezpłatny kurs online "Pogromcy Danych" przygotowany przez Uniwersytet Warszawski. Dostępny jest również podręcznik w języku polskim: "Elementarz programisty: Wstęp do programowania używając R".
Kolejne podręczniki (w języku angielskim) dotyczące przestrzennej analizy danych to:
- Spatial Data Science with R and “terra”
- Geocomputation with R
- Spatial Data Science, with applications in R
Wstęp
1. Instalacja R
R jest językiem programowania. Można go pobrać dla Windows, MacOS oraz Linux.
2. Instalacja RStudio
RStudio natomiast jest zintegrowanym środowiskiem programistycznym z edytorem kodu. Aplikacja dostępna jest również na różnych platformach do pobrania w tym miejscu.
3. Instalacja pakietów
Jednym z najpopularniejszych pakietów do analizy przestrzennej w R jest pakiet terra. Umożliwia on analizę zarówno danych rastrowych i wektorowych. Można go zainstalować w następujący sposób:
install.packages("terra")
Następnie można go załadować używając funkcji library()
.
library("terra")
Dokumentację do tego pakietu znajdziesz tutaj: https://rspatial.github.io/terra/reference/terra-package.html
Materiały 🚩
Niezbędne dane rastrowe (scena Landsat 8, klasyfikacja pokrycia terenu) oraz wektorowe znajdziesz na Dysku Google oraz Zenodo. Po pobraniu dane należy rozpakować.
Interaktywne zeszyty (.Rmd) oraz statyczne dokumenty (.html) możesz pobrać z repozytorium https://github.com/kadyb/GEOINF2022:
Opis kanałów spektralnych znajdziesz tutaj. Informacje o klasach pokrycia terenu Sentinel-2 Global Land Cover (S2GLC) znajdziesz tutaj.
Kontakt
Jeśli masz jakieś pytania albo potrzebujesz pomocy, napisz do mnie pod adres krzysztof.dyba@amu.edu.pl.