Repozitorij z gradivi pri predmetu APPR v študijskem letu 2019/20
Analiziral bom migracijo po svetu (oziroma čim večih državah). Zajeta bosta tako imigracija kot emigracija. Primerjal bom podatke po starosti, izobrazbi, spolu, religiji. Države od kjer ljudje prihajajo in kamor grejo pa bom analiziral glede na kazalnike razvoja, kot je npr. BDP. Poskušal bom odkriti tudi časovne trende, saj so na voljo podatki iz zadnjih nekaj deset let. Države bom primerjal med sabo in iskal povezave med njimi ter jih s tem razvrstil v skupine.
Za vire bom uporabil spletne strani World Bank, Migration Data Portal, Združenih narodov, Wikipedio, World Population Review.
Viri imajo podatke v obliki CSV in v obliki HTML, zemljevid sveta, ki je trenutno uporabljen pa je vgrajen v R.
- migranti (origin, destination, leto, število),
- stock(država, leto, starost, spol, število),
- države (država, leto, BDP, populacija, izobraženost, HDI),
- religije (država, stolpci, ki prikazujejo število vernikov).
Cilj je najti korelacije med migracijo in raznimi indikatorji, ter ugotoviti, katere države so za emigracijo "najboljše".
Glavni program in poročilo se nahajata v datoteki projekt.Rmd
.
Ko ga prevedemo, se izvedejo programi, ki ustrezajo drugi, tretji in četrti fazi projekta:
- obdelava, uvoz in čiščenje podatkov:
uvoz/uvoz.r
- analiza in vizualizacija podatkov:
vizualizacija/vizualizacija.r
- napredna analiza podatkov:
analiza/analiza.r
Vnaprej pripravljene funkcije se nahajajo v datotekah v mapi lib/
.
Podatkovni viri so v mapi podatki/
.
Zemljevidi v obliki SHP, ki jih program pobere,
se shranijo v mapo ../zemljevidi/
(torej izven mape projekta).
Za zagon tega projekta je potrebno namestiti sledeče pakete za R:
knitr
- za izdelovanje poročilarmarkdown
- za prevajanje poročila v obliki RMarkdownshiny
- za prikaz spletnega vmesnikaDT
- za prikaz interaktivne tabelergdal
- za uvoz zemljevidovrgeos
- za podporo zemljevidomdigest
- za zgoščevalne funkcije (uporabljajo se za shranjevanje zemljevidov)readr
- za branje podatkovrvest
- za pobiranje spletnih stranitidyr
- za preoblikovanje podatkov v obliko tidy datadplyr
- za delo s podatkigsubfn
- za delo z nizi (čiščenje podatkov)ggplot2
- za izrisovanje grafovmosaic
- za pretvorbo zemljevidov v obliko za risanje zggplot2
maptools
- za delo z zemljevidiextrafont
- za pravilen prikaz šumnikov (neobvezno)tmap
- za risanje zemljevidovStandardizeText
- za poenotenje imen državreadxl
- za branje excel datotekplotly
- za dodatno funkcionalnost grafovscales
- za lepšo notacijo na oseh grafov
Zgornje povezave omogočajo poganjanje projekta na spletu z orodjem Binder. V ta namen je bila pripravljena slika za Docker, ki vsebuje večino paketov, ki jih boste potrebovali za svoj projekt.
Če se izkaže, da katerega od paketov, ki ji potrebujete, ni v sliki,
lahko za sprotno namestitev poskrbite tako,
da jih v datoteki install.R
namestite z ukazom install.packages
.
Te datoteke (ali ukaza install.packages
) ne vključujte v svoj program -
gre samo za navodilo za Binder, katere pakete naj namesti pred poganjanjem vašega projekta.
Tako nameščanje paketov se bo izvedlo pred vsakim poganjanjem v Binderju. Če se izkaže, da je to preveč zamudno, lahko pripravite lastno sliko z želenimi paketi.
Če želite v Binderju delati z git,
v datoteki gitconfig
nastavite svoje ime in priimek ter e-poštni naslov
(odkomentirajte vzorec in zamenjajte s svojimi podatki) -
ob naslednjem zagonu bo mogoče delati commite.
Te podatke lahko nastavite tudi z git config --global
v konzoli
(vendar bodo veljale le v trenutni seji).