Dobrodošli na stranice kolegija Primjena statistike u društvenim istraživanjima koji u zimskom semestru, 2020/21 izvodi Luka Šikić, PhD na Fakultetu hrvatskih studija u Zagrebu. Kolegij je prvenstveno namijenjen studentima sociologije na preddiplomskoj razini, a može koristiti svim studentima društvenih i humanističkih smjerova koji su upoznati sa osnovama statistike.
U kolegiju se obrađuju osnove statistike organizirane u tri cjeline:
- deskriptivna statistika i vizualizacija
- statistička teorija
- inferencijalna statistika (statistički modeli).
Primjenjeni aspekt kolegija odnosi na provedbu statističkih koncepata u programskom jeziku R. Pri tome je naglasak na osnovnoj base::
sintaksi programskog jezika R, a manje na korištenju specifičnih paketa.
Cilj kolegija je dvojak: 1) utvrđivanje osnovnih statističkih koncepata, 2) osposobljavanje za rad s podatcima i samostalnu provedbu statističke analize. Pri tome je veći naglasak stavljen na praktičnu primjenu statističkih koncepata nego na statističku teoriju. Kolegij ne zahtjeva prethodno poznavanje programskog jezika R no najveću će korist ostvariti studenti koji materijale (ili dio) prate u kroz jezik R. Studentima se preporuča instalacija Git-a i doprinos kolegiju kroz GitHub (primjerice kroz ispravke grešaka ili poboljšanje materijala...). Materijali u ovom repozitoriju su napravljeni po Open Source principima.
Kolegij će studentima društvenih znanosti omogućiti uključivanje u modernu paradigmu rada sa podatcima i otvoriti perspektivu rada sa Data Science i Big Data tehnologijama. Na taj način kolegij studentima otvara priliku produbljenja akademskih vještina (provedba kvantitativne empirijske analize), povećava mogućnosti zaposlenja (na strani analitike ili pojektnog IT menadzmenta) i doprinosi smanjenju STEM jaza.
Predavanja Ponedjeljkom, 16:00–17:30
Vježbe Ponedjeljkom, 17:30–19:00
Konzultacije Četvrtkom, 17:30-18:30
Koristiti ćemo tri knjige.
Learning statistics with R (LSR)
od Danielle Navarro.
Ovo je glavna literatura. Pogledajte i dodatne materijale koji prate knjigu. Dostupna je i bookdown verzija.
Osnovne statističke metode za nematematičare
od Boris Petz.
Ovo je također glavna literatura i preporuča se studentima koji ne polože ispit preko kolokvija.
Applied Statistics with R
od David Dalpiaz.
Ovo je dodatna literatura za one koji žele znati više. Dostupna je i bookdown verzija.
Napomena: Predavanja će biti dostupna kao .pdf,.html i .Rmd.
Predavanje 01: Pregled kolegija i studentskih obveza
- Radni prostor
- Osnovne naredbe
- Funkcije
- Vektori
- Logički operatori
Format predavanja: .html | .pdf | .Rmd (+ Dodatni koncepti R: .html | .pdf | .Rmd)
Čitanje: Uvod u R - skripta I + Uvod u R - skripta II + LSR, poglavlja 3 i 4
- Podatci
- Mjere centralne tendencije
- Mjere varijabilnosti
- Mjere asimetrije i zaobljenosti
- Pregled varijabli i skupova podataka
- Standardizirane vrijednostii
- Korelacija
Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 5.
- Vizualizacija, alati i podrška
- Izrada jednostavnog grafikona
- Histogram
- Box-plot
- Prikaz korelacije
- Dijagram rasipanja
- Stupčasti grafikon
Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 6.
- Deskriptivna vs. inferencijalna statistika
- Binomna distribucija
- Standardna distribucija
- Druge često korištene distribucije
Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 9.
- Uzorak i populacija
- Procjena prosjeka i standardne devijacije populacije
- Sampling distribucije
- Teorem centralne tendencije
- Intervali pouzdanosti
Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 10.
- Vrste pogrešaka
- Testna statistika i sampling distribucija
- Kritičke vrijednosti i granice
- p-vrijednosti
- Interpretacija rezultata
- Testiranje hipoteza u R
- Efekt veličine i snaga testa
- Dodatni koncepti
Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 11.
- Goodness-of-fit test
- Test nezavisnosti
- Korekcija kontinuiranosti
- Efekt veličine
- Pretpostavke testa
- Izvođenje chi-sq testova u R
- Fisherov test za male uzorke
- McNemarov test zavisnih uzoraka
Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 12.
- z-test
- t-test
- t-test u nezavisnim uzorcima
- t-test u zavisnim uzorcima
- Jednostrani testovi
- Izvođenje t-testova u R
- Efekt veličine
- Provjera normalnosti distribucije
Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 13.
- ANOVA
- ANOVA u R
- Efekt veličine
- Post hoc testovi
- Pretpostavke jednostrane ANOVA-e
- Homogenost varijance
- Normalnost distribucije
Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 14.
- Linearna regresija
- Multivarijatna linearna regresija
- Karakteristike procijenjenog modela
- Testiranje hipoteza
- Pretpostavke modela
- Provjera modela
- Izbor parametara modela
Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 15.
- Faktorska ANOVA (balansirani dizajn;bez interakcija)
- Faktorska ANOVA (balansirani dizajn;interakcije)
- Efekt veličine
- Provjera pretpostavki
- Faktorska ANOVA (nebalansirani dizajn)
Studentima se preporuča i omogućuje da polože kolegij kroz prezentaciju i dva kolokvija. Sustav bodovanja za studente koji polažu kolegij preko kolokvija: moguće je skupiti 100 bodova, pri tome je na prezentaciji moguće ostvariti do 10 bodova, a na svakom kolokviju do 40 bodova. Pri tome je sustav bodovanja jednak kao kod ispita(vidi niže!). I U zimskom , ljetnom i jesenskom ispitnom roku studenti imaju završni pismeni ispit iz tema obrađenih na predavanjima i prema priloženoj literaturi. Ispit je položen ako student ostvari 60% od ukupno mogućih bodova: 60-64% = (2); 65-74% = (3); 75-84% = (4); 85% = (5).
Svi studenti tijekom semestra moraju održati jednu prezentaciju prema zadanoj literaturi u .ppt formi. Izlagači moraju pripremiti na kraju prezentacije i nekoliko (2-3) ključnih pitanja za raspravu koju imamo na kraju obrađene teme. Prezentaciju studenti moraju poslati profesoru na e-mail najkasnije u petak, tjedan dana prije seminara. Seminari osim prezentacije uključuju: povezivanje teorijskih koncepata s praktičnom primjenom, zajednička empirijska analiza, rasprava o društvenim aspektima statističkih rezultata, aktivno sudjelovanje u raspravi na zadanu temu.