/Statistika

Dodiplomski kolegij iz statistike u zimskom semestru akademske godine 2019/20 na Fakultetu hrvatskih studija u Zagrebu.

Primary LanguageHTML

Primjena statistike u društvenim istraživanjima

Dobrodošli na stranice kolegija Primjena statistike u društvenim istraživanjima koji u zimskom semestru, 2020/21 izvodi Luka Šikić, PhD na Fakultetu hrvatskih studija u Zagrebu. Kolegij je prvenstveno namijenjen studentima sociologije na preddiplomskoj razini, a može koristiti svim studentima društvenih i humanističkih smjerova koji su upoznati sa osnovama statistike.

U kolegiju se obrađuju osnove statistike organizirane u tri cjeline:

  1. deskriptivna statistika i vizualizacija
  2. statistička teorija
  3. inferencijalna statistika (statistički modeli).

Primjenjeni aspekt kolegija odnosi na provedbu statističkih koncepata u programskom jeziku R. Pri tome je naglasak na osnovnoj base:: sintaksi programskog jezika R, a manje na korištenju specifičnih paketa.

Cilj kolegija je dvojak: 1) utvrđivanje osnovnih statističkih koncepata, 2) osposobljavanje za rad s podatcima i samostalnu provedbu statističke analize. Pri tome je veći naglasak stavljen na praktičnu primjenu statističkih koncepata nego na statističku teoriju. Kolegij ne zahtjeva prethodno poznavanje programskog jezika R no najveću će korist ostvariti studenti koji materijale (ili dio) prate u kroz jezik R. Studentima se preporuča instalacija Git-a i doprinos kolegiju kroz GitHub (primjerice kroz ispravke grešaka ili poboljšanje materijala...). Materijali u ovom repozitoriju su napravljeni po Open Source principima.

Kolegij će studentima društvenih znanosti omogućiti uključivanje u modernu paradigmu rada sa podatcima i otvoriti perspektivu rada sa Data Science i Big Data tehnologijama. Na taj način kolegij studentima otvara priliku produbljenja akademskih vještina (provedba kvantitativne empirijske analize), povećava mogućnosti zaposlenja (na strani analitike ili pojektnog IT menadzmenta) i doprinosi smanjenju STEM jaza.

Raspored

Predavanja     Ponedjeljkom, 16:00–17:30
Vježbe            Ponedjeljkom, 17:30–19:00
Konzultacije   Četvrtkom,      17:30-18:30

Knjige

Koristiti ćemo tri knjige.

Learning statistics with R (LSR)
od Danielle Navarro.
Ovo je glavna literatura. Pogledajte i dodatne materijale koji prate knjigu. Dostupna je i bookdown verzija.

Osnovne statističke metode za nematematičare
od Boris Petz.
Ovo je također glavna literatura i preporuča se studentima koji ne polože ispit preko kolokvija.

Applied Statistics with R
od David Dalpiaz.
Ovo je dodatna literatura za one koji žele znati više. Dostupna je i bookdown verzija.

Materijali sa predavanja

Napomena: Predavanja će biti dostupna kao .pdf,.html i .Rmd.

Predavanje 01: Pregled kolegija i studentskih obveza

Predavanje 02: Uvod u R (+ Dodatni koncepti R)
  • Radni prostor
  • Osnovne naredbe
  • Funkcije
  • Vektori
  • Logički operatori

Format predavanja: .html | .pdf | .Rmd (+ Dodatni koncepti R: .html | .pdf | .Rmd)
Čitanje: Uvod u R - skripta I + Uvod u R - skripta II + LSR, poglavlja 3 i 4

Predavanje 03: Deskriptivna statistika
  • Podatci
  • Mjere centralne tendencije
  • Mjere varijabilnosti
  • Mjere asimetrije i zaobljenosti
  • Pregled varijabli i skupova podataka
  • Standardizirane vrijednostii
  • Korelacija

Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 5.

Predavanje 04: Vizualizacija podataka + Dodatno(ggplot2)
  • Vizualizacija, alati i podrška
  • Izrada jednostavnog grafikona
  • Histogram
  • Box-plot
  • Prikaz korelacije
  • Dijagram rasipanja
  • Stupčasti grafikon

Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 6.

Predavanje 05: Distribucije
  • Deskriptivna vs. inferencijalna statistika
  • Binomna distribucija
  • Standardna distribucija
  • Druge često korištene distribucije

Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 9.

Predavanje 06: Uzorak i populacija
  • Uzorak i populacija
  • Procjena prosjeka i standardne devijacije populacije
  • Sampling distribucije
  • Teorem centralne tendencije
  • Intervali pouzdanosti

Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 10.

Predavanje 07: Testiranje hipoteza
  • Vrste pogrešaka
  • Testna statistika i sampling distribucija
  • Kritičke vrijednosti i granice
  • p-vrijednosti
  • Interpretacija rezultata
  • Testiranje hipoteza u R
  • Efekt veličine i snaga testa
  • Dodatni koncepti

Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 11.

Predavanje 08: Kategorijalna analiza
  • Goodness-of-fit test
  • Test nezavisnosti
  • Korekcija kontinuiranosti
  • Efekt veličine
  • Pretpostavke testa
  • Izvođenje chi-sq testova u R
  • Fisherov test za male uzorke
  • McNemarov test zavisnih uzoraka

Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 12.

Predavanje 09: Usporedba prosjeka
  • z-test
  • t-test
  • t-test u nezavisnim uzorcima
  • t-test u zavisnim uzorcima
  • Jednostrani testovi
  • Izvođenje t-testova u R
  • Efekt veličine
  • Provjera normalnosti distribucije

Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 13.

Predavanje 10: ANOVA
  • ANOVA
  • ANOVA u R
  • Efekt veličine
  • Post hoc testovi
  • Pretpostavke jednostrane ANOVA-e
  • Homogenost varijance
  • Normalnost distribucije

Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 14.

Predavanje 11: Linearna regresija
  • Linearna regresija
  • Multivarijatna linearna regresija
  • Karakteristike procijenjenog modela
  • Testiranje hipoteza
  • Pretpostavke modela
  • Provjera modela
  • Izbor parametara modela

Format predavanja: .html | .Rmd
Čitanje: LSR,poglavlje 15.

Predavanje 12: Faktorska ANOVA
  • Faktorska ANOVA (balansirani dizajn;bez interakcija)
  • Faktorska ANOVA (balansirani dizajn;interakcije)
  • Efekt veličine
  • Provjera pretpostavki
  • Faktorska ANOVA (nebalansirani dizajn)

Polaganje ispita i kolokvija

Studentima se preporuča i omogućuje da polože kolegij kroz prezentaciju i dva kolokvija. Sustav bodovanja za studente koji polažu kolegij preko kolokvija: moguće je skupiti 100 bodova, pri tome je na prezentaciji moguće ostvariti do 10 bodova, a na svakom kolokviju do 40 bodova. Pri tome je sustav bodovanja jednak kao kod ispita(vidi niže!). I U zimskom , ljetnom i jesenskom ispitnom roku studenti imaju završni pismeni ispit iz tema obrađenih na predavanjima i prema priloženoj literaturi. Ispit je položen ako student ostvari 60% od ukupno mogućih bodova: 60-64% = (2); 65-74% = (3); 75-84% = (4); 85% = (5).

Studentska prezentacija/seminarski rad

Svi studenti tijekom semestra moraju održati jednu prezentaciju prema zadanoj literaturi u .ppt formi. Izlagači moraju pripremiti na kraju prezentacije i nekoliko (2-3) ključnih pitanja za raspravu koju imamo na kraju obrađene teme. Prezentaciju studenti moraju poslati profesoru na e-mail najkasnije u petak, tjedan dana prije seminara. Seminari osim prezentacije uključuju: povezivanje teorijskih koncepata s praktičnom primjenom, zajednička empirijska analiza, rasprava o društvenim aspektima statističkih rezultata, aktivno sudjelovanje u raspravi na zadanu temu.

Korisni resursi

Statistika

R

Ostalo

Zanimljivosti