Seorang peneliti melakukan penelitian mengenai pengaruh aktivitas 𝐴 terhadap kadar saturasi oksigen pada manusia. Peneliti tersebut mengambil sampel sebanyak 9 responden. Pertama, sebelum melakukan aktivitas 𝐴, peneliti mencatat kadar saturasi oksigen dari 9 responden tersebut. Kemudian, 9 responden tersebut diminta melakukan aktivitas 𝐴. Setelah 15 menit, peneliti tersebut mencatat kembali kadar saturasi oksigen dari 9 responden tersebut. Berikut data dari 9 responden mengenai kadar saturasi oksigen sebelum dan sesudah melakukan aktivitas 𝐴
Berdasarkan data pada tabel diatas, diketahui kadar saturasi oksigen dari responden ke-3 ketika belum melakukan aktivitas 𝐴 sebanyak 67, dan setelah melakukan aktivitas 𝐴 sebanyak 70.
Carilah Standar Deviasi dari data selisih pasangan pengamatan tabel diatas
Langkah pertama penyelesaian adalah memasukkan semua data yang ada pada tabel pada sebuah variabel sebagai berikut
before <- c(78, 75, 67, 77, 70, 72, 28, 74, 77)
after <- c(100, 95, 70, 90, 90, 90, 89, 90, 100)
Setelah dimasukkan semua datanya, maka dilakukan cek data menggunakan data.frame
yaitu
my_data <- data.frame(
group = rep(c("sebelum", "sesudah"), each = 9),
saturation = c(before, after)
)
Setelah itu dilihat hasil framenya sebagai berikut
print(my_data)
Selanjutnya mencari standar deviasinya. Standar deviasi sebelum aktivitas adalah
SD_before <- sd(before)
SD_before
Standar deviasi setelah aktivitas adalah
SD_after <-sd(after)
SD_after
carilah nilai t (p-value)
Untuk mencari nilai t terutama p-value maka bisa menggunakan fungsi t.test
yaitu sebagai berikut
t.test(before, after, alternative = "greater", var.equal = FALSE)
Maka hasilnya adalah:
tentukanlah apakah terdapat pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen, sebelum dan sesudah melakukan aktivitas 𝐴 jika diketahui tingkat signifikansi 𝛼 = 5% serta H0 : “tidak ada pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴”
Langkah pertama yaitu melihat hasil komparasi dua variabel berikut
var.test(before, after)
Selanjutnya, untuk melihat pengaruh jika tingkat signifikasi 5% dan tidak ada pengaruh yang signifikan secara statistika, maka adalah sebagai berikut
t.test(before, after, var.equal = TRUE)
Bisa dilihat bahwa mean dan convidence sama dengan 1b, yang berbeda adalah p-value dan df. Sehingga tidak memiliki pengaruh yang signifikan secara statistika
Diketahui bahwa mobil dikemudikan rata-rata lebih dari 20.000 kilometer per tahun. Untuk menguji klaim ini, 100 pemilik mobil yang dipilih secara acak diminta untuk mencatat jarak yang mereka tempuh. Jika sampel acak menunjukkan rata-rata 23.500 kilometer dan standar deviasi 3900 kilometer. (Kerjakan menggunakan 2 library seperti referensi pada modul).
Apakah Anda setuju dengan klaim tersebut?
Setuju
Jelaskan maksud dari output yang dihasilkan!
Diketahui n = 100, Rata-Rata (X̄) = 23500, dan standar deviasi(σ) = 3900 Maka null hipotesis adalah
H0 : μ = 20000
Alternatif hipotesisnya yaitu
H1 : μ > 20000
Buatlah kesimpulan berdasarkan P-Value yang dihasilkan!
Untuk mencari nilai z nya yaitu
Lalu mencari nilai p-value nya sebagai berikut
Sehingga kesimpulan yang didapat adalah bahwa mobil dikemudikan rata-rata lebih dari 20.000 kilometer per tahun
Diketahui perusahaan memiliki seorang data analyst ingin memecahkan permasalahan pengambilan keputusan dalam perusahaan tersebut. Selanjutnya didapatkanlah data berikut dari perusahaan saham tersebut.
Dari data diatas berilah keputusan serta kesimpulan yang didapatkan dari hasil diatas. Asumsikan nilai variancenya sama, apakah ada perbedaan pada rata-ratanya (α= 0.05)? Buatlah :
H0 dan H1
dilakukan perhitungan H0 sebagai berikut
dilakukan perhitungan H1 sebagai berikut
Hitung Sampel Statistik Penghitungan dilakukan sebagai berikut
tsum.test(mean.x=3.64, s.x = 1.67, n.x = 19, mean.y =2.79 , s.y = 1.32, n.y = 27, alternative = "greater", var.equal = TRUE)
Lakukan Uji Statistik (df =2)
Melakukan install library mosaic
install.packages("mosaic")
library(mosaic)
plotDist(dist='t', df=2, col="blue")
Nilai kritikal
Adapun untuk mendapatkan nilai kritikal bisa menggunakan qchisq
dengan df=2
sesuai soal sebelumnya
Keputusan
Teori keputusan adalah teori formal pengambilan keputusan di bawah ketidakpastian.
Aksinya adalah : ({a}_{a∈A})
Kemungkinan konsekuensi : ({c}_{c∈C})
(tergantung pada keadaan dan tindakan)
Maka keputusan dapat dibuat dengan t.test
Kesimpulan Kesimpulan yang didapatkan yaitu perbedaan rata-rata yang terjadi tidak ada jika dilihat dari uji statistik dan akan ada tetapi tidak signifikan jika dipengaruhi nilai kritikal.
Seorang Peneliti sedang meneliti spesies dari kucing di ITS . Dalam penelitiannya ia mengumpulkan data tiga spesies kucing yaitu kucing oren, kucing hitam dan kucing putih dengan panjangnya masing-masing. Jika : diketahui dataset https://intip.in/datasetprobstat1 H0 : Tidak ada perbedaan panjang antara ketiga spesies atau rata-rata panjangnya sama. Maka Kerjakan atau Carilah:
Buatlah masing masing jenis spesies menjadi 3 subjek "Grup" (grup 1,grup 2,grup 3). Lalu Gambarkan plot kuantil normal untuk setiap kelompok dan lihat apakah ada outlier utama dalam homogenitas varians.
Langkah pertama mengambil data dari link yang telah disediadakan
myFile <- read.table(url("https://rstatisticsandresearch.weebly.com/uploads/1/0/2/6/1026585/onewayanova.txt"))
dim(myFile)
head(myFile)
Selanjutnya membuat myFile menjadi group
myFile$Group <- as.factor(myFile$Group)
myFile$Group = factor(myFile$Group,labels = c("Kucing Oren","Kucing Hitam","Kucing Putih"))
Setelah itu, dicek apakah dia menyimpan nilai di groupnya
class(myFile$Group)
Lalu bagi tiap valuer menjadi 3 bagian ke 3 grup
group1 <- subset(myFile, Group=="Kucing Oren")
group2 <- subset(myFile, Group=="Kucing Hitam")
group3 <- subset(myFile, Group=="Kucing Putih")
carilah atau periksalah Homogeneity of variances nya , Berapa nilai p yang didapatkan? , Apa hipotesis dan kesimpulan yang dapat diambil ?
Mencari Homogeneity of variances bisa menggunakan command sebagai berikut
bartlett.test(Length~Group, data=dataoneway)
Setelah di jalankan maka nilai p-value = 0.8054. Kesimpulan yang didapatkan yaitu Bartlett's K-squared memiliki nilai sebesar 0.43292 dan df bernilai 2
qqnorm(group1$Length)
qqline(group1$Length)
Dari Hasil Poin C, Berapakah nilai-p ? , Apa yang dapat Anda simpulkan dari H0? Setelah di jalankan maka nilai p-value = 0.8054.
Verifikasilah jawaban model 1 dengan Post-hoc test Tukey HSD, dari nilai p yang didapatkan apakah satu jenis kucing lebih panjang dari yang lain? 3 Jelaskan. Langkah pertama adalah menggunakan command ANOVA
model1 <- lm(Length~Group, data=myFile)
Selanjutnya menggunakan command
anova(model1)
Lalu menggunakan model Post-hoc Tukey HSD sebagai berikut
TukeyHSD(aov(model1))
Visualisasikan data dengan ggplot2
library(ggplot2)
ggplot(dataoneway, aes(x = Group, y = Length)) + geom_boxplot(fill = "grey80", colour = "black") + scale_x_discrete() + xlab("Treatment Group") + ylab("Length (cm)")
Data yang digunakan merupakan hasil eksperimen yang dilakukan untuk mengetahui pengaruh suhu operasi (100˚C, 125˚C dan 150˚C) dan tiga jenis kaca pelat muka (A, B dan C) pada keluaran cahaya tabung osiloskop. Percobaan dilakukan sebanyak 27 kali dan didapat data sebagai berikut: Data Hasil Eksperimen. Dengan data tersebut:
Buatlah plot sederhana untuk visualisasi data
Run semua library yang diperlukan
install.packages("multcompView")
library(readr)
library(ggplot2)
library(multcompView)
library(dplyr)
Selanjutnya membaca file GTL.csv dari documents
GTL <- read_csv("GTL.csv")
head(GTL)
Lakukan observasi pada data
str(GTL)
Selanjutnya lakukan viasualisasi menggunakan simple plot yaitu sebagai berikut
qplot(x = Temp, y = Light, geom = "point", data = GTL) +
facet_grid(.~Glass, labeller = label_both)
Lakukan uji ANOVA dua arah Langkah pertama adalah membuat variabel as factor sebagai ANOVA
GTL$Glass <- as.factor(GTL$Glass)
GTL$Temp_Factor <- as.factor(GTL$Temp)
str(GTL)
Selanjutnya melakukan analisis of variance (aov) yaitu sebagai berikut
anova <- aov(Light ~ Glass*Temp_Factor, data = GTL)
summary(anova)
Tampilkan tabel dengan mean dan standar deviasi keluaran cahaya untuk setiap perlakuan (kombinasi kaca pelat muka dan suhu operasi)
Menggunakan group_by
lalu melakukan summarise
sesuai mean dan standar deviasi yang berlaku sehingga scriptnya adalah sebagai berikut
data_summary <- group_by(GTL, Glass, Temp) %>%
summarise(mean=mean(Light), sd=sd(Light)) %>%
arrange(desc(mean))
print(data_summary)
Lakukan uji Tukey
Menggunakan fungsi TukeyHSD
sebagai berikut
tukey <- TukeyHSD(anova)
print(tukey)
Gunakan compact letter display untuk menunjukkan perbedaan signifikan antara uji Anova dan uji Tukey
Awalnya yaitu membuat compact letter display sebagai berikut
tukey.cld <- multcompLetters4(anova, tukey)
print(tukey.cld)
Tambahkan compact letter display tersebut ke tabel dengan means(rata-rata) dan sd
cld <- as.data.frame.list(tukey.cld$`Glass:Temp_Factor`)
data_summary$Tukey <- cld$Letters
print(data_summary)