Disediakan 1 buah dataset (file Excel) hasil sensus BPS (Badan Pusat Statistik) tentang jumlah penduduk Indonesia berdasarkan provinsi pada tahun 1971, 1980, 1990, 1995, 2000 & 2010. Unduh dataset via BPS: unduh di sini. Dilarang keras untuk menyunting/mengubah konten dataset! Kemudian dengan memanfaatkan dataset tersebut, selesaikanlah soal-soal berikut:
-
Buatlah sebuah file python (soal1_1.py) yang dapat menampilkan grafik: (1) jumlah penduduk Indonesia, (2) jumlah penduduk dari provinsi yang memiliki penduduk terbanyak di tahun 2010, dan (3) jumlah penduduk dari provinsi yang memiliki penduduk paling sedikit di tahun 1971!
Provinsi dengan jumlah penduduk terbanyak di tahun 2010 adalah Jawa Barat, dan provinsi dengan jumlah penduduk paling sedikit di tahun 1971 adalah Bengkulu. Namun Anda dilarang untuk menuliskan kata "Jawa Barat", "Bengkulu" dan "Indonesia" di dalam script python Anda. Hasil yang diharapkan kurang lebih ditunjukkan oleh grafik berikut:
-
Buatlah sebuah file python (soal1_2.py) yang dapat melakukan regresi linear terhadap hasil di soal sebelumnya, untuk memprediksi jumlah penduduk di masa mendatang. (1) Gambarkan best fit line (garis terbaik) hasil regresi pada grafik, dan (2) prediksikan berapa jumlah penduduk Indonesia, Jawa Barat & Bengkulu pada tahun 2050!
Anda dilarang untuk menuliskan kata "Jawa Barat", "Bengkulu" dan "Indonesia" di dalam script python Anda. Hasil yang diharapkan kurang lebih ditunjukkan oleh gambar berikut:
Dan di terminal akan muncul hasil prediksi:
Prediksi jumlah penduduk Jawa Barat di tahun 2050: 65443585 Prediksi jumlah penduduk Bengkulu di tahun 2050: 3139135 Prediksi jumlah penduduk INDONESIA di tahun 2050: 359273669
Catatan: Commit & push source code jawaban soal ini (beserta screenshot grafik) ke Github Anda, buatlah repo dengan nama Ujian_Penduduk_Indonesia. Kemudian lampirkan url link repo Github Anda via email ke lintang@purwadhika.com!
Anda adalah seorang manager klub sepakbola ternama, yang ingin merekrut pemain sepakbola muda berbakat. Pemain yang anda targetkan memiliki kriteria sebagai berikut:
- usia (Age) <= 25 tahun,
- skill umum (Overall) >= 80 point, dan
- potensi (Potential) >= 80.
Tersedia 1 buah dataset (file csv) yang memuat daftar lengkap pemain sepakbola profesional kelas dunia. Unduh dataset via kaggle: unduh di sini. Dilarang keras untuk menyunting/mengubah konten dataset! Kemudian dengan memanfaatkan dataset tersebut, selesaikanlah soal-soal berikut:
-
Buatlah sebuah file python (soal2_1.py) yang dapat menampilkan 2 buah grafik dalam 1 figure: (1) grafik kaitan antara usia (Age) vs skill umum (Overall) dan (2) grafik kaitan antara usia (Age) vs potensi (Potential). Hasil yang diharapkan kurang lebih ditunjukkan oleh gambar di bawah. Titik hijau adalah daftar pemain target yang ingin Anda rekrut.
-
Buatlah sebuah file python (soal2_2.py) yang berisi algoritma machine learning yang dapat melakukan pengelompokkan pemain: target & non-target. Gunakan minimal 3 algoritma, lalu bandingkan dengan metode k-fold cross validation & tentukan mana algoritma yang memiliki akurasi terbaik.
-
Buatlah sebuah file python (soal2_3.py) yang menggunakan algoritma terbaik di soal sebelumnya, untuk memprediksi/mengelompokkan data pemain berikut apakah tergolong pemain target yang ingin kita rekrut atau tidak:
Name Age Overall Potential Andik Vermansyah 27 87 90 Awan Setho Raharjo 22 75 83 Bambang Pamungkas 38 85 75 Cristian Gonzales 43 90 85 Egy Maulana Vikri 18 88 90 Evan Dimas 24 85 87 Febri Hariyadi 23 77 80 Hansamu Yama Pranata 24 82 85 Septian David Maulana 22 83 80 Stefano Lilipaly 29 88 86
Catatan: Commit & push source code jawaban soal ini (beserta screenshot grafik) ke Github Anda, buatlah repo dengan nama Ujian_Pemain_Muda_Berbakat. Kemudian lampirkan url link repo Github Anda via email ke lintang@purwadhika.com!
Lintang Wisesa 💌 lintangwisesa@ymail.com
Facebook | Twitter | Google+ | Youtube | :octocat: GitHub | Hackster