/Ujian_AnalyticsVisualization_JCDS07

Panduan Soal Ujian Data Analytics & Visualization Job Connector Data Science batch 7

Soal Ujian Data Science - Analytics & Visualization

Lintang_Purwadhika

Soal 1 - πŸ’ƒ Panggung Sandiwara

MySQL secara default menyertakan database sakila yang dapat digunakan oleh user untuk mempelajari teknik penggunaan database di MySQL. Database sakila merupakan sample dummy database yang menyimpan informasi seputar toko rental DVD.

Soal : Aktifkan server MySQL Anda, lalu gunakan database sakila dan tuliskan langkah-langkah/query MySQL untuk menyelesaikan perintah berikut. Anda dilarang membuat database baru, merubah struktur table, membuat view atau segala bentuk tindakan yang mengubah struktur database.

  1. Tampilkan daftar 10 film komedi dengan durasi tersingkat. Urutkan data berdasarkan film dengan durasi terpendek. Kolom yang diwajibkan tampil adalah title, category dan length. Output yang diharapkan:

    +------------------+----------+--------+
    | title            | category | length |
    +------------------+----------+--------+
    | DOWNHILL ENOUGH  | Comedy   |     47 |
    | HEAVEN FREEDOM   | Comedy   |     48 |
    | PARADISE SABRINA | Comedy   |     48 |
    | HURRICANE AFFAIR | Comedy   |     49 |
    | LION UNCUT       | Comedy   |     50 |
    | ZORRO ARK        | Comedy   |     50 |
    | CLOSER BANG      | Comedy   |     58 |
    | AIRPLANE SIERRA  | Comedy   |     62 |
    | LONELY ELEPHANT  | Comedy   |     67 |
    | DOOM DANCING     | Comedy   |     68 |
    +------------------+----------+--------+
  2. Tampilkan daftar lengkap kategori film beserta jumlah film tiap kategori & rata-rata harga sewa DVD film tiap kategori. Urutkan data dari kategori dengan jumlah film terbanyak. Kolom yang diwajibkan ada minimal adalah kategori, jumlah film dan rata-rata harga sewa. Output yang diharapkan:

    +-------------+-------------+---------------+
    | kategori    | jumlahMovie | rataHargaSewa |
    +-------------+-------------+---------------+
    | Foreign     |          73 |      3.099589 |
    | Sports      |          73 |      3.099589 |
    | Family      |          69 |      2.758116 |
    | Documentary |          68 |      2.666471 |
    | Animation   |          66 |      2.808182 |
    | Action      |          64 |      2.646250 |
    | New         |          63 |      3.116984 |
    | Drama       |          61 |      2.990000 |
    | Games       |          61 |      3.252295 |
    | Sci-Fi      |          61 |      3.219508 |
    | Children    |          60 |      2.890000 |
    | Comedy      |          58 |      3.162414 |
    | Classics    |          57 |      2.744386 |
    | Horror      |          56 |      3.025714 |
    | Travel      |          56 |      3.275714 |
    | Music       |          51 |      2.950784 |
    +-------------+-------------+---------------+
  3. Motion Picture Association of America memiliki sistem rating untuk film berdasarkan konten & target penontonnya dengan klasifikasi sebagai berikut:

    • G : General Audiences
    • PG : Parental Guidance Suggested
    • PG-13 : Parental Guidances for Children Under 13
    • R : Restricted
    • NC-17 : No Children Under 17 Admitted

    Tampilkan daftar lengkap rating film beserta keterangan arti rating & jumlah film tiap rating. Kolom yang diwajibkan ada minimal adalah rating, keterangan rating dan jumlah film. Output yang diharapkan:

    +--------+---------------------------------+--------------+
    | rating | keterangan                      | jumlahMovie  |
    +--------+---------------------------------+--------------+
    | G      | General Audiences               |          178 |
    | PG     | Parental Guidance Suggested     |          194 |
    | PG-13  | Parental Guidances for Under 13 |          223 |
    | R      | Restricted                      |          195 |
    | NC-17  | No Children Under 17 Admitted   |          210 |
    +--------+---------------------------------+--------------+
  4. Tampilkan daftar 10 aktor/aktris yang paling banyak membintangi film. Kolom yang ditampilkan minimal: id aktor, nama depan, nama belakang dan jumlah film yang dibintangi kemudian urutkan dari aktor/aktris yang membintangi film terbanyak. Output yang diharapkan:

    +----------+------------+-------------+--------------+
    | actor_id | first_name | last_name   | jumlah_Movie |
    +----------+------------+-------------+--------------+
    |      107 | GINA       | DEGENERES   |           42 |
    |      102 | WALTER     | TORN        |           41 |
    |      198 | MARY       | KEITEL      |           40 |
    |      181 | MATTHEW    | CARREY      |           39 |
    |       23 | SANDRA     | KILMER      |           37 |
    |       81 | SCARLETT   | DAMON       |           36 |
    |      158 | VIVIEN     | BASINGER    |           35 |
    |      144 | ANGELA     | WITHERSPOON |           35 |
    |      106 | GROUCHO    | DUNST       |           35 |
    |       60 | HENRY      | BERRY       |           35 |
    +----------+------------+-------------+--------------+
  5. Dari soal sebelumnya diketahui Gina Degeneres merupakan aktris yang paling banyak membintangi film, dengan total 42 judul film. Kategori film apakah yang paling banyak dibintanginya? Untuk mengetahuinya, tampilkan daftar kategori film beserta jumlah film yang pernah dibintangi oleh Gina Degeneres. Kolom yang diwajibkan ada yaitu kategori film dan jumlah film yang dibintangi. Output yang diharapkan:

    +-------------+--------------+
    | category    | jumlah_Movie |
    +-------------+--------------+
    | Documentary |            3 |
    | Foreign     |            2 |
    | Music       |            4 |
    | New         |            1 |
    | Sci-Fi      |            7 |
    | Action      |            3 |
    | Drama       |            2 |
    | Animation   |            4 |
    | Horror      |            1 |
    | Family      |            4 |
    | Comedy      |            3 |
    | Children    |            2 |
    | Classics    |            2 |
    | Sports      |            2 |
    | Games       |            1 |
    | Travel      |            1 |
    +-------------+--------------+
  6. Dari soal sebelumnya diketahui Gina Degeneres paling banyak membintangi film bergenre science-fiction, dengan total 7 judul film. Tampilkan daftar judul film sci-fi yang pernah dibintangi oleh Gina Degeneres. Kolom yang diwajibkan ada yaitu judul film dan kategorinya. Output yang diharapkan:

    +---------------------+----------+
    | title               | category |
    +---------------------+----------+
    | CHARIOTS CONSPIRACY | Sci-Fi   |
    | COLDBLOODED DARLING | Sci-Fi   |
    | FRISCO FORREST      | Sci-Fi   |
    | GOODFELLAS SALUTE   | Sci-Fi   |
    | LICENSE WEEKEND     | Sci-Fi   |
    | OPEN AFRICAN        | Sci-Fi   |
    | SPIRITED CASUALTIES | Sci-Fi   |
    +---------------------+----------+
  7. Tampilkan daftar 10 aktor/aktris yang paling banyak membintangi film horror. Kolom yang ditampilkan minimal: id aktor, nama depan, nama belakang dan jumlah film horror yang dibintangi kemudian urutkan dari aktor/aktris yang membintangi film horror terbanyak. Output yang diharapkan:

    +----------+------------+-----------+--------------+
    | actor_id | first_name | last_name | jumlah_Movie |
    +----------+------------+-----------+--------------+
    |       27 | JULIA      | MCQUEEN   |            7 |
    |       42 | TOM        | MIRANDA   |            6 |
    |       60 | HENRY      | BERRY     |            5 |
    |       14 | VIVIEN     | BERGEN    |            5 |
    |       94 | KENNETH    | TORN      |            4 |
    |       75 | BURT       | POSEY     |            4 |
    |       54 | PENELOPE   | PINKETT   |            4 |
    |      102 | WALTER     | TORN      |            4 |
    |       12 | KARL       | BERRY     |            4 |
    |       40 | JOHNNY     | CAGE      |            4 |
    +----------+------------+-----------+--------------+
  8. Dari soal sebelumnya diketahui Julia McQueen merupakan aktris yang paling banyak membintangi film horror, dengan total 7 judul film. Tampilkan daftar judul film horror yang pernah dibintangi oleh Julia McQueen. Kolom yang diwajibkan ada yaitu judul film dan kategorinya. Output yang diharapkan:

    +--------------------+----------+
    | title              | category |
    +--------------------+----------+
    | ARABIA DOGMA       | Horror   |
    | FREDDY STORM       | Horror   |
    | HIGH ENCINO        | Horror   |
    | MONTEREY LABYRINTH | Horror   |
    | SPIRIT FLINTSTONES | Horror   |
    | STRANGERS GRAFFITI | Horror   |
    | TRAIN BUNCH        | Horror   |
    +--------------------+----------+

    βœ… Lampirkan jawaban berupa daftar query MySQL dalam bentuk file .txt (atau format text file lainnya) dan kirimkan via email ke lintang@purwadhika.com!

Soal 2 - πŸ‘¨β€πŸŽ“ Kerja Kerja Kerja

Disediakan sebuah dataset yang berisi daftar profesi beberapa responder, unduh: profesi.csv. Buatlah sebuah file python (.py) atau notebook (.ipynb) yang dapat menyelesaikan perintah berikut.

  1. Ada berapa jenis profesi yang ada dalam dataset tersebut? Sebutkan!

    Output yang diharapkan:

    21
    
    ['technician', 'other', 'writer', 'executive', 'administrator', 'student', 'lawyer', 'educator', 'scientist', 'entertainment', 'programmer', 'librarian', 'homemaker', 'artist', 'engineer', 'marketing', 'none', 'healthcare', 'retired', 'salesman', 'doctor']
  2. Buatlah sebuah dataframe yang menunjukkan data usia maksimal, minimal & rata-ratanya, kemudian dikelompokkan berdasarkan profesi & gender!

    Output yang diharapkan:

  3. Buatlah sebuah dataframe yang menunjukkan persentase pria & wanita tiap profesi!

    Output yang diharapkan:

βœ… Commit & push source code jawaban soal ini ke Github Anda, buatlah repo dengan nama Daftar_Profesi, kemudian lampirkan url link repo Github Anda via email ke lintang@purwadhika.com!

Soal 3 - πŸ‹β€β™‚ SEA Games 2019

seagames

Indonesia mengakhiri SEA Games 2019 di posisi ke-empat. Total, atlet-atlet Tanah Air sukses mengumpulkan 267 medali, dengan rincian 72 emas, 84 perak, dan 111 perunggu selama perhelatan ajang multi-event olahraga se-Asia Tenggara tersebut, sejak 30 November-11 Desember 2019. Panitia SEA Games Filipina 2019 mempublikasikan daftar peserta & perolehan medali di situs resmi: www2.2019seagames.com.

Gunakanlah teknik web scraping pada situs di atas untuk mendapatkan data lengkap perolehan medali SEA Games 2017 & 2019. Kemudian buatlah sebuah file python (.py) atau notebook (.ipynb) yang dapat memvisualisasikan data total raihan medali emas beserta persentase raihan medali emas tiap Negara pada SEA Games 2017 & 2019. Contoh output yang diharapkan:

  • Total raihan medali emas SEA Games 2017 & 2019. Berikan marker khusus pada Negara dengan raihan medali emas terbanyak.

  • Persentase raihan medali emas SEA Games 2017 & 2019. Tampilkan nilai persentase pada diagram lingkaran.

βœ… Commit & push source code jawaban soal ini ke Github Anda, buatlah repo dengan nama SEA_Games, kemudian lampirkan url link repo Github Anda via email ke lintang@purwadhika.com!

#HappyCoding ☺️

Lintang Wisesa πŸ’Œ lintangwisesa@ymail.com

Facebook | Twitter | Google+ | Youtube | :octocat: GitHub | Hackster