file code ini digunakan untuk mendownload dataset
file tersebut masih berbentuk xlsx perlu diubah ke file csv
pada satu file xlsx tadi terdapat dua dataset pada dua sheet sehingga kedunya perlu digabungkan menjadi satu file csv
sampling dilakukan sebanyak 30%