Prediksi Penyakit Diabetes

Nama: Shefiyyah Aurellia Wahyudi

Username dicoding: shefiyyah-aurellia-w

Deskripsi
Dataset Diabetes prediction dataset
Dataset prediksi Diabetes adalah kumpulan data medis dan demografis dari pasien, bersama dengan status diabetes mereka (positif atau negatif). Data ini mencakup fitur-fitur seperti usia, jenis kelamin, indeks massa tubuh (BMI), hipertensi, penyakit jantung, riwayat merokok, kadar HbA1c, dan kadar glukosa darah.
Masalah Penyakit diabetes adalah kondisi di mana kadar gula darah seseorang menjadi terlalu tinggi. Diabetes dapat mengakibatkan komplikasi serius seperti kerusakan organ, masalah jantung, stroke, dan masalah mata. Beberapa gejala diabetes meliputi sering buang air kecil, haus berlebihan, penurunan berat badan tanpa sebab, kelelahan, dan luka yang sulit sembuh. Diabetes dapat dikendalikan melalui pola makan sehat, olahraga teratur, dan penggunaan obat-obatan yang diresepkan oleh dokter.
Tujuan pembuatan prediksi ini untuk mengidentifikasi faktor-faktor yang berkontribusi terhadap risiko diabetes dan membangun model prediksi yang akurat berdasarkan faktor-faktor tersebut. Faktor-faktor ini dapat mencakup variabel seperti Usia, Penyakit Jantung, indeks massa tubuh individu, Hemoglobin A1c, dan Kadar Glukosa Darah
Solusi machine learning Berikut adalah beberapa manfaat yang mungkin diperoleh:
1. Dengan menggunakan model prediksi diabetes, individu yang berisiko tinggi dapat diidentifikasi lebih awal. Ini memungkinkan sistem perawatan kesehatan untuk melakukan tindakan pencegahan yang tepat, seperti memberikan edukasi kesehatan, mempromosikan gaya hidup sehat, dan melakukan skrining lebih lanjut untuk mengkonfirmasi diagnosis. Pencegahan dini dapat membantu mengurangi risiko komplikasi yang terkait dengan diabetes dan meningkatkan kualitas hidup individu.
2. Dengan memprioritaskan mereka yang berisiko tinggi mengembangkan diabetes, sistem perawatan kesehatan dapat mengalokasikan sumber daya dengan lebih efisien. Ini berarti bahwa perawatan yang lebih intensif dan sumber daya yang terbatas dapat difokuskan pada mereka yang membutuhkannya secara lebih mendesak. Hal ini dapat membantu mengoptimalkan penggunaan sumber daya dan meningkatkan efisiensi dalam sistem perawatan kesehatan.

Pada tingkat stakeholder, solusi model prediksi diabetes dapat memberikan manfaat berikut:
1. Pemangku kepentingan dalam sistem perawatan kesehatan, seperti penyedia layanan kesehatan dan asuransi, dapat menggunakan model prediksi untuk mengidentifikasi populasi yang berisiko tinggi dan merancang program pencegahan atau manajemen yang sesuai. Hal ini dapat membantu mereka dalam perencanaan strategis, pengelolaan risiko, dan pengambilan keputusan yang lebih baik.
2. Peneliti dan ilmuwan kesehatan dapat menggunakan model prediksi untuk mempelajari faktor-faktor risiko diabetes dan mengidentifikasi pola dan tren yang mungkin tidak terlihat sebelumnya. Ini dapat membantu dalam pemahaman lebih lanjut tentang penyakit dan pengembangan intervensi yang lebih efektif.
Metode pengolahan Data yang digunakan pada proyek ini terdapat dua tipe data, yaitu data kategorikal dan numerik. Pada data Diabetes prediction dataset menggunakan 7 feature, yaitu kategorik teridiri dari gender dan smoking_history dan numerik terdiri dari age, heart_disease, bmi, HbA1c_level, blood_glucose_level dan label key diabetes. Metode yang digunakan untuk mengelolah data tersebut yaitu mentransformasikan data kategorikal menjadi bentuk one-hot encoding.
Arsitektur model Pada arsitektur ini, terdapat tiga lapisan Dense dengan masing-masing memiliki 256, 64, dan 16 neuron. Aktivasi yang digunakan pada setiap lapisan adalah ReLU. Aktivasi yang digunakan adalah sigmoid, yang menghasilkan probabilitas prediksi diabetes. Nilai output yang mendekati 1 menunjukkan probabilitas tinggi untuk diabetes, sedangkan nilai yang mendekati 0 menunjukkan probabilitas rendah. Setelah definisi arsitektur model, model dikompilasi menggunakan optimizer Adam dengan learning rate 0.001. Loss function yang digunakan adalah binary crossentropy, yang cocok untuk tugas klasifikasi biner seperti prediksi diabetes. Metrik yang digunakan untuk evaluasi model adalah binary accuracy.
Metrik evaluasi Metrik yang digunakan pada model yaitu AUC, Precision, Recall, BinaryAccuracy, ExampleCount untuk mengevaluasi performa model sebuah klasifikasi dengan threshold lower bound = 0.5 ddan change threshold absolute = 0.0001
Performa model Model yang dibuat menghasilkan performa yang cukup baik dalam memberikan sebuah prediksi dan dari pelatihan yang dilakukan menghasilkan binary_accuracy sebesar 97.15%, val_binary_acuracy sebesar 97.18%, dan loss sebesar 0.08. Hasil seperti ini sudah cukup baik untuk memprediksi klasifikasi
Opsi deployment Proyek machine learning ini dideploy menggunakan salah satu platfrom as a service yaitu railway yang menyediakan layanan gratis untuk mendeploy sebuah proyek.
Web app diabetes-model
Monitoring Monitoring pada sistem ini dilakukan menggunakan prometheus. Pada sistem ini hanya menampilkan yaitu apabila proses request berhasil ditandakan dengan ok