Loans
L'objectif est de déterminer le taux de personnes susceptibles de rembourser le prêt. Pour se faire nous avons utilisé les données fournies par https://www.kaggle.com/datasets/itssuru/loan-data/data.
Tout d'abord il est important de notifier qu'on ne peut pas se fier totalement à notre jeux de donnée car on ne sait pas comment, par qui et avec quelle attention elles ont été collectées.
Même si notre modèle est correctement entrainé et remonte une performance de prédiction de 99%, l'inconnue sur la récupération des données ne nous permet pas d'utiliser notre modèle pour des prédictions réelles car les données d'entrainements peuvent être fausses.
Une donnée sur le % de prêt précédement remboursé par un emprunteur aurait été une donnée très utile pour entrainer notre modèle. Cependant cette donnée ne figure pas dans le jeux de donnée.
Colonnes:
-
not.fully.paid (OBJECTIF, bool): Indique si le prêt a été remboursé ou non.
-
credit.policy (
Inutilisé, bool): Indique si le client répond aux critères de souscription de crédit -
Purpose (
Inutilisé, string): Raison de l’emprunt, inutilisé car textuel. -
Int.rate (
Inutilisé, number(]0;1[)): Taux d’intérêt du prêt en question. Inutilisé car la somme est déjà présente -
Installment (number) : La somme à payer par mois
-
log.annual.in (number) : Le logarithme naturel du revenu annuel auto-déclaré de l'emprunteur. ????
-
Dti (number) : Le ratio dette/revenu de l'emprunteur
-
Fico : Le score FICO varie généralement de 300 à 850, avec des plages de catégories de crédit définies comme suit :
- 300-579 : Mauvais crédit (Cat. 0)
- 580-669 : Crédit équitable (Cat. 1)
- 670-739 : Bon crédit (Cat. 2)
- 740-799 : Très bon crédit (Cat. 3)
- 800-850 : Excellent crédit (Cat. 4)
-
days.with.cr.line (
Inutilisé, number) : Nombre de jours depuis lesquels l'emprunteur dispose d’un crédit. Inutilisé car nous considérons que toutes les échéances sont terminées. -
revol.bal : Solde renouvellable de l'emprunteur, aka le montant impayé à la fin du cycle de facturation de la carte de crédit
-
revol.util : Le taux d'utilisation de la ligne de crédit renouvelable de l'emprunteur AKA le montant de la ligne de crédit utilisée par rapport au total du crédit disponible.
-
inq.last.6mths : Nombre de demandes de renseignements/plaintes de la part des créanciers de l'emprunteur au cours des six derniers mois.
-
delinq.2yrs : Le nombre de fois où l'emprunteur a été en retard de paiement de plus de 30 jours au cours des deux dernières années.
-
pub.rec : Le nombre de dossiers publics dérogatoires de l'emprunteur (dépôts de bilan, privilèges fiscaux ou jugements).