Frateli met en contact des lycées de milieux modestes avec des parrains pour les guider tout au long de leurs études. Notre but est de voir ce qui fait qu'un parrainage va marcher ou pas.
En raison du caractère confidentiel des données, celles-ci ne sont pas présentes dans ce repositery.
Nous avons opté pour le choix de la métrique AUC en raison du jeux de données déséquilibré ainsi que pour fournir une probabilité de réussite d'un parrainage à l'équipe de Frateli.
On peux interprèter cette valeur comme la probabilité de classer un exemple positif (un parrainage réussi) choisi au harsard comme réellement positif. Cette mesure va de 0 à 1 (1 étant un classificateur parfait).
Résultat du modèle sur une cross-validation à 5 fold est de 0.729 AUC +/- 0.046 (screen-shot)
On est arrivé à plus de 0.75 AUC en combinant plusieurs modèles et features, mais celà mène à une complexité non négligeable par la suite.