/desafio-4-2020

Primary LanguageJupyter Notebook

Platform

Desafio 04 | CompuSoluciones

Para Ayudarte

1. Acerca de CompuSoluciones

CompuSolucioneses una empresa mexicana que en sus 35 años de historia ha logrado convertirse en elm ayorista de valor líder en el mercado mexicano,consolidando un ecosistema tecnológico sólido que atiende a las principales empresas en los mercados más importantes, en alianzas de empresas complementarias como nuestros proveedores y clientes y basados en la vivencia de valores

Uno de los procesos críticos de la compañía es el análisis y otorgamiento de líneas de crédito a sus distribuidores, para mejorar los plazos de recuperación de cartera y disminuir el riesgo de fraude.

video

2. Reto de negocio

El objetivo de este desafío es crear un modelo predictivo con la tecnología de IBM, el modelo resultante debe ayudar al análisis y predicción de posibles fraudes o aumento de cartera vencida, calificando en semáforos los riesgos de las principales razones financieras de los socios de negocio que solicitan un crédito, haciendo cruces de información con el comportamiento de pago de dichos distribuidores con otros proveedores, implementadores y socios de negocio.

Esto ayudará a CompuSoluciones a mejorar la eficiencia en su proceso actual de otorgamiento de crédito y financiamiento.

3. Objetivo

CompuSoluciones tiene una enorme cantidad de registro financieros de sus asociados y con la ayuda de herramientas de ciencia de datos es posible crear un modelo de Machine Learning que ayude a clasificar el comportamiento crediticio

En este desafío, CompuSoluciones usará herramientas de IBM como Watson Studio (o Cloud Pack for Data) y Watson Machine Learning para construir un modelo de Machine Learning natural capaz de predecir la probabilidad de cumplimiento de pago.

La idea esencial del Desafío 4 es crear un modelo basado en machine learning capaz de identificar el comportamiento financiero del asociado de negocio, permitiendo una probabilidad de cumplimiento o incumplimiento del crédito.

4. Desarrollando la solución

En este desafío vamos a usar las siguientes herramientas

Watson Studio proporciona un conjunto de herramientas y un entorno colaborativo para científicos de datos, desarrolladores y expertos en dominios. Es un ambiente de desarrollo (IDE) web que combina herramientas Open Source con tecnología de IBM para desarrollar modelos de Machine Learning y Deep Learning.

Watson Machine Learning es un servicio completo de IBM Cloud que facilita a los desarrolladores y científicos de datos trabajar para integrar capacidades predictivas con sus aplicaciones. El servicio Machine Learning es un conjunto de API REST que puede llamar desde cualquier lenguaje de programación para desarrollar aplicaciones que tomen decisiones más inteligentes, resuelvan problemas difíciles y mejoren los resultados del usuario.

Mira el tutorial a continuación para aprender como aplicar la tecnología de IBM para resolver el desafío

video

4.1. Pre-requisitos

Para poder realizar este desafío, se deben cumplir con los siguientes requisitos previos:

  • Estar registradro en la Maratón Behind the Code y confirmar el e-mail de registro.
  • Tener una cuenta en IBM Cloud, que puede ser una cuenta GRATUITA o de pago (no es necesario registrarse en el evento con el mismo correo electrónico utilizado para crear su cuenta IBM Cloud).

4.2. Resumen de las tareas

  1. Cree el servicio Watson Studio (Cloud Pak for Data as a Service) en IBM Cloud. (Si ya lo creo en el desafío 2 no es necesario volverlo a crear)
  2. Cree el servicio Watson Machine Learning. (Si ya lo creo en el desafío 2 no es necesario volverlo a crear)
  3. Cree el servicio Cloud Object Storage (Si ya lo creo en el desafío 2 no es necesario volverlo a crear)
  4. Crear un nuevo proyecto vacío en Watson Studio.
  5. Importar el notebook usando el archivo compusoluciones.ipynb
  6. Leer y ejecutar las instrucciones contenidas en el Notebook compusoluciones.ipynb.
  7. Guarde las credenciales del servicio Watson Machine Learning (WML)
  8. Guarde la URL o Endpoint de su modelo entrenado (Ver Notebook)
  9. Envíe su solicitud a https://compusoluciones.maratona.dev/

4.3. Desarrollo

La idea esencial del Desafío 4 es crear un modelo basado en machine learning capaz de identificar el comportamiento financiero del asociado de negocio, permitiendo una probabilidad de cumplimiento o incumplimiento del crédito. El participante trabajará con un conjunto de datos sintéticos proporcionados y creará una "pipeline", es decir, una cadena de pasos de pre-procesamiento y un modelo de clasificación.

En este rencuentra el notebook necesario para crear proyecto completo en Watson Studio ya con una solución básica lista, totalmente funcional. Puede (y se recomienda) mejorar el modelo para obtener una mayor puntuación :)

5. Envío

Para hacer la entrega, debes acceder a la siguiente página: https://compusoluciones.maratona.dev/ y llenar el formulario con las credenciales de su instancia de Watson Machine Learning y la URL del modelo para la calificación.

🚨 PRUEBE SU SOLUCIÓN ANTES DE PRESENTARLA 🚨

Después de ingresar sus credenciales haga clic en el botón en la esquina inferior derecha para ENVIAR su solución, como se muestra en la imagen a continuación, y complete el formulario con su dirección de correo electrónico utilizada para la inscripción en MARATÓN 2020.

Credenciales: submissão Enviar: submissão

6. Sobre la evaluación

En esencia, el reto puntuará la calidad de su modelo, sin embargo debe estar alojado en Watson Machine Learning, y no sólo contenido en forma de código del notebooks proporcionado. En esta ocación se hara una prueba basada en el F1 Score, que mide tanto la presición como el recall. No se desea clasificar como incumplimiento aquellos prestamos que en verdad serian buenos, por lo que el dataset de pruebas estará balanceado. Como se explica en el vídeo tutorial, el problema que debe resolver el modelo de machine learning es un problema clásico de clasificación binaria, y se encuentran más detalles en el notebook jupyter proporcionado.

La rapidez de entrega no se incluye en el cálculo de la puntuación del desafío. Sin embargo, para todos los participantes que presenten este desafío en la primera semana después del lanzamiento, recibirán una bonificación en la puntuación final.

Recuerde que tiene 3 oportunidades de envío de la solución del reto donde se le tomará en cuenta el envío que obtenga mejor puntuación.

Material de apoyo

Solución de problemas

Mira el video explicativo provisto en la Sección 4, o si lo deseas, revisa la documentación de los servicios involucrados en este desafío.

Accede al discord oficial de la Maratón 2020 para hacer preguntas y/o interactuar con otros participantes: Discord.

Licencia

Copyright 2020 Maratona Behind the Code

Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License. You may obtain a copy of the License at

   http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the specific language governing permissions and limitations under the License.