Feature Engineering (Kaggle)

En este curso se profundiza sobre uno de los pasos más importantes en el camino hacia la construcción de un gran modelo de aprendizaje automático: la ingeniería de características o feature engineering. Se mostrará como:

Determinar qué características son las más importantes con Mutual information
Inventar nuevas características utilizando conocimentos del mundo real (Feature creation)
Crear características de segmentación con K-Means clustering
Descomponer la variación de un conjunto de datos en características con Principal Component Analysis
Codificar categorías de alta cardinalidad con Target Encoding

El objetivo de la ingeniería de características o feature engineering es simplemente hacer que los datos se adapten mejor al problema en cuestión.

Consideremos algunas métricas de temperatura aparente, como lo son el índice de calor o la sensación térmica. Estas cantidades intentan medir la temperatura percibida por los seres humanos basándose en la temperatura del aire, la humedad y la velocidad del viento, cosas que podemos medir directamente. Se puede considerar que la temperatura aparente es el resultado de una especie de feature engineering, un intento de hacer que los datos observados sean más relevantes para lo que realmente nos importa: como se siente la temperatura realmente.

Se puede utilizar feature engineering para:

Mejorar el rendimiento predictivo de un modelo
Reducir el costo computacional
Mejorar la interpretabilidad de los resultados.

nahue-passano/feature_engineering_kaggle

Feature Engineering (Kaggle)