Considere el siguiente dataset marketing_campaign.csv, dicho dataset corresponde a detalles de comportamiento de una muestra de consumidores para una compañía latinoamericana con sede en Santiago de Chile, el dataset cuenta con las siguientes columnas que significan lo siguiente:
• ID: identificador único del cliente
• Year_Birth: año de nacimiento del cliente
• Educación: nivel de educación del cliente
• Marital_Status: estado civil del cliente
• Ingresos: ingresos familiares anuales del cliente
• Kidhome: número de niños en el hogar del cliente
• Hogar para adolescentes: número de adolescentes en el hogar del cliente
• Dt_Customer: fecha de inscripción del cliente en la empresa
• Recency: número de días desde la última compra del cliente.
• Queja: 1 si el cliente se quejó en los últimos 2 años, 0 en caso contrario
• País: ubicación del cliente
• MntWines: cantidad gastada en vino en los últimos 2 años
• MntFruits: Monto gastado en frutas en los últimos 2 años
• MntMeatProducts: Cantidad gastada en carne en los últimos 2 años
• MntFishProducts: Cantidad gastada en pescado en los últimos 2 años
• MntSweetProducts: Cantidad gastada en dulces en los últimos 2 años
• MntGoldProds: cantidad gastada en oro en los últimos 2 años
• NumWebPurchases: número de compras realizadas a través del sitio web de la empresa
• NumCatalogPurchases: número de compras realizadas mediante un catálogo
• NumStorePurchases: número de compras realizadas directamente en las tiendas
• NumWebVisitsMonth: número de visitas al sitio web de la empresa en el último mes
• NumDealsPurchases: Número de compras realizadas con descuento
• AcceptedCmp3: 1 si el cliente aceptó la oferta en la tercera campaña, 0 en caso contrario
• AcceptedCmp4: 1 si el cliente aceptó la oferta en la cuarta campaña, 0 en caso contrario
• AcceptedCmp5: 1 si el cliente aceptó la oferta en la quinta campaña, 0 en caso contrario
• AcceptedCmp1: 1 si el cliente aceptó la oferta en la primera campaña, 0 en caso contrario
• AcceptedCmp2: 1 si el cliente aceptó la oferta en la segunda campaña, 0 en caso contrario
• Respuesta: 1 si el cliente aceptó la oferta en la última campaña, 0 en caso contrario
a) Limpiar los datos, elimine observaciones con NA
b) Analizar libremente la data y señalar patrones de consumidores.
c) Utilizar al menos dos técnicas de clústeres y agrupar a los clientes.
d) Realizar un análisis de componentes principales, muestrar los loadings y explicar para las 3 primeras componentes, señalando también la proporción de varianza explicada por las componentes. Se propone dar una explicación como base de las 3 primeras componentes, grafiquar los clientes en el dos dimensiones.