Marketing-and-Consumer-Sales

Considere el siguiente dataset marketing_campaign.csv, dicho dataset corresponde a detalles de comportamiento de una muestra de consumidores para una compañía latinoamericana con sede en Santiago de Chile, el dataset cuenta con las siguientes columnas que significan lo siguiente:

Gente

• ID: identificador único del cliente

• Year_Birth: año de nacimiento del cliente

• Educación: nivel de educación del cliente

• Marital_Status: estado civil del cliente

• Ingresos: ingresos familiares anuales del cliente

• Kidhome: número de niños en el hogar del cliente

• Hogar para adolescentes: número de adolescentes en el hogar del cliente

• Dt_Customer: fecha de inscripción del cliente en la empresa

• Recency: número de días desde la última compra del cliente.

• Queja: 1 si el cliente se quejó en los últimos 2 años, 0 en caso contrario

• País: ubicación del cliente

Productos

• MntWines: cantidad gastada en vino en los últimos 2 años

• MntFruits: Monto gastado en frutas en los últimos 2 años

• MntMeatProducts: Cantidad gastada en carne en los últimos 2 años

• MntFishProducts: Cantidad gastada en pescado en los últimos 2 años

• MntSweetProducts: Cantidad gastada en dulces en los últimos 2 años

• MntGoldProds: cantidad gastada en oro en los últimos 2 años

Lugar

• NumWebPurchases: número de compras realizadas a través del sitio web de la empresa

• NumCatalogPurchases: número de compras realizadas mediante un catálogo

• NumStorePurchases: número de compras realizadas directamente en las tiendas

• NumWebVisitsMonth: número de visitas al sitio web de la empresa en el último mes

Promoción

• NumDealsPurchases: Número de compras realizadas con descuento

• AcceptedCmp3: 1 si el cliente aceptó la oferta en la tercera campaña, 0 en caso contrario

• AcceptedCmp4: 1 si el cliente aceptó la oferta en la cuarta campaña, 0 en caso contrario

• AcceptedCmp5: 1 si el cliente aceptó la oferta en la quinta campaña, 0 en caso contrario

• AcceptedCmp1: 1 si el cliente aceptó la oferta en la primera campaña, 0 en caso contrario

• AcceptedCmp2: 1 si el cliente aceptó la oferta en la segunda campaña, 0 en caso contrario

• Respuesta: 1 si el cliente aceptó la oferta en la última campaña, 0 en caso contrario

Propuesta

a) Limpiar los datos, elimine observaciones con NA

b) Analizar libremente la data y señalar patrones de consumidores.

c) Utilizar al menos dos técnicas de clústeres y agrupar a los clientes.

d) Realizar un análisis de componentes principales, muestrar los loadings y explicar para las 3 primeras componentes, señalando también la proporción de varianza explicada por las componentes. Se propone dar una explicación como base de las 3 primeras componentes, grafiquar los clientes en el dos dimensiones.