/ecomm_cohort_rfm_project

Анализ совершенных покупок e-commerce

Primary LanguageJupyter Notebook

Анализ совершенных покупок e-commerce

Цель проекта: сформулировать рекомендации маркетплейсу на основе анализа данных.


Задачи проекта: проанализировать совершенные покупки и ответить на следующие вопросы:

  1. Сколько было пользователей, которые совершили покупку только один раз?
  2. Сколько заказов в месяц в среднем не доставляется по разным причинам? Вывести детализацию по причинам.
  3. По каждому товару определить в какой день недели товар чаще всего покупается.
  4. Сколько у каждого из пользователей в среднем покупок в неделю (по месяцам)?
  5. Выполнить когортный анализ пользователей. В период с января по декабрь выявить когорту с самым высоким retention на третий месяц.
  6. Построить RFM-сегментацию пользователей для качественной оценки аудитории.

Шаги:

  1. Использовала API для загрузки датасетов.
  2. Провела EDA и предобработку данных.
  3. Проанализировала поведение пользователей и работу доставки заказанных товаров.
  4. Провела когортный анализ пользователей.
  5. Построила RFM-сегментацию пользователей.

Результаты: Результаты когортного анализа Когортный анализ показал, что когорты 2017-05 и 2017-09 имеют наивысший retention на 3й месяц.

Результаты RFM-сегментации RFM-сегментация выявила, что основная масса клиентов маркетплейса относится к сегменту спящих клиентов. Новички составляют 24%, а уходящие клиенты - 18%. Постоянных клиентов в лице "ядра" и "лояльных" у маркетплейса практически нет (менее 1%). Потеряно 6% клиентов.

Сформулировала следующие рекомендации:

  1. Выяснить у спящих клиентов почему они потеряли интерес и разработать акционные предложения с учетом их ответов.
  2. Необходимо простимулировать новичков на повторную покупку, нужно обязательно проинформировать их о выгодах маркетплейса (программы лояльности, скидки от партнеров, подарки к праздникам, розыгрыши призов и т.п.), которые помогут заинтересовать их сделать вторую, третью покупку и стать в перспективе лояльными клиентами.
  3. Напомнить о маркетплейсе уходящим клиентам. Выяснить почему они реже стали совершать покупки и разработать акционные предложения с учетом их ответов.
  4. Пересмотреть акционные предложения для "китов", лояльных клиентов и "ядра".

Описание данных:

olist_customers_datase.csv — таблица с уникальными идентификаторами пользователей

  • customer_id — позаказный идентификатор пользователя
  • customer_unique_id — уникальный идентификатор пользователя (аналог номера паспорта)
  • customer_zip_code_prefix — почтовый индекс пользователя
  • customer_city — город доставки пользователя
  • customer_state — штат доставки пользователя

olist_orders_dataset.csv — таблица заказов

  • order_id — уникальный идентификатор заказа (номер чека)
  • customer_id — позаказный идентификатор пользователя
  • order_status — статус заказа
  • order_purchase_timestamp — время создания заказа
  • order_approved_at — время подтверждения оплаты заказа
  • order_delivered_carrier_date — время передачи заказа в логистическую службу
  • order_delivered_customer_date — время доставки заказа
  • order_estimated_delivery_date — обещанная дата доставки

olist_order_items_dataset.csv — товарные позиции, входящие в заказы

  • order_id — уникальный идентификатор заказа (номер чека)
  • order_item_id — идентификатор товара внутри одного заказа
  • product_id — ид товара (аналог штрихкода)
  • seller_id — ид производителя товара
  • shipping_limit_date — максимальная дата доставки продавцом для передачи заказа партнеру по логистике
  • price — цена за единицу товара
  • freight_value — вес товара

Уникальные статусы заказов в таблице olist_orders_dataset:

  • created — создан
  • approved — подтверждён
  • invoiced — выставлен счёт
  • processing — в процессе сборки заказа
  • shipped — отгружен со склада
  • delivered — доставлен пользователю
  • unavailable — недоступен
  • canceled — отменён

Используемые библиотеки:

pandas matplotlib seaborn requests urlencode datetime attrgetter warnings interactiveshell