Спринт 7 Проект 5 - дальнейшее развитие DWH
Требования
Основная задача — расширить модель данных, проанализировать новую информацию и помочь маркетологам дать эффективную рекламу соцсети в интернете.
Целевая витрина dwh.dm_user_conversion
- hk_group_id- Хэш-ключ группы.
- cnt_added_users - Количество новых пользователей группы (event = add).
- cnt_users_in_group_with_messages - Количество пользователей группы, которые написали хотя бы одно сообщение.
- group_conversion - Доля пользователей группы, которые начали общаться.
- Выводимая информация отсортирована по убыванию по полю - group_conversion
Запуск
- Создать таблицы выполнив DDL скрипт в Vertica из \src\db_ddl\ddl_change_schema.sql
- Запускам Apache Airflow
- Переносим python dags из \src\dags в директорию с дагами airflow
- Запускаем задачу stg_fetch_files_from_s3
- Запускаем задачу stg_migration
- Проверяем в Airflow, что задачи запустились и отработали успешно
- Запрос на получение данных из целевой витрины \src\db_ddl\sql_dm_user_conversion.sql
Рекомендации для маркетинга
Первые три группы из запроса sql_dm_user_conversion показывают самую высокую конверсию. Данные группы рекомендуемы, в первую очередь, для запуска рекламы.