Репозиторий для реализации дистанционного обучения по дисциплине "Визуализация данных"
Учебный журнал по дисциплине. Тут доступна информация о сроках сдачи работ, о текущей успеваемости студентов и описаны все материалы необходимые для реализации курса.
Средства разработки: Python 3.7, Python envs (pip/conda/virtualenv), Jupyter notebook, Pandas, NumPy Для описания использовать разметку Markdown внутри Jupyter Сроки: давно прошли
- Найти датасет и согласовать с преподавателем
- Развернуть Python 3.7 локально и список всех программ выше
- Создать новый ноутбук, загрузить выбранный датасет, описать исходные данные (по кол-ву строк и колонок, по типу данных, по смыслу, по источнику (откуда датасет))
- Описать основные гипотезы относительно датасета, не меньше 3-х Например:
- Нормализовать данные (обработать) для каждой отдельной гипотезы. Сюда входит: нормализация дат, заполнение пропусков, очистка датафрейма, а также доработка для дальнейшего исследования.
- Провести описательную статистику подготовленных данных, визуализируя инструментами Pandas (hist/plot/...)
Экспортировать в PDF, сохранить в формате {группа} _ {фамилия} _ лр-1.pdf Полученный код и PDF-файл залить в папку этого репозитория students/группа/laboratory_works/фамилия_имя/laboratory_work_1. Инструкция о загрузке работы ниже. Не забывайте о файле гитигнор. Как делать пул реквест описано в разделе Сдача работ
D3.js
- Настроить рабочее окружение.
Скачать: библиотеку D3.js; CSS фреймворк, например Bootstrap и развернуть проект на локальном сервере, создав файл index.html
и подключив библиотеки.
- Создать 2 дополнительные страницы,
bar-chart.html
иline-chart.html
, загрузить свои данные, переименовать названия столбцов и отобразить результат.
Примеры страниц bar-chart.html
и line-chart.html
в данном репозитории.
По выбранному датасету построить минимум 5 разных графиков, используя библиотеку D3.js. В ходе выполнения использовать различные интерпретации данных, отталкиваясь от аналитических отчетов в первой работе.
Полученный код и PDF-файл залить в папку этого репозитория students/группа/laboratory_works/фамилия_имя/laboratory_work_2. Инструкция о загрузке работы ниже. Не забывайте о файле гитигнор. Как делать пул реквест описано в разделе Сдача работ
На основе выбранного датасета необходимо выполнить итоговую работу: короткий дата-сторителлинг, описывающий выбранный набор данных и иллюстрирующий его особенности. Для выполнения работы использовать сервис Datawrapper (https://www.datawrapper.de/charts/), представляющий из себя по сути шаблоны для графиков, требующие корректной предзагрузки данных. Дата-сторителлинг по сути представляет из себя лендинг , на котором представлено один или несколько графиков (на усмотрение студента) и история, их описывающая.
http://revealthedata.com/blog/all/kniga-grafiki-kotorye-ubezhdayut-vseh-i-kurs-interaktivnye-grafi/ https://academy.datawrapper.de/article/147-examples-of-datawrapper-line-charts
Для сдачи работы в связи с переходом на дистанционку введеные дополднительные правила игры.
Все отчеты сохраняются в pdf (документы и презентации).
Все студенческие работы хранятся в папке Students Для сдачи работы необходимо:
- Зарегиться на гите.
- Сделать форк репозитория с заданиями в свой аккаунт (на странице https://https://github.com/TonikX/ITMO_IMRIP_DataBases_2020/ кнопка fork справа, сверху).
- Установить гит на компьютер.
- Открыть папку, где хранятся Ваши проекты. В контекстом меню нажать "Open Git Bash here". Склонировать форкнутый репозиторий на комьютер (git clone https://github.com/ваш аккаунт/ITMO_IMRIP_DataBases_2020/).
- В файловой системе Вашего компрьютера, в склонированном репозитории создать в папке students/группа Вашу личную папку в формате Фамилия_Имя латиницей (Пример sutdents/k3340/Petrov_Vasya).
- В личной папке сделать подпапку с текущей работой в формате lr_номер (Пример sutdents/k3340/Petrov_Vasya/Lr1).
- Записать в папку отчетные материалы.
- Сделать коммит, описать его адекватно (Пример "был добавлен файл перезентация_петров.pdf"). Набрать команлы git add и git commit -m "название комита".
- Сделать push в Ваш форкнутый репозиторий (git push).
- Сделать пул-реквест в мой репозиторий из вашего форкнутого, описать его адекватно. Пока пользуйтесь этой инструкцией, у нас нет веток с заданиями, как тут, но Вам поможет. Скоро запишу ролик. Все работы сдаются средствами создания Pull Requests в папку students в этом репозитории.
Еще один мануал о том, как сделать Pull Request описано тут.