Материалы по курсу «Python для автоматизации и анализа данных» (НИУ ВШЭ, ЦНО ФКН).

Преподаватели: Татьяна Рогович, Ян Пиле

Общая информация:

Каждому занятию соответствует свой порядковый номер. Всего занятий 18 (12 - программирование на Python, 6 - Python для анализа данных). В папке каждого занятия вы найдете блокноты с пройденным на семинаре материалом и ссылки на дополнительные материалы.

Материалы

1 занятие (18.02.2020)
Гид по git. Стиль PEP8. Основы работы с Jupyter. Целые и вещественные числа, логические переменные. Строки, ввод и форматирование

2 занятие (25.02.2020)
Задачи по занятию 1. Кортежи и списки

3 занятие (29.02.2020)
Срезы. Множества и словари. Условный оператор и цикл while.

4 занятие (3.03.2020)
Методы строк. Регулярные выражения

5 занятие (10.03.2020)
Цикл for. Списковые включения Лабораторная работа 1 (см. ниже)

6 занятие (14.03.2020)
Функции

7 занятие (21.03.2020)
Сортировки (эффективность работы алгоритмов)

8 занятие (28.03.2020)
Работа с файлами. Try/except. Введение в html

9 занятие (8.04.2020)
Web-scraping с BeautifulSoup. Таблицы и новости. Автоматизация работы браузера с Selenium

10 занятие (15.04.2020)
Web-scraping с BeautifulSoup: сохранение файлов. XML, JSON, API. Работа с файлами excel в Openpyxel

11 занятие (18.04.2020)
Классы в Python. Реализация собственного класса (алгоритм kNN

12 занятие (25.04.2020) Бот в Telegram. Описание проекта

Материалы для тренировки
Ссылки и краткие описания

Работа в классе и домашняя работа

1 Лабораторная работа

5 занятие (10.03.2020)
Загрузите блокнот с вашим решением по ссылке Или на почту rogovich@gmail.com, если что-то не работает. Не забудьте назвать файл вашей фамилией. Задания Решение

Дедлайны для дорешиваний:

  • 23.59 17.03.2020 (без штрафа)
  • 23.59 24.03.2020 (штраф 40%)

8 занятие (28.03.2020)
Домашняя работа 2. Задания Решение Загрузите блокнот с вашим решением по ссылке
Не забудьте назвать файл вашей фамилией.

Дедлайны:

  • 23.59 7.04.2020 (без штрафа) ДЕДЛАЙН ПРОДЛЕН
  • 23.59 14.04.2020 (штраф 40%)

10 занятие (11.04.2020)
Домашняя работа 3. Задания и файлы
Загрузите блокнот с вашим решением по ссылке
Не забудьте назвать файл вашей фамилией.

Дедлайны:

  • 23.59 26.04.2020 (без штрафа) ДЕДЛАЙН ПРОДЛЕН
  • 23.59 3.05.2020 (штраф 40%)

12 занятие (25.04.2020) Проект. Описание
Загрузите блокнот с вашим решением по ссылке

Дедлайны:

  • 23.59 16.05.2020 (без штрафа)
  • 23.59 23.05.2020 (штраф 40%)

Формы контроля

В какой-то момент на репозитории появятся папки @Problems и @Homework.

Всего на курсе запланировано три домашние работы и проект в блоке "Программирование на Python", четыре домашних задания в блоке "Python для анализа данных".

Оценки за задания выставляются в 10-балльной шкале. Всего на курсе 8 заданий (включая проект), для получения зачета по этой части программы нужно иметь оценку не менее 4 баллов в среднем (из расчета всех работ, не только выполненных).

За сдачу заданий после дедлайна предусмотрен штраф 40% (максимальный балл за задание будет не 10, а 6). Если опоздание более двух недель, задание не проверяется.

Лабораторная работа - это формат решения заданий в классе. Это не самостоятельная работа - вы можете задавать преподавателю вопросы по ходу решения. Решенные задачи будут проверяться прямо в классе. Если вы пропустили занятие или не успели сделать нужное количество заданий на семинаре, то всегда можно загрузить файл по ссылке на Dropbox к определенному дедлайну. Ссылка, информация о дедлайне и количестве выполненных заданий, необходимых для зачета по работе, будет публиковаться в конце этого файла + мы будем дублировать информацию в чат группы в Telegram.

Как работать с Github?

Для скачивания файлов с Github необязательно иметь аккаунт, достаточно кликнуть на зеленую кнопку Clone or download в правом верхнем углу, выбрать Download ZIP и распаковать архив. В папке 2020_DPO_PythonProg будут все файлы, загруженные на Github на момент скачивания.

Если файл .ipynb сохраняется как текст или с лишним расширением (например, .txt), то нужно выбрать при сохранении тип файла все файлы, а не текст, или после сохранения убрать вручную расширение, переименовав файл.

Подробнее про работу с GitHub можно прочитать здесь