Проект по парсингу сайта, содеражащего российские бренды одежды .
Файлы проекта:
main.py - файл парсит основную информацию(название, город, описание, ссылки на бренд)
requests_for_links.py - файл используется для запроса ссылок на отдельную страницу каждого бренда
converse.py - файл используется для преобразования данных в csv
и xlsx
brands_list.json - json файл с данными по каждому бренду(название, город, описание, ссылки на бренд)
links_for_brands.json - json файл с ссылками на отдельную страницу каждого бренда
output.csv - итоговая таблица в формате csv
output.xlsx - итоговая таблица в формате xlsx
Инструкция по эксплуатации:
Первый файл для запуска requests_for_links.py
. Из него мы получаем набор ссылок в формате json
links_for_brands.json
. Далее запускаем файл main.py
, он парсит всю основную информацию(название, город, описание, ссылки на бренд) и переводит в json
файл. Файл converse.py
преобразует значения в csv
и xlsx
.
Используемые библиотеки:
-bs4(BeautifulSoup)(для парсинга данных)
-json(для преобразования в json файлы)
-requests(для запросов)
-openpyxl(для преобразования в xlsx)
-pandas(для занесения данных в таблицу)