/Parsing

Primary LanguagePython

Parsing

Проект по парсингу сайта, содеражащего российские бренды одежды .

Файлы проекта:

main.py - файл парсит основную информацию(название, город, описание, ссылки на бренд) requests_for_links.py - файл используется для запроса ссылок на отдельную страницу каждого бренда converse.py - файл используется для преобразования данных в csv и xlsx brands_list.json - json файл с данными по каждому бренду(название, город, описание, ссылки на бренд) links_for_brands.json - json файл с ссылками на отдельную страницу каждого бренда output.csv - итоговая таблица в формате csv output.xlsx - итоговая таблица в формате xlsx

Инструкция по эксплуатации:

Первый файл для запуска requests_for_links.py. Из него мы получаем набор ссылок в формате json links_for_brands.json. Далее запускаем файл main.py, он парсит всю основную информацию(название, город, описание, ссылки на бренд) и переводит в json файл. Файл converse.py преобразует значения в csv и xlsx.

Используемые библиотеки:

-bs4(BeautifulSoup)(для парсинга данных)

-json(для преобразования в json файлы)

-requests(для запросов)

-openpyxl(для преобразования в xlsx)

-pandas(для занесения данных в таблицу)