/autobidmaster_scraper

Primary LanguagePythonGNU General Public License v3.0GPL-3.0

Парсер данных с Autobidmaster

Этот скрипт позволяет скачивать данные о продаже автомобилей с сайта Autobidmaster и их изображения.

Используемые технологии

  • aiohttp
  • asyncio
  • pandas
  • selenium

Python и Git

Перед началом установки убедитесь, что у вас уже установлены Python и Git. Вы можете проверить это, запустив следующие команды в командной строке (терминале):

  1. Проверка версии Python:

    python --version

    Если Python установлен, вы увидите версию Python. Если Python не установлен, следуйте инструкциям по установке Python.

  2. Проверка версии Git:

    git --version

    Если Git установлен, вы увидите версию Git. Если Git не установлен, следуйте документации по установке Git.

Установка

  1. Клонируйте репозиторий на свой компьютер:

    git clone https://github.com/redboo/autobidmaster_scrapper.git
  2. Перейдите в папку проекта:

    cd autobidmaster_scrapper
  3. Создайте виртуальную среду Python:

    • Для Unix-подобных систем (Linux, macOS):

      python3 -m venv env
      source env/bin/activate
    • Для Windows:

      python -m venv env
      .\env\Scripts\activate
  4. Установите зависимости:

    pip install -r requirements.txt

Использование

  1. Убедитесь, что у вас установлены браузер Google Chrome и ChromeDriver.

  2. Создайте файл .env на основе default.env:

    cp default.env .env

    После этой команды у вас будет файл .env с примерами переменных. Заполните его своими учетными данными:

    EMAIL=ваш_электронный_адрес
    PASSWORD=ваш_пароль
  3. Запустите скрипт из командной строки, указав количество страниц для обработки (по умолчанию 1):

    Примечание: При использовании виртуальной среды Python (source env/bin/activate), не забудьте активировать ее перед началом работы и деактивировать после использования с помощью команд source env/bin/activate и deactivate соответственно.

    python run.py количество_страниц [--ext расширение_файла]

    Пример:

    python run.py 2 --ext csv

    По умолчанию результат сохраняется в формате xlsx. Вы можете указать --ext csv для сохранения в формате CSV.

  4. После завершения работы скрипта, вы найдете данные в папке downloads.

Обновление репозитория Git

Если вы хотите обновить локальную копию репозитория до последней версии, выполните следующие команды в командной строке внутри папки проекта:

git pull origin main

Лицензия

GNU GPLv3