/Tech-News-Web-Scraping

Web scraping para coletar notícias sobre tecnologia, utilizando Parsel, Requests, MongoDB, PyMongo, e Pytest

Primary LanguagePython

Boas vindas ao repositório do projeto Job Insights !

O que foi desenvolvido 👨‍💻

Este projeto de web scraping foi desenvolvido para coletar notícias sobre tecnologia de um site específico. Utilizando técnicas de raspagem de dados, foi possível extrair informações como o título da notícia, sua categoria, o resumo e o link para a notícia completa. Com a automação desse processo, foi possível coletar uma grande quantidade de informações em um curto espaço de tempo, permitindo a manipulação e análise dos dados coletados.

Apresentação

Tecnologias utilizadas

Orientações

🔰 Iniciando o projeto e Comandos Úteis
  1. Clone o repositório
  • git clone git@github.com:luizfilipelgs/Tech-News-Web-Scraping
  1. Entre na pasta do repositório que você acabou de clonar:
  • cd Tech-News-Web-Scraping
  1. Crie o ambiente virtual para o projeto e ativeo
  • python3 -m venv .venv && source .venv/bin/activate
  1. Caso já se tenha clonado e criado o ambiente virtual antes, apenas ative com:
  • source .venv/bin/activate
  1. Instale as dependências
  • python3 -m pip install -r dev-requirements.txt
  1. Caso Não tenha o mongoDB localmente, rode via docker com:
  • docker-compose up -d mongodb
  1. Inicialize a aplicação.
  • digite o comando tech-news-analyzer para acessar o menu em seu terminal e utilizar a aplicação.