Este código esta hecho para extraer el número de resultados de serie de busquedas de vacantes de trabajo en LinkedIn. El repositorio original es de Luke Barousse pero tenia algunos problemas al correrse y fue adaptado para traer en especifico el campo del "Número de resultados" para cada busqueda en LinkedIn.
Este repositorio es el utilizado para obtener los resultados en este video de Youtube que publiqué.
Aviso: Hacer webscraping de LinkedIn sin su permiso está prohibido y pueden bloquear tu usuario si se detectan demasiados llamados a LinkedIn en un periodo de tiempo corto.
El Jupyter notebook LinkedIn.ipynb tiene dos celdas las cuales se encargan de recibir una lista de busquedas de vacantes laborales y paises a realizar en LinkedIn. Con Selenium se ingresa a tu perfil de LinkedIn y genera una busqueda por cada palabra clave y pais que se indicó. Guarda la información en un archivo csv que tiene un registro por cada combinación de pais/busqueda.
- Descargar los drivers de Chrome correspondientes a la version de Google Chrome que tienes en el sistema
- Crear un archivo llamado .env con tu usuario y contraseña de LinkedIn para que el robot pueda ingresar
- Tener instalado todas las paqueterias del requirements.txt
pip install -r requirements.txt
LINKEDIN_USERNAME=email.address@mail.com
LINKEDIN_PASSWORD=password
- Dentro de Chrome obtener la versión de Chrome Menú-Ajustes-Sobre Chrome
- Descargar ek chromedriver que corresponde a la version de Chrome instalada en esta liga
- Colocar el driver en el directorio raiz de este repo
Las variables a modificar son las siguientes:
search_keywords # Lista de busquedas a realizar
search_location # Diccionario con lista de paises a realizar la busqueda, esas claves se pueden obtener haciendo una busqueda en Linkedin para un pais y viendo la URL para la clave
search_remote # busca vacantes que sean remoto si es true
Correr todas las celdas dentro del archivo principal LinkedIn.ipynb
Al terminar el código se tendra un archivo csv en la carpeta de output