/Search-Bar-Scrap

Código Python que hace webscrapping al buscador de google de forma masiva usando un dataframe

Primary LanguagePythonApache License 2.0Apache-2.0

Search Bar Scrap

El siguiente código realiza webscrapping de forma masiva a la primera página de Google (título y url) usando Selenium. Lo anterior, tomando como base un dataframe de Python.

Ejemplo de uso 📑

columnas = ['Persona','Auto']
busqueda_Google(df,columnas,exacta=True)

Salida ⌛


NOTA: Como se crea un driver con cada iteración puede ser ligeramente más lento que abrir un solo driver y actualizar la búsqueda. Ambos casos son detectados por Google (por lo que se debe tener cuidado para no ser 'baneado'). Dependiendo de la búsqueda en cuestión, habrá ocasiones en las que no sea posible guardar todos las urls ni títulos y deberá usarse otra etiqueta de búsqueda.