En este notebook crea una WordCloud o Nube de Palabras mediante el uso del Procesamiento del Lenguage Natural (nlp en inglés) sobre los comemtarios del sitio web Cubadebate.
Run -> Build -> Deploy
Utilizando GitHub Actions para ejecutar, construir y desplegar el notebook, archivos y artefactos hacia Github Pages de la rama (branch) gh-pages del repositorio: Cubadebate Comenta
Las acciones utilizadas desde el GitHub Marketplace para Actions son:
Execute Notebook and Release Artifacts on: release
Build and Deploy on: schedule
Como resultado se obtiene cada cierta hora en el día la imagen wordcloud_cubadebate.png que contiene la nube de palabras sobre los comentarios en Cubadebate. También puede descargar los resultados en formato JSON en comments_tfidf.json
For use in Google Colab you should be install the next packages, add cell python code first and then go to Restart the runtime:
!pip install dask[bag]
!pip install wordcloud
!pip install spacy
!python -m spacy download es_core_news_sm
from IPython.display import clear_output
clear_output()
print("Dask installed.")
print("WordCloud installed.")
print("Spacy es_core_news_model installed.\nRestart the runtime!")
pip-compile --no-header --no-annotate --upgrade