/salarios3dg

Scripts para calcular y mostrar la media de salarios (en bruto) a partir de los datos de un thread del foro de 3DGames.

Primary LanguagePython

Salarios 3DG (2022)

Intro

Dos simples scripts para calcular y mostrar la media de salarios (en bruto) a partir de los datos vertidos por usuarios anónimos en un thread del foro de 3DGames:

2022 - ¿Cuánto ganás/cobrás?

La idea nace de mera curiosidad de querer saber cuál era promedio de salarios, notando los elevados montos que los usuarios subían al thread. Estos salarios no parecían demasiado representativos en un principio, teniendo en mente los datos públicos que uno puede ver de encuestas como las de SysArmy, Encuestas IT, cuantoGano o incluso datos de CESSI.

Descripción

El 1° script (obtener_salarios.py) se encarga de buscar todos los posts del mencionado thread. Después se filtra los mismos según determinados parámetros (empleado para esta tarea tanto regex como la librería spaCy) y así obtener todos los salarios brutos que fueron recolectados de todos los posts (o más específicamente, de aquellos posts siguieron un formato de mensaje establecido en el 1° mensaje del thread):

Imagen 1

El 2° script (plotear_salarios.py) se encargar de mostrar en un gráfico los resultados obtenidos, empleado la librería Seaborn. Pero antes de hacer esto se obtiene primero el valor del dolar blue del día desde la API de CriptoYa.com y del euro blue desde la web de PrecioEuroBlue.com.ar. Ya con estos valores a disposición se puede realizar la conversión a pesos y obtener los valores medios necesarios:

Imagen 2

Para así mostrar finalmente el plot con todos los salarios en bruto convertidos a pesos y una linea de salario medio:

Imagen 3

Instalación y uso

  1. Si se tiene ya instalado Git en nuestro sistema operativo, basta nomás con clonar el presente repositorio:
git clone git@github.com:FedeHC/salarios3dg.git

Con el repo clonado y dentro de la carpeta de descarga del repositorio, procedemos con el resto:
  1. a) OPCIONAL: Antes es recomendable usar un entorno virtual como por ej. VirtualEnv:
virtualenv salarios3DG
  1. b) Y recién luego instalar dentro de éste último todas las librerías usadas por ambos scripts:
pip install -r requirements.txt
  1. c) OPCIONAL: Tener presente que la librería spaCy puede darnos algunos inconvenientes para instalarlo y usarlo. En ocasiones es necesario descargar un módulo (pipeline de entrenamiento) necesario para poder usar la librería:
python -m spacy download es_core_news_sm

Y dentro del script (obtener_salarios.py) ir a la linea 96, comentarla (#) y descomentar la linea siguiente, tal como se muestra a continuación:

# nlp = en_core_web_sm.load()
nlp = spacy.load("es_core_news_sm")

  1. a) Una vez terminado, basta nomás con ejecutar ambos scripts en el sig. orden:
python obtener_salarios.py
  1. b) Y luego:
python plotear_salarios.py