/DataAnalysisHuman_Resources_Project

Este projeto foi realizado durante o treinamento prático do curso Python para Análise de Dados realizado por DataViking - O projeto é uma análise da relação entre Anos de Experiência versus Salário do Funcionário

Primary LanguageJupyter NotebookMIT LicenseMIT

Português:

Análise da relação entre os Anos de Experiência X Salário Anual

NPM

Sobre o Projeto

Esse projeto foi feito durante o treino prático do curso de Python para Análise de Dados conduzido por DataViking e o arquivo está disponível nos idiomas: Português (Projeto_Recursos_Humanos.ipynb) e Inglês (Human_Resources_Project.ipynb)

Esse projeto é uma análise da relação entre os Anos de Experiência X Salário Anual do empregado, nesse projeto foram usadas a linguagem Python e suas Bibliotecas Numpy, Pandas, Matplotlib e Seaborn no ambiente do Jupyter Notebook.

O Dataset possui os dados dos Anos de Experiêcnia e Salário em dólares dos funcionários. Iremos tentar entender se uma quantidade maior de anos de experiência tem correlação com um maior salário.

Primeiramente realizamos uma análise do valor dos salários e pra isso plotamos um gráfico KDE e podemos analisar que os dados possuem uma distribuição assimétrica bimodal, com uma parte estando concentrada em torno de 5000 dólares e outra parte concetrada próxima aos 11000 dólares. Após isso analisamos também os anos de experiência com um gráfico KDE e chegamos a uma conclusão parecida, também temos uma distribuição assimétrica bimodal com uma parte concentrada em torno de 2 anos e meio e outra parte concetrada próxima dos 10 anos. Depois plotamos dois gráficos Boxplot para analisar essas colunas, o primeiro Boxplot foi do Salário e possuía um Limite Inferior próximo aos 3700 dólares, o Primeiro Quartil próximo aos 5600 dólares, Mediana em torno de 6500 dólares, Terceiro Quartil em torno de 10500 dólares e o Limite Superior próximo aos 12200 dólares e não tivemos ocorrência de Outliers. O segundo Boxplot foi o de Anos de Experiência e tinha um Limite Inferior próximo de 1 ano, Primeiro Quartil próximo de 3 anos, Mediana próxima a 4 anos e meio, Terceiro Quartil próximo a 7 anos e meio e Limite Superior de 10 anos e meio e também não tivemos ocorrência de Outliers. Em seguida, plotamos um gráfico Scatterplot e um gráfico de Regressão Linear e podemos analisar que os dados tem uma correlação linear, quando os anos de experiência aumentam o salário também aumenta em relação a esse dado. Por fim, para verificar isso usamos a Correlação de Pearson e utilizamos um Heatmap para melhor visualização e podemos analisar que os dados possuem uma forte correlação (0.98).

Visão Geral do Projeto

VisaoGeral

Visão Geral do Gráfico

GraficoGeral

Tecnologias e Bibliotecas

  • Python para Análise de Dados
  • Numpy
  • Pandas
  • Seaborn
  • Matplotlib

Rode o Projeto:

Pré-Requisitos:

  • Python 3.11.0 ou superior
  • Jupyter Notebook
  • Numpy
  • Pandas
  • Seaborn
  • Matplotlib
  • Power Point

Autor

Riquelmo Afonso Avelar Ferreira

https://www.linkedin.com/in/riquelmo-afonso-avelar-ferreira-df5183/

English:

Years Experience x Salary Analysis Project

NPM

About the Project

This project was done during the hands-on training of the Python for Data Analysis course carried out by DataViking and the file is available in the languages: Portuguese (Projeto_Recursos_Humanos.ipynb) and English (Human_Resources_Project.ipynb)

The project is an analysis of the relation between Years of Experience versus Employee Salary, in this project the Python language and its libraries Numpy, Pandas, Seaborn and Matplotlib were used in the Jupyter Notebook environment

The Dataset has the data of the Years of Experience and Salary in dollars of the employees. We will try to understand if a greater amount of years of experience is correlated with a higher salary.

First, we carried out an analysis of the value of wages and for that we plotted a KDE chart and we can analyze that the data have a bimodal asymmetric distribution, with a part being concentrated around 5000 dollars and another part concentrated close to 11000 dollars. After that, we also analyzed the years of experience with a KDE chart and reached a similar conclusion, we also have a bimodal asymmetric distribution with a part concentrated around 2 and a half years and another part concentrated close to 10 years. Then we plotted two Boxplot charts to analyze these columns, the first Boxplot was of Salary and had a Lower Limit close to 3700 dollars, the First Quartile close to 5600 dollars, Median around 6500 dollars, Third Quartile around 10500 dollars and the Upper Limit close to 12200 dollars and we had no occurrence of Outliers. The second Boxplot was of the Years of Experience and had a Lower Limit close to 1 year, First Quartile close to 3 years, Median close to 4 and a half years, Third Quartile close to 7 and a half years and Upper Limit close to 10 and a half years and we also had no occurrence of Outliers. Then we plotted a Scatterplot chart and a Linear Regression chart and we can analyze that the data has a linear correlation, when the years of experience increase the salary also increases in relation to this data. Finally, to verify this, we use Pearson's Correlation and use a Heatmap for better visualization and we can analyze that the data have a strong correlation (0.98).

Overview

InitialVision

Chart Sample

ChartSample

Technologies and Libraries

  • Python for Data Analysis
  • Numpy
  • Pandas
  • Seaborn
  • Matplotlib

Run the Project

Prerequisites:

  • Python 3.11.0 or superior
  • Jupyter Notebook
  • Numpy
  • Pandas
  • Seaborn
  • Matplotlib
  • Power Point

Author

Riquelmo Afonso Avelar Ferreira

https://www.linkedin.com/in/riquelmo-afonso-avelar-ferreira-df5183/?locale=en_US