Microsoft Learn: Data Science

A função de um Cientista de Dados envolve principalmente a exploração e a análise de dados.

Os resultados de uma análise podem formar a base de um relatório ou um modelo de aprendizado de máquina, mas todos começam com dados, sendo Python a linguagem de programação mais popular para cientistas de dados.

Visualização dos Dados

Os cientistas de dados visualizam os dados para compreendê-los melhor. Isso pode significar examinar os dados brutos, medidas de resumo, como médias, ou grafar os dados.

Os grafos são um meio poderoso de exibir dados, pois podemos distinguir rapidamente padrões moderadamente complexos sem a necessidade de definir medidas de resumo matemáticas.

Representar visualmente os dados normalmente significa grafá-los. Assim é possível fornecer uma avaliação qualitativa rápida de nossos dados, o que pode ser útil para entender os resultados, localizar valores de exceção, entender como os números são distribuídos e assim por diante.


English version

Exploring Data with Python

A significant part of a a data scientist's role is to explore, analyze, and visualize data. There's a wide range of tools and programming languages that they can use to do this; and of the most popular approaches is to use Jupyter notebooks (like this one) and Python.

Python is a flexible programming language that is used in a wide range of scenarios; from web applications to device programming. It's extremely popular in the data science and machine learning community because of the many packages it supports for data analysis and visualization.