/datascience-pizza

🍕 Repositório para juntar informações sobre materiais de estudo em análise de dados e áreas afins, empresas que trabalham com dados e dicionário de conceitos

Mozilla Public License 2.0MPL-2.0

Guia do Cientista de Dados das Galáxias

neil

--

DISCLAIMER: Este repositório foi feito pela e para a comunidade. Existem opiniões divergentes sobre o que é básico e o que é avançado entre outros temas. Caso discorde de alguma coisa que está escrita aqui, fique a vontade para fazer um pull request melhorando as descrições feitas.

O intuito é agregar o conhecimento que se espalha em diversos grupos e iniciativas. Muitas vezes esse conhecimento fica espalhado em drives, pockets e outros meios... Dessa forma, esse repositório visa ajudar os iniciantes e servir como referência para os experientes.

Se possuir material interessante, por favor compartilhe com a comunidade. Estamos aqui para crescermos juntos.

Dessa iniciativa também nasceu o Pizza de Dados, um podcast brasileiro focado em ciência de dados. Se tiver um tempinho, prestigie esse trabalho 100% brasileiro.

Se você gosta desse repositório e quer ajudar, considere apoiar o Pizza de Dados com qualquer quantia :)

No mais, é isso. Bem vinda(o), pequena(o) padawan :)

Sumário

Algumas dicas sobre o que estudar para ser um cientista de dados hoje:


Recomendações

Iniciante

Intermediário

Grandes projetos (big data)

  • NoSQL
  • Scala
  • Spark
  • Estatística Bayesiana
  • Hive
  • Hadoop
  • Julia
  • Computação distribuída com AWS e Google Cloud

O que estudar em cada linguagem - dicas e tutoriais

Ver este link


Vídeos

Estudos

Webcasts & Webinars


Datasets


Metodologias ágeis


Dados em Imagens

infographic