/data-science-roadmap

Repositório para juntar informações sobre materiais de estudo em análise de dados e áreas afins, empresas que trabalham com dados e dicionário de conceitos

Guia do Cientista de Dados das Galáxias

Algumas dicas sobre o que estudar para ser um cientista de dados hoje:

Recomendações

Iniciante

  • Python (lib Pandas) ou R
  • SQL
  • Jupyter Notebook
  • Estatística Descritiva

Intermediário

  • Machine Learning
  • Cálculo
  • Álgebra Linear

Grandes projetos (big data)

  • NoSQL
  • Scala
  • Spark
  • Estatística Bayesiana
  • Hive
  • Hadoop (Spark está tomando o espaço do Hadoop)
  • Julia
  • Computação distribuída com AWS e Google Cloud

Vídeos

Carreira

Estudos

Webcasts & Webinars

Livros

Iniciantes

Recomendados

  • An Introduction to Statistical Learning - [Robert Tibshirani, Trevor Hastie]
  • The Elements of Statistical Learning - [Trevor Hastie, Robert Tibshirani, Jerome H. Friedman]
  • Applied Predictive Modeling - [Max Kuhn, Kjell Johnson]

Cursos

DataScience Academy

Udemy

Udacity

Cousera

DataCamp

Dataquest.io

Datasets

Matérias interessantes

Grupos

Blogs/Journals

Posts com listas de melhores blogs

Metodologias ágeis