DISCLAIMER: Este repositório foi feito pela e para a comunidade. Existem opiniões divergentes sobre o que básico e o que é avançado entre outros temas. Caso discorde de alguma coisa que está escrita aqui, fique a vontade para fazer um pull request melhorando as descrições feitas aqui. Se possuir material interessante, por favor compartilhe com a comunidade. Estamos aqui para crescermos juntos.
Algumas dicas sobre o que estudar para ser um cientista de dados hoje:
-
Tópicos Relevantes:
- Python (lib Pandas) ou R
- SQL
- Jupyter Notebook
- Estatística Descritiva
- Machine Learning
- Cálculo
- Álgebra Linear
- NoSQL
- Scala
- Spark
- Estatística Bayesiana
- Hive
- Hadoop
- Julia
- Computação distribuída com AWS e Google Cloud
- Lista de cursos online by KDnuggets
- Lista dos próximos by KDnuggets
- Data Science do Zero. Primeiras Regras com o Python
- Bad Data Handbook
- Julia for Data Science
- Mastering Python Data Analysis
- Mastering Python Scientific Computing
- Python Data Science Handbook: disponível em Jupyter notebooks
- Data Science para Negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados
- An Introduction to Statistical Learning - Robert Tibshirani, Trevor Hastie
- The Elements of Statistical Learning - Trevor Hastie, Robert Tibshirani, Jerome H. Friedman
- Applied Predictive Modeling - Max Kuhn, Kjell Johnson
- Statistical Learning ministrada por professores da Stanford University
- Fluxo de cursos à distância de Data Science pela Open Source Society
Cursos oferecidos pela plataforma edx.org.
- Python for Data Science(UC San Diego)
- Programming for Data Science(The University of Adelaide)
- Introduction to Python for Data Science(Microsoft)
- Introduction to R for Data Science(Microsoft)
- Machine Learning for Data Science(UC San Diego)
- Statistical Thinking for Data Science and Analytics(Columbia University)
- Machine Learning for Data Science and Analytics(Columbia University)
- Data Science: R Basics(Harvard University)
- Introdução à Ciência de Dados
- Big Data Fundamentos
- Python Fundamentos para Análise de Dados
- R Fundamentos para Análise de Dados
- Machine Learning
- Mais ...
- Data Science A-Z™: Real-Life Data Science Exercises Included
- Python A-Z™: Python For Data Science With Real Exercises!
- Statistics for Business Analytics A-Z™
- R Programming A-Z™: R For Data Science With Real Exercises!
- Data Analysis with Pandas and Python
- O curso completo de Banco de Dados e SQL, sem mistérios
- Fundamentos de Data Science I [pt-br]
- Introdução à Análise de Dados
- Fundamentos da Programação com Python
- Introdução à Ciência de Dados
- Intro to Relational Databases
- Data Scientist with Python - Track
- Data Analyst with Python - Track
- Data Scientist with R - Track
- Data Analyst with R - Track
- Quantitative Analyst with R - Track
- Datasets for Machine Learning
- Datasets for Data Mining and Data Science
- Data repositories by KDnuggets
- Datasets - Kaggle
- UCI Machine Learning Repository
- Data Science & Python - Telegram
- Python Brasil Programadores - Facebook
- Machine & Deep Learning Brasil - Facebook
- Machine Learning & Data Science no Garoa - Telegram
- Dados Abertos - Telegram
- KDnuggets
- Apple
- Google - unofficial
- Uber
- Kaggle
- Airbnb
- Netflix
- Spotify
- Stack Overflow
- Moz
- ŷhat
- DataCamp
- Dataquest
- OpenAI
- Big Data Business [pt-br]
- Hekima [pt-br]
- DeepGraph
- Top 10 blogs for data scientists by Coursera
- 90+ Active Blogs on Analytics, Big Data, Data Mining, Data Science, Machine Learning by KDnuggets
- 50 of the Best Data Science Blogs by Springboard
-
Lista de podcasts de Data Science oeferecidos pela O'Reilly (SoundCloud)
-
Podcast: Data Science from scratch (in Python) (SoundCloud)
Number | Name | Platform | Author |
---|---|---|---|
01 | DatabaseCast 2: Mineração de dados | DatabaseCast | Mauro Pichiliani, Wagner Crivelini, Ary Bressane |
02 | DatabaseCast 53: Cientista de dados | DatabaseCast | Mauro Pichiliani, Wagner Crivelini, Marcelo Glauco |
03 | DatabaseCast 67: Data science na prática | DatabaseCast | Mauro Pichiliani, Wagner Crivelini, Diego Nogare, Tantravahi Aditya |
04 | DatabaseCast 72: Ecossistema Hadoop | DatabaseCast | Mauro Pichiliani, Wagner Crivelini, Felipe Gasparini |
05 | DatabaseCast 74: Estatísticas | DatabaseCast | Mauro Pichiliani, Wagner Crivelini, Ricardo Rezende, Fabiano Amorim |
06 | Dev na estrada #56 - Data Science | DNE | Fellipe Azambuja, Igor Leroy, Ramon Sanches, Raony Guimaraes |
07 | Dragões de Garagem #43 Estatística | Dragões de Garagem | Luciano Queiroz, Lucas Camargos, Bruno Spacek, Rafael Calsaverini |
08 | Dragões de Garagem #92 Inteligência artificial | Dragões de Garagem | Lucas Camargos, Victor Caparica, Camila Laranjeira, Kherian Gracher, Antonio Nazaré, Igor Bastos |
09 | Nerd Tech #5 - Machine Learning | NerdTech | Caio Gomes, Guilherme Silveira, Paulo Silveira |
10 | PODEntender #019 Sobre Deep Learning | PODEntender | Antonio Marinho(Tonho), Carol Lacerda, Fábio Neves(Dalton), Dave Canton |
11 | Data Skeptic - Mini-episódios e entrevistas com profissionais sobre tópicos de ML, DS, Estatística e IA | Data Skeptic | Kyle Polich |
12 | Data Science e Política na Operação Serenata de Amor – Hipsters #62 | Hipsters Tech | Paulo Silveira, Mauricio Linhares, Irio Musskopf, Eduardo Cuducos |
- CRISP-DM [pt-br]