/BIG_DATA_Analytics_Mineracao_e_Analise_de_Dados

BIG_DATA Analytics: Mineração e Análise de Dados

Primary LanguageJupyter NotebookGNU General Public License v3.0GPL-3.0

DOI



Oliveira, R. (2021). BIG DATA Analytics: Mineração e Análise de Dados. (pp. 1–240). eBook. https://doi.org/10.5281/zenodo.6672375

Para acesso ao conteúdo clique nos Capítulos ou Título, ou acesse aqui.



Apresentação

  1. Introdução: Mineração, Ciência de Dados e o Aprendizado de Máquina

  2. Regressão e Classificação: Regressão Linear e Logística

  3. Classificação e Métricas

  4. K-Vizinhos Mais Próximos, Validação Cruzada e GridSearch

  5. Árvores de Decisão, Seleção de Atributos e outros Classificadores

  6. Aprendizado não Supervisionado: Clustering

  7. Aprendizado não Supervisionado: Regras de Associação e Filtros de Conteúdo

  8. Redes Neurais e Deep Learning



Atividades de Aprofundamento

Ao final dessas atividades você terá implementado e discutido ao menos um modelo de regressão, um de classificação e um de clusterização de dados.




Áudio e Vídeos

Encontre aqui 2 vídeos para cada Trilha.

  1. Apresentação | vídeo

  2. Introdução: Mineração, Ciência de Dados e o Aprendizado de Máquina | vídeo parte A | vídeo parte B | áudio | slides

  3. Regressão e Classificação: Regressão Linear e Logística | vídeo parte A | vídeo parte B | áudio | slides

  4. Classificação e Métricas | vídeo parte A | vídeo parte B | áudio | slides

  5. K-Vizinhos Mais Próximos, Validação Cruzada e GridSearch | vídeo parte A | vídeo parte B | áudio | slides

  6. Árvores de Decisão, Seleção de Atributos e outros Classificadores | vídeo parte A | vídeo parte B | áudio | slides

  7. Aprendizado não Supervisionado: Clustering | vídeo parte A | vídeo parte B | áudio | slides

  8. Aprendizado não Supervisionado: Regras de Associação e Filtros de Conteúdo| vídeo parte A | vídeo parte B | áudio | slides

  9. Redes Neurais e Deep Learning| vídeo parte A | vídeo parte B | áudio | slides



Cases

Aqui a relação de Cases estudados em cada Trilha.

Trilha Casos Práticos Principais Algoritmos
1. - -
2. CASO: Estimando o Preço de Veículos Regressão Linear
CASO: Estimando o tipo de Transmissão dos Veículos Regressão Logística
3. CASO: 10 year risk of coronary heart disease CHD Regressão Logística
4. CASO: Breast Cancer biopsy K-Vizinhos mais Próximos
5. CASO: Classifying Political Parties Based on Congressional Votes Decision Trees & Random Forest
6. CASO: Segmentando Estados para Políticas e Campanhas de não Violência K-Médias
CASO: Wholesale Customer Data Clustering Hierárquico
7. CASO: UK Online Retail Data Set Apriori
CASO: Spotify Music Recommendation Knn não Supervisionado
8. CASO: Kyphosis Diagnostic MLP e Deep Learning


Principais Referências

Alpaydin, E. Machine Learning (The MIT Press Essential Knowledge). The MIT Press. 2019.

Aston Zhang and Zachary C. Lipton and Mu Li and Alexander J. Smola. Dive into Deep Learning (2020). Disponível em: https://d2l.ai/index.html Acesso em: 21 de abril de 2021.

Fridman, L. MIT Deep Learning Basics: Introduction and Overview with TensorFlow. Disponível em: https://blog.tensorflow.org/2019/02/mit-deep-learning-basics-introduction-tensorflow.html Acesso em: 21 de abril de 2021.

Géron, A. Hands-on machine learning with Scikit-Learn, Keras and TensorFlow: concepts, tools, and techniques to build intelligent systems, 2nd ed. (2019) O'Reilly

Ian Goodfellow and Yoshua Bengio and Aaron Courville, Deep Learning. MIT Press (2016). Also available online: http://www.deeplearningbook.org.

Jake VanderPlas. Python Data Science Handbook O'Reilly Media, Inc. (2016). ISBN: 9781491912058. Disponível em: https://jakevdp.github.io/PythonDataScienceHandbook/. Acesso: 06 de Novembro de 2021.

Kelleher, J. D.; Tierney, Brendan. Data Science (The MIT Press Essential Knowledge). The MIT Press. 2018.

Kelleher, J. D. Deep Learning (2018) The MIT Press.

Koren, Y., Bell, R., & Volinsky, C. (2009). Matrix Factorization Techniques for Recommender Systems. Computer, 42(8), 30–37. doi:10.1109/mc.2009.263

Kotu, Vijay; Deshpande, Balachandre Data Science: concepts and practice. 2nd ed. Cambridge, [England]: Morgan Kaufmann, c2019. E-book (570 p.) ISBN 9780128147627 (electronic bk.). Disponível em: http://pergamum.mackenzie.br:8080/pergamumweb/vinculos/00003c/00003cef.jpg.

Larose, Chantal D.; Larose, Daniel T. Data Science Using Python and R Hoboken: Wiley, c2019. E-book (259 p.) (Wiley Series on Methods and Applications in Data Mining Ser.). ISBN 9781119526834 (electronic bk.). Disponível em: https://www3.mackenzie.br/biblioteca_virtual/index.php?tipoBiblio=ebookcentral&flashObg=n

Manapat, Michael. Introduction to Machine Learning with Python. Em An Introduction to Machine Learning. EMag Edição 50 (Abr 2017)

Molnar Christoph, Interpretable Machine Learning: A Guide for Making Black Box Models Explainable Disponível em: https://christophm.github.io/interpretable-ml-book/ Acesso em: 06 de Novembro de 2021.

Oliveira, R. de. Probabilidade e Estatística Aplicada com R Disponível em: https://github.com/Rogerio-mack/Probabilidade-Estatistica-Aplicada-R Acesso em: 06 de Novembro de 2021.

Oliveira, R. de. Deep Learning I Disponível em: https://github.com/Rogerio-mack/Deep-Learning-I Acesso em: 16 de novembro de 2021.

Peikari, M., Salama, S., Nofech-Mozes, S. et al. A Cluster-then-label Semi-supervised Learning Approach for Pathology Image Classification. Sci Rep 8, 7193 (2018). https://doi.org/10.1038/s41598-018-24876-0

Schrage, M. Recommendation Engines (The MIT Press Essential Knowledge). The MIT Press. 2020.