/ds_ada_santander_knn

Recreate the KNN algorithm to classify data.

Primary LanguageJupyter Notebook

KNN Lib ® 2024 🚀

  • Projeto: Algoritmo de K-Nearest Neighbors - KNN

  • Curso: Santander Coders 2023 | 2º Semestre

  • Módulo: Lógica de Programação II (PY)

  • ADA Tech em parceira com Banco Santander

  • Facilitador: Maurício Sobrinho

KNN

Membros do grupo:

  • Anderson Miranda - ID: 1116003
  • André Kuster - ID: 1116029
  • Artur Stein - ID: 1116023
  • João Souza - ID: 1116027
  • Juliana Bertolucci Peixoto - ID: 1116030

1. OBJETIVO:

O objetivo deste projeto é recriar o algoritmo de machine learning K-Nearest Neighbors - KNN, em python, para calcular e classificar um dataset específico.

2. DATA SOURCE:

Água potável

O acesso à água potável é essencial para a saúde, um direito humano básico e uma componente de uma política eficaz de protecção da saúde. Isto é importante como uma questão de saúde e desenvolvimento a nível nacional, regional e local. Em algumas regiões, foi demonstrado que os investimentos no abastecimento de água e no saneamento podem produzir um benefício económico líquido, uma vez que as reduções nos efeitos adversos para a saúde e nos custos dos cuidados de saúde superam os custos da realização das intervenções.

Fonte: Kaggle - Water Potability

3. LIMITAÇÕES:

Ficando restrito a ementa do curso Santander Coders - ADA Tech, não foram utilizados:

  • Recursos avançados;
  • Orientação a Objetos;
  • Lib estrangeiras: Pandas, Numpy ou Scikit Learning;

4. REFERÊNCIAS BIBLIOGRÁFICAS:

Artificial Intelligence. (2024, 3 de Janeiro). What are the most effective distance metrics for optimizing k-nearest neighbors algorithms? Linkedin.com; www.linkedin.com. https://www.linkedin.com/advice/3/what-most-effective-distance-metrics-optimizing-xndwc.

Bruce, P., & Bruce, A. (2019). Estatística prática para cientistas de dados: 50 conceitos essenciais. Alta Books.

de Maquina, A. [@aprendizagemdemaquina9452]. (2021, March 4). O que é o KNN e como implementar do zero. Youtube. Acesso em 20 Jan 2024 de https://www.youtube.com/watch?v=E7R6O4Aqw-M.

Comunidade Ada. (n.d.). Ada.Tech. Acesso em 18 Jan 2024 de https://lms.ada.tech/student.

Fávero, L. P., Lopes E, B., & Prado, P. (2017). Manual de análise de dados: estatística e modelagem multivariada com Excel, SPSS e Stata. Elsevier.

Kadiwal, A. (2021). Water Quality [Data set]. In Drinking Water Potability. Acesso em 12 Jan 2024 de https://www.kaggle.com/datasets/adityakadiwal/water-potability/data.

Kaggle: Your machine learning and data science community. (n.d.). Kaggle.com. Acesso em 20 Jan 2024 de https://www.kaggle.com.

Kunumi. (2020, 10 Junho). Métricas de Avaliação em Machine Learning: Classificação. Kunumi Blog. Acesso em 17 Jan 2024 de https://medium.com/kunumi/m%C3%A9tricas-de-avalia%C3%A7%C3%A3o-em-machine-learning-classifica%C3%A7%C3%A3o-49340dcdb198.

Matos, G. (2023, December 5). K-Nearest Neighbors(KNN): Entendendo o seu funcionamento e o construindo do zero. Share! Por Ateliê de Software. Acesso em 18 Jan 2024 de https://share.atelie.software/k-nearest-neighbors-knn-entendo-o-seu-funcionamento-e-o-construindo-do-zero-a21b022acd6f.

PEP 257 – docstring conventions. (n.d.). Python.org. Acesso em 23 Jan 2024 de vhttps://peps.python.org/pep-0257.

Srivastava, T. (2018, 25 março). A complete guide to K-Nearest Neighbors (updated 2024). Analytics Vidhya. Acesso em 24 Jan 2024 de https://www.analyticsvidhya.com/blog/2018/03/introduction-k-neighbours-algorithm-clustering.

Tavares, C. (2019, 26 Março). KNN sem caixa preta. Medium. Acesso em 22 Jan 2024 de https://medium.com/@caroli.agro/aplicando-knn-em-iris-dataset-d594b79652d1.

Yu, C., Ooi, B. C., Tan, K., & Jagadish, H. V. (2001). Indexing the Distance: An Efficient Method to KNN Processing. In Very Large Data Bases Conference.


Links úteis: