/provadeia

Primary LanguageJupyter Notebook

provadeia

q1

Questão um

Dataset: https://archive.ics.uci.edu/ml/datasets/Autism+Screening+Adult

Escolha dois métodos de Aprendizagem de Máquina para resolver o problema. Classifique a instância entre doente e saudável. Faça a análise dos resultados considerando matriz de confusão, especificidade, sensibilidade, medida F1 e acurácia.

q2

Dataset: https://archive.ics.uci.edu/ml/datasets/Avila

Crie um dataset de Treino com 60% de instâncias, 20% de instâncias de Validação e 20% de instâncias de Teste.

Elaborar uma rede neural de duas camadas para classificação do banco de dados. Avaliar o desempenho da rede utilizando matriz de confusão com o dataset de teste e mostre o valor de acurácia.

Utilize apenas o arquivo avila-tr.txt. A camada de saída deve conter um neurônio para cada classe. Utilizar o dataset de validação para criar algum critério de parada no treinamento.

q3

Datasets: https://drive.google.com/file/d/1DHigBm7_1kGFiG3vk3zaKnLwHbX-QxfO/view e https://drive.google.com/file/d/1NuN9yGSewm7AyfwpWP9Te8AfzvIYRL_y/view

Apresente duas soluções de aprendizagem de máquina que consigam taxas de erro médio abaixo de 2,2m na predição da localização (em termos de coordenadas X e Y) dos pontos da base de testes, utilizando regressão. Os conjuntos de dados (treinamento e testes) contêm o local (em coordenadas X e Y) precedido por 5 leituras de RSSI de 5 APs (Access Points) para cada metro quadrado do vão do andar térreo do LASER e de duas salas existentes no térreo.

Dicas: teste com vários algoritmos de aprendizagem de máquina para identificar os que apresentam melhores resultados; para calcular o erro médio da predição da localização nos pontos da base de testes utilize a fórmula da hipotenusa.

q4

Dataset: https://drive.google.com/file/d/1_702eOQbimT1HhTuozwMEKV6HHOykLaJ/view

Execute os algoritmos de agrupamento K-means e Hierárquico com os seguintes valores de K: 2, 5, 10 e 100. Compare os agrupamento resultantes dos 2 algoritmos. Escolha um número fixo de K e altere o parâmetro do K-Means referente ao número máximo de iterações: 1, 10 e 100 e o parâmetro de Linkage do Hierárquico, quais diferenças puderam ser observadas? Faça uma comparação entre os 2 algoritmos, qual você acha que teve o melhor desempenho e por quê?