Um projeto utilizado apenas para o estudo do algoritmo Random Forest, utilizando-se o R. Serão utilizadas duas bases de dados e dois scripts
A base de dados census.csv
foi retirada do UCI Machine Learning Repository, a qual no mesmo possui o nome de Adult Data Set. Foram realizadas pequenas modificações na mesma. O objetivo de previsão na mesma é determinar se uma pessoa ganha mais de 50 mil por ano.
O objetivo de previsão na base de dados credit_data.csv
é determinar se o cliente pagou o empréstimo.
Utilizando-se o algoritmo Random Forest foi possível encontrar uma precisão de 85,52% na primeira base de dados e de 98,8% na segunda. Nota-se que houve ganhos em relação ao algoritmo de Árvore de decisão, observar o repositório Decision_Tree disponível nesse perfil.