- Definindo o diretório de trabalho
setwd()
getwd()
# Carregando as bibliotecas
library(plyr)
library(corrplot)
library(ggplot2)
library(gridExtra)
library(ggthemes)
library(caret)
library(MASS)
library(randomForest)
library(party)
library(readr)
data <- read_csv("nome_do_dataset")
data
# Visualizando as 5 primeiras linhas
head(data)
# Visualizando linhas e colunas
str(data)
# Separando em treino e teste
intrain <- createDataPartition(data$Churn,p=0.7,list=FALSE)
set.seed(2017)
# Dados de treino
training <- data[intrain,]
# Dados de teste
testing <- data[-intrain,]
# Visualizando linhas e colunas dos dados de treino
dim(training);
# Visualizando linhas e colunas dos dados de teste
dim(testing)
# Árvore de Decisão
tree <- ctree(data ~ Contract+tenure_group+PaperlessBilling, training)
tree
# Plot da árvore de Decisão
plot(tree, type='simple')
# Precisão da árvore de decisão
p1 <- predict(tree, training)
tab1 <- table(Predicted = p1, Actual = training$Churn)
tab2 <- table(Predicted = pred_tree, Actual = testing$Churn)
print(paste('Decision Tree Accuracy',sum(diag(tab2))/sum(tab2)))
# Confusion Matrix
print("Confusion Matrix Para Random Forest"); table(testing$Churn, pred_rf)