/Big-data-analytics

Big data - Analytics r, python

Primary LanguageJupyter Notebook

Big data analytics R

MIT License GPLv3 License AGPL License author

App Screenshot

Autores

Projetos realizado nesse projeto

  • Análise séries temporais - Previsão preço da ação Vale
  • Big data analytics: Previsão de tempo
  • Modelo de aprendizado de máquina: Análise de rotatividade de clientes
  • Mineração de Regra de Associação
  • Visualizações Interativas
  • Detectando Fraudes em Cartões de Crédito ML
  • Varejo com Market Basket Analysis
  • Modelo análise de sentimento

Exemplo - Machine learning em R

- Definindo o diretório de trabalho
setwd()
getwd()

# Carregando as bibliotecas
library(plyr)
library(corrplot)
library(ggplot2)
library(gridExtra)
library(ggthemes)
library(caret)
library(MASS)
library(randomForest)
library(party)

library(readr)
data <- read_csv("nome_do_dataset")
data 

# Visualizando as 5 primeiras linhas
head(data)

# Visualizando linhas e colunas
str(data)

# Separando em treino e teste
intrain <- createDataPartition(data$Churn,p=0.7,list=FALSE)
set.seed(2017)

# Dados de treino
training <- data[intrain,]

# Dados de teste
testing <- data[-intrain,]

# Visualizando linhas e colunas dos dados de treino
dim(training); 

# Visualizando linhas e colunas dos dados de teste
dim(testing)

# Árvore de Decisão
tree <- ctree(data ~ Contract+tenure_group+PaperlessBilling, training)
tree

# Plot da árvore de Decisão
plot(tree, type='simple')

# Precisão da árvore de decisão
p1 <- predict(tree, training)
tab1 <- table(Predicted = p1, Actual = training$Churn)
tab2 <- table(Predicted = pred_tree, Actual = testing$Churn)
print(paste('Decision Tree Accuracy',sum(diag(tab2))/sum(tab2)))

# Confusion Matrix
print("Confusion Matrix Para Random Forest"); table(testing$Churn, pred_rf)