-
Notifications
You must be signed in to change notification settings - Fork 18
Expand file tree
/
Copy pathCodigo-cap4.R
More file actions
83 lines (63 loc) · 2.02 KB
/
Codigo-cap4.R
File metadata and controls
83 lines (63 loc) · 2.02 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
##### Pré-processamento de dados
## Importação de Dados
# Lê de um arquivo ou URL e armazena o resultado em um novo data frame dados
dados <- read.table(
'https://raw.githubusercontent.com/tatianaesc/datascience/main/iris.csv',
sep=',', header=T
)
# mostra o tipo do objeto
class(dados)
# mostra a distribuição de cada variável do dataset
summary(dados)
# mostra quantas linhas e colunas há nos dados
dim(dados)
dados2 <- read.table(“iris.csv”, sep=',', header=T)
dados3 <- iris
## Análise Exploratória
# cria um histograma para cada atributo
par(mfrow=c(1,4))
for(i in 1:4) {
hist(dados[,i], main=names(dados)[i])
}
# carrega o pacote
library(lattice)
# cria um gráfico de densidade para cada atributo
par(mfrow=c(1,4))
for(i in 1:4) {
plot(density(dados[,i]), main=names(dados)[i])
}
# cria um boxplot para cada atributo
par(mfrow=c(1,4))
for(i in 1:4) {
boxplot(dados[,i], main=names(dados)[i])
}
# instala e carrega o pacote
install.packages("corrplot")
library(corrplot)
# calcula as correlações
correlations <- cor(dados[,1:4])
# cria o gráfico de correlação
corrplot(correlations, method="circle")
# cria um gráfico de dispersão para cada um dos pares de atributos
pairs(dados[1:4])
# colore o gráfico de dispersão por classes
pairs(dados[1:4], pch=21, bg=c("red", "green3", "blue")[iris$Species])
# instala e carrega o pacote
install.packages("caret")
library(caret)
# cria um gráfico de densidade para cada atributo, separado por classe
x <- dados[,1:4]
y <- iris$Species
escalas <- list(x=list(relation="free"), y=list(relation="free"))
featurePlot(x=x, y=y, plot="density", scales=escalas)
# cria um boxplot cada atributo, separado por classe
featurePlot(x=x, y=y, plot="box")
## Preparação e Limpeza
# carrega os dados do banco de crédito alemão
dados4 <- read.table('custdata.tsv',header = T,sep = '\t')
summary(dados4)
# normaliza os dados de idade dos clientes
summary(dados4$age)
idadeMedia <- mean(dados4$age)
dados4$age.normalized <- dados4$age/idadeMedia
summary(dados4$age.normalized)