Capítulo 6 Visualizando os dados
Para visualizar os dados, usamos a biblioteca ggplot2()
também da gramática Tidyverse.
Após organizar e manipular os dados e fazer análises descritivas, é uma boa estratégia apresentar as informações em gráficos para evidenciar padrões, tendências e comparações. Conforme visto anteriormente, a biblioteca para plotar gráficos é a ggplot()
. A biblioteca ggthemes()
permite aplicar alguns temas já pré-estabelecidos.
O ggplot()
é uma biblioteca que constrói os gráficos em camadas. Primeiramente, define-se a “folha” com uma base de dados que será usada; em seguida, a geometria e os demais parâmetros dos gráficos.
O comando básico do ggplot() é: ggplot(data = dados, aes(x = Explicativa, y = Resposta)) + geoma + ...
Tipos de geometrias disponíveis:
- Histograma:
geom_hist()
- Barras:
geom_bar()
- Pontos:
geom_point()
- Diagrama de caixa (boxplot):
geom_boxplot()
- Linhas:
geom_line()
O guia do ggplot()
pode ser encontrado aqui. Nesta galeria, podem ser encontrados diversos exemplos de gráficos para se inspirar.
Veja uns exemplos abaixo:
Exemplo 1: plotar um gráfico de densidade da variável idade:
Exemplo 2: aqui, reproduzimos o mapa cultural de Inglehart e Welzel (2005) para alguns países. Antes, é preciso fazer algumas manipulações com os dados com o que aprendemos nos capítulos anteriores.
# Criar uma lista com os países que se quer analisar
# 76=Brasil, 32=Chile, 152=Argentina, 170=Colombia
paises <- c(76, 32, 152, 170)
# Extrair e retrabalhar as variáveis que precisamos
# select() para selecionar as variáveis de interesse
# filter() para filtrar usando o vetor 'países' criado acima
# group_by() para agrupar por onda-país, onda e país
# summarise() para agregar os dados pela média
df_y001 <- df_wvs7 %>%
select(S024, S020, S003, tradrat5, survself) %>%
filter(S003 %in% paises) %>%
group_by(S024, S020, S003) %>%
summarise(tradrat5 = mean(tradrat5, na.rm = T),
survself = mean(survself, na.rm = T))
Feito isso podemos criar a figura:
Lembre-se que o ggplot
usa o símbolo +
para adicionar cada um dos elementos da figura.
# lembre se de carregar a variável ggplot se ela não tiver sido carregada
library(ggplot2)
# Reproduzir o Mapa Cultural Inglehart
ggplot(df_y001, aes(x = survself,
y = tradrat5,
color = as.factor(S003),
label = as.factor(S003))) +
# definir os dados e as dimensões
geom_point() + # geometria pontos
geom_text(hjust = 0, nudge_x = 0.05, check_overlap = TRUE) + # rótulos dos pontos
scale_x_continuous(limits = c(-2, 2)) + # restringe eixo x e y entre -2 e 2
scale_y_continuous(limits = c(-2, 2)) +
labs(x = "sobrevivencia-autoexpressão",
y = "tradicional-racional",
title = "Mapa Cultural do Inglehart (Brasil, Chile, Argentina, Colombia)") # rótulos do gráfico x, y e título