Capítulo 4 Importando bases de dados

Utilizando o RStudio, pode-se abrir arquivos salvos no formato do próprio R (.RData) e de variados outros softwares, como Excel(.xlsx), SPSS (.sav) e Stata (.dta), e em diversos outros formatos, incluindo texto e csv.

Há duas formas de abrir arquivos de dados no RStudio:

  • Com o uso do painel “Environment”, ou
  • Com o uso de linhas de comando escritas diretamente no Console ou em um script

4.1 Com o uso das ferramentas da aba “Environment”

Por essa forma, você usa as ferramentas do R do mesmo jeito que faz com qualquer outro software, como os do pacote Microsoft Office, por exemplo.

4.1.1 Arquivos em formato R

Para arquivos formato R (formato .RData):

  • Na aba “Environment”, clique sobre o icone “Abrir Arquivos”.
  • Procure o seu arquivo nos locais do seu computador.
  • Clique no arquivo e clique em Open ou clique duas vezes sobre o arquivo.

Pronto! O seu arquivo vai aparecer no Environment.

4.1.2 Arquivos em outros formatos

Para importar os dados em outros formatos, é preciso ter bibliotecas específicas para esse fim. Neste tutorial, sugerimos que você tenha instalada e carregada a biblioteca haven, da gramática Tidyverse (veja em bibliotecas).

  • Clique sobre o icone Import Dataset.
  • Escolha e clique sobre o formato em que o seu arquivo foi previamente salvo.
  • Clique em Browse.
  • Procure o seu arquivo nos locais do seu computador.
  • Clique no arquivo e clique em Open ou clique duas vezes sobre o arquivo.

Pronto! O seu arquivo vai aparecer no Environment.

4.2 Com o uso de linhas de comando

4.2.1 Arquivos em formato R

Para carregar arquivos no formato nativo do R usando linhas de comando:

  • Abra um novo script R e digite: load("nome_do_arquivo.rdata").
    • Dica: Deixe o cursor entre as aspas e tecle TAB. O R vai lhe mostrar os diretórios do seu computador. Se seu arquivo está em alguma pasta ou subpasta o R também vai lhe mostrar esses locais.
  • Clique no arquivo que você quer importar
  • Digite Control + Enter, ou clique em Run (disponível na aba superior do Source Code do seu R).

Pronto! O seu arquivo vai aparecer no Environment.

4.2.2 Arquivos em outros formatos

Para importar os dados em outros formatos, é preciso ter bibliotecas específicas para esse fim. Neste tutorial, sugerimos que você tenha instalada e carregada a biblioteca haven da gramática Tidyverse (veja em bibliotecas).

Cada tipo de arquivo tem um comando específico na biblioteca haven:

Arquivos SPSS: função read_sav()
Arquivos Excel: função read_csv()
Arquivos Stata: função read_dta()
Arquivos SAS: função read_sas()

Para que a base se transforme em um objeto no Environment do R, é preciso que se atribua um nome a ele. Veja este exemplo com a extensão do SPSS (arquivos em formato .sav):

# carregar a biblioteca haven
library(haven)

# abrir usando a função e criar um objeto no ambiente R
base_do_wvs <- read_sav("diretório_do_projeto/nome_do_arquivo.sav")

Como dito na dica anteriormente, deixe o cursor entre as aspas e tecle TAB. O R vai lhe mostrar os diretórios do seu computador. Em seguida, é só clicar sobre o arquivo que você procura.

  • Tecle Control + Enter, ou
  • Clique em Run (disponível na aba superior do Source Code do seu R).

Pronto! O seu arquivo vai aparecer no Environment.

Com outras extensões você usará, por exemplo, read_cvs() ou read_dta(). Para mais informações acesse a ajuda da bibliteca haven

4.3 Gerando um dicionário de variáveis

Para navegar na base de dados recém importada e reconhecer as variáveis importadas e suas características, existem diversas ferramentas disponíveis.

Uma delas é o pacote codebook, que gera um dicionário de variáveis. Nos exemplos abaixo, mostramos como gerar um dicionário de variáveis estático na aba “Preview” e também na forma de um objeto que pode ser visualizado como uma tabela.

Para carregar a biblioteca codebook e gerar um dicionário de variáveis estático navegável na aba “Preview”, gerar uma tabela e visualisá-la use os comandos abaixo:

# carregar a biblioteca codebook
library(codebook)

# gerar um dicionário de variáveis estático navegável na aba "Preview"
label_browser_static(base_do_wvs)

# gerar uma tabela com todas as variávis
dicionario <- codebook_table(base_do_wvs)

# visualizar na forma de tabela junto aos scripts R
view(dicionario)

Feita a importação da base de dados e com o dicionário em mãos, podemos passar a descrição, análise e visualização dos dados.