A formação em estatística e ciência dos dados deve incluir uma série de dados realistas para preparar os estudantes para o mundo real. O R fornece acesso fácil a uma coleção incrivelmente rica de conjuntos de dados.

Esta atividade apresenta formas de aceder a dados reais para utilizar no R-Instat. 

Primeiro, veja o vídeo: 

Guião do vídeo preparado por Rachel Kirk-Gushowaty e Roger Stern. Vídeo construído e com voz de Beryl Waswa.

  • 0:00 Introdução 
  • 01:17 Introdução ao R-Instat 
  • 01:34 Conjuntos de dados gerais 
  • 02:00 Dados sobre os diamantes 
  • 02:55 Gráficos 
  • 04:08 mydata dados 
  • 05:28 dados efc 
  • 06:24 dados felizes 
  • 06:57 Conjuntos de dados para pontos específicos 
  • 07:22 Dados de Anscombe 
  • 07:53 Conjunto de dados do Datasaurusdozen 
  • 08:09 Gráficos 
  • 09:25 Conjunto de dados do paradoxo dos Simpsons 
  • 11:34 Explicação da Wikipédia sobre o paradoxo dos Simpsons 
  • 12:18 Conjunto de dados UCBAdmissions 
  • 12:47 Conjuntos de dados de livros 
  • 12:53 Livro de introdução à ciência dos dados 
  • 13:41 Dados de classificação de filmes 
  • 14:04 conjuntos de dados dslabs 
  • 14:47 Conjuntos de dados de referências de livros 
  • 15:39 Dados agrícolas 
  • 16:35 Conjunto de dados Gomezsplitssplit 
  • 16:51 Gráficos 
  • 17:45 Dados das listas 
  • 18:47 Dados de pacotes R externos: Os dados do MICS 
  • 20:19 Reflexões
Em seguida, utilize este documento prático para acompanhar partes de toda a atividade. 

Um mundo inteiro de dados Documento prático

Todos estes dados são facilmente acessíveis através da caixa de diálogo Importar da biblioteca: 


Basta utilizar o menu pendente para selecionar o pacote e, em seguida, escolher o conjunto de dados que pretende explorar. Clique no botão Ajuda do R para obter mais informações sobre os dados ou clique em OK para os abrir. 

Embalagem Conjunto de dados
Agricolae:          
Agridat: dividir.dividir.
Agritutorial:  
datasauRus: datasaurus_dozen,   simpsons_paradox. 
conjuntos de dados: anscombe, UCBAdmissions.
dslabs: movielens, histórico_co2, margarina_divórcio,   assassinatos,   trump_tweets.
ggplot2: diamantes.
openair: meus dados.
questionador: feliz.
sjlabelled: efc.

Os dados das listas, do pacote rcorpora, são acedidos através da caixa de diálogo New Data Frame.

 

A partir daqui, pode utilizar as listas pendentes para navegar pelas categorias disponíveis e pelas listas dentro de cada uma delas.