Página
A Whole World of Data
A formação em estatística e ciência dos dados deve incluir uma série de dados realistas para preparar os estudantes para o mundo real. O R fornece acesso fácil a uma coleção incrivelmente rica de conjuntos de dados.
Esta atividade apresenta formas de aceder a dados reais para utilizar no R-Instat.
Primeiro, veja o vídeo:
Guião do vídeo preparado por Rachel Kirk-Gushowaty e Roger Stern. Vídeo construído e com voz de Beryl Waswa.
- 0:00 Introdução
- 01:17 Introdução ao R-Instat
- 01:34 Conjuntos de dados gerais
- 02:00 Dados sobre os diamantes
- 02:55 Gráficos
- 04:08 mydata dados
- 05:28 dados efc
- 06:24 dados felizes
- 06:57 Conjuntos de dados para pontos específicos
- 07:22 Dados de Anscombe
- 07:53 Conjunto de dados do Datasaurusdozen
- 08:09 Gráficos
- 09:25 Conjunto de dados do paradoxo dos Simpsons
- 11:34 Explicação da Wikipédia sobre o paradoxo dos Simpsons
- 12:18 Conjunto de dados UCBAdmissions
- 12:47 Conjuntos de dados de livros
- 12:53 Livro de introdução à ciência dos dados
- 13:41 Dados de classificação de filmes
- 14:04 conjuntos de dados dslabs
- 14:47 Conjuntos de dados de referências de livros
- 15:39 Dados agrícolas
- 16:35 Conjunto de dados Gomezsplitssplit
- 16:51 Gráficos
- 17:45 Dados das listas
- 18:47 Dados de pacotes R externos: Os dados do MICS
- 20:19 Reflexões
Em seguida, utilize este documento prático para acompanhar partes de toda a atividade.
Todos estes dados são facilmente acessíveis através da caixa de diálogo Importar da biblioteca:

Basta utilizar o menu pendente para selecionar o pacote e, em seguida, escolher o conjunto de dados que pretende explorar. Clique no botão Ajuda do R para obter mais informações sobre os dados ou clique em OK para os abrir.
| Embalagem | Conjunto de dados | ||||
|---|---|---|---|---|---|
| Agricolae: | |||||
| Agridat: | dividir.dividir. | ||||
| Agritutorial: | |||||
| datasauRus: | datasaurus_dozen, | simpsons_paradox. | |||
| conjuntos de dados: | anscombe, | UCBAdmissions. | |||
| dslabs: | movielens, | histórico_co2, | margarina_divórcio, | assassinatos, | trump_tweets. |
| ggplot2: | diamantes. | ||||
| openair: | meus dados. | ||||
| questionador: | feliz. | ||||
| sjlabelled: | efc. |
Os dados das listas, do pacote rcorpora, são acedidos através da caixa de diálogo New Data Frame.
A partir daqui, pode utilizar as listas pendentes para navegar pelas categorias disponíveis e pelas listas dentro de cada uma delas.