La formación en estadística y ciencia de datos debe incluir una serie de datos realistas para preparar a los estudiantes para el mundo real. R facilita el acceso a una colección increíblemente rica de conjuntos de datos.

Esta actividad presenta formas de acceder a datos reales para utilizarlos en R-Instat. 

Primero mira el vídeo: 

Guión del vídeo preparado por Rachel Kirk-Gushowaty y Roger Stern. Vídeo construido y locutado por Beryl Waswa.

  • 0:00 Introducción 
  • 01:17 Introducción a R-Instat 
  • 01:34 Conjuntos de datos generales 
  • 02:00 Datos sobre los diamantes 
  • 02:55 Gráficos 
  • 04:08 mydata datos 
  • 05:28 datos efc 
  • 06:24 datos felices 
  • 06:57 Conjuntos de datos para puntos específicos 
  • 07:22 Datos de Anscombe 
  • 07:53 Conjunto de datos Datasaurusdozen 
  • 08:09 Gráficos 
  • 09:25 Conjunto de datos de la paradoja de los Simpson 
  • 11:34 Wikipedia explica la paradoja de los Simpson 
  • 12:18 Conjunto de datos UCBAdmissions 
  • 12:47 Conjuntos de datos de libros 
  • 12:53 Libro Introducción a la ciencia de datos 
  • 13:41 Datos de audiencia de las películas 
  • 14:04 dslabs conjuntos de datos 
  • 14:47 Conjuntos de datos de referencias de libros 
  • 15:39 Datos agrícolas 
  • 16:35 Gomezsplitssplit conjunto de datos 
  • 16:51 Gráficos 
  • 17:45 Datos de las listas 
  • 18:47 Datos de paquetes R externos: Los datos de MICS 
  • 20:19 Reflexiones
A continuación, utiliza este documento de prácticas para seguir parte de toda la actividad. 

Todo un mundo de datos Documento práctico

Todos estos datos son fácilmente accesibles a través del cuadro de diálogo Importar desde biblioteca: 


Sólo tiene que utilizar el menú desplegable para seleccionar el paquete y, a continuación, elegir el conjunto de datos que desea explorar. Haga clic en el botón Ayuda de R para obtener más información sobre los datos o haga clic en Aceptar para abrirlos. 

Paquete Conjunto de datos
Agricolae:          
Agridat: split.split.
Agritutorial:  
datasauRus: datasaurus_dozen,   simpsons_paradox. 
conjuntos de datos: anscombe, UCBAdmisiones.
dslabs: movielens, historic_co2, divorcio_margarina,   asesinatos,   trump_tweets.
ggplot2: diamantes.
al aire libre: misdatos.
questionr: feliz.
sjlabelled: efc.

Se accede a los datos de las listas, del paquete rcorpora, a través del cuadro de diálogo Nuevo marco de datos.

 

Desde aquí puede utilizar las listas desplegables para navegar por las categorías disponibles y las listas dentro de cada una de ellas.