La formation aux statistiques et à la science des données doit inclure un éventail de données réalistes afin de préparer les étudiants au monde réel. R permet d'accéder facilement à une collection incroyablement riche d'ensembles de données.

Cette activité présente les moyens d'accéder à des données réelles pour les utiliser dans R-Instat. 

Regardez d'abord la vidéo : 

Le scénario de la vidéo a été préparé par Rachel Kirk-Gushowaty et Roger Stern. La vidéo a été construite et réalisée par Beryl Waswa.

  • 0:00 Introduction 
  • 01:17 Introduction à R-Instat 
  • 01:34 Ensembles de données générales 
  • 02:00 Données sur les diamants 
  • 02:55 Graphiques 
  • 04:08 mydata données 
  • 05:28 données de l'efc 
  • 06:24 happy data 
  • 06:57 Ensembles de données pour des points spécifiques 
  • 07:22 Données Anscombe 
  • 07:53 Ensemble de données Datasaurusdozen 
  • 08:09 Graphiques 
  • 09:25 Ensemble de données sur le paradoxe des Simpsons 
  • 11:34 Explication du paradoxe des Simpsons par Wikipédia 
  • 12:18 Ensemble de données UCBAdmissions 
  • 12:47 Ensembles de données provenant de livres 
  • 12:53 Introduction à la science des données 
  • 13:41 Données d'évaluation des films 
  • 14:04 ensembles de données dslabs 
  • 14:47 Ensembles de données provenant de références bibliographiques 
  • 15:39 Données sur l'agriculture 
  • 16:35 Gomezsplitssplit dataset 
  • 16:51 Graphiques 
  • 17:45 Données provenant de listes 
  • 18:47 Données provenant d'autres paquets R : Les données MICS 
  • 20:19 Réflexions
Utilisez ensuite ce document d'entraînement pour suivre une partie ou la totalité de l'activité. 

Tout un monde de données Document de pratique

Toutes ces données sont facilement accessibles via la boîte de dialogue Importer à partir de la bibliothèque : 


Il vous suffit d'utiliser le menu déroulant pour sélectionner le package, puis l'ensemble de données que vous souhaitez explorer. Cliquez sur le bouton R Help pour en savoir plus sur les données ou cliquez sur OK pour les ouvrir. 

Paquet Ensemble de données
Agricolae :          
Agridat : split.split.
Agritutorial :  
datasauRus : datasaurus_dozen,   simpsons_paradox. 
des ensembles de données : anscombe, Admission à l'UCBA.
dslabs : movielens, historic_co2, divorce_margarine,   meurtres,   trump_tweets.
ggplot2 : diamants.
openair : mes données.
questionneur : heureux.
sjlabelled : efc.

Les données des listes, issues du paquet rcorpora, sont accessibles via la boîte de dialogue New Data Frame.

 

A partir de là, vous pouvez utiliser les listes déroulantes pour parcourir les catégories disponibles et les listes à l'intérieur de chacune d'entre elles.