Page
A Whole World of Data
La formation aux statistiques et à la science des données doit inclure un éventail de données réalistes afin de préparer les étudiants au monde réel. R permet d'accéder facilement à une collection incroyablement riche d'ensembles de données.
Cette activité présente les moyens d'accéder à des données réelles pour les utiliser dans R-Instat.
Regardez d'abord la vidéo :
Le scénario de la vidéo a été préparé par Rachel Kirk-Gushowaty et Roger Stern. La vidéo a été construite et réalisée par Beryl Waswa.
- 0:00 Introduction
- 01:17 Introduction à R-Instat
- 01:34 Ensembles de données générales
- 02:00 Données sur les diamants
- 02:55 Graphiques
- 04:08 mydata données
- 05:28 données de l'efc
- 06:24 happy data
- 06:57 Ensembles de données pour des points spécifiques
- 07:22 Données Anscombe
- 07:53 Ensemble de données Datasaurusdozen
- 08:09 Graphiques
- 09:25 Ensemble de données sur le paradoxe des Simpsons
- 11:34 Explication du paradoxe des Simpsons par Wikipédia
- 12:18 Ensemble de données UCBAdmissions
- 12:47 Ensembles de données provenant de livres
- 12:53 Introduction à la science des données
- 13:41 Données d'évaluation des films
- 14:04 ensembles de données dslabs
- 14:47 Ensembles de données provenant de références bibliographiques
- 15:39 Données sur l'agriculture
- 16:35 Gomezsplitssplit dataset
- 16:51 Graphiques
- 17:45 Données provenant de listes
- 18:47 Données provenant d'autres paquets R : Les données MICS
- 20:19 Réflexions
Utilisez ensuite ce document d'entraînement pour suivre une partie ou la totalité de l'activité.
Toutes ces données sont facilement accessibles via la boîte de dialogue Importer à partir de la bibliothèque :

Il vous suffit d'utiliser le menu déroulant pour sélectionner le package, puis l'ensemble de données que vous souhaitez explorer. Cliquez sur le bouton R Help pour en savoir plus sur les données ou cliquez sur OK pour les ouvrir.
| Paquet | Ensemble de données | ||||
|---|---|---|---|---|---|
| Agricolae : | |||||
| Agridat : | split.split. | ||||
| Agritutorial : | |||||
| datasauRus : | datasaurus_dozen, | simpsons_paradox. | |||
| des ensembles de données : | anscombe, | Admission à l'UCBA. | |||
| dslabs : | movielens, | historic_co2, | divorce_margarine, | meurtres, | trump_tweets. |
| ggplot2 : | diamants. | ||||
| openair : | mes données. | ||||
| questionneur : | heureux. | ||||
| sjlabelled : | efc. |
Les données des listes, issues du paquet rcorpora, sont accessibles via la boîte de dialogue New Data Frame.
A partir de là, vous pouvez utiliser les listes déroulantes pour parcourir les catégories disponibles et les listes à l'intérieur de chacune d'entre elles.