Vidéo: Food for thought: How your belly controls your brain | Ruairi Robertson | TEDxFulbrightSantaMonica 2025
Quand on parle de reformater des données dans R, il est important de reconnaître les données dans des formats longs et larges. Ces métaphores visuelles décrivent deux façons de représenter la même information. Il est utile de connaître ces formats lors de l'utilisation de R.
Vous pouvez reconnaître des données en format large du fait que les colonnes représentent généralement des groupes. Donc, notre exemple de jeux de basketball est en format large, car il y a une colonne pour les paniers faits par chacun des participants:
Lieu de jeu Granny Geraldine Gertrude 1 1 Bruges 12 5 11 2 2e Gand 4 4 5 3 3e Gand 5 2 6 4 4e Bruges 6 4 7
En revanche, jetez un oeil à la longue Format de exactement les mêmes données:
Jeu Venue valeur variable 1 1er Bruges Granny 12 2 2e Gand Granny 4 3 3e Granny Granny 5 4 4ème Bruges Granny 6 5 1er Bruges Geraldine 5 6 2e Gand Geraldine 4 7 3e Gand Geraldine 2 8 4e Bruges Geraldine 4 9 1er Bruges Gertrude 11 10 2e Ghent Gertrude 5 11 3e Gand Gertrude 6 12 4e Bruges Gertrude 7
Remarquez comment, dans le long format, les trois colonnes pour Mémé, Géraldine et Gertrude ont disparu. À leur place, vous avez maintenant une colonne appelée valeur qui contient le score réel, et une colonne appelée variable qui relie le score à l'une des trois dames.
Lors de la conversion de données entre formats longs et larges, il est important de pouvoir distinguer les variables d'identifiants des variables mesurées:
-
Variables d'identification: Identifiant, ou ID, les variables identifient les observations. Pensez à ceux-ci comme la clé qui identifie vos observations. (Dans la conception de la base de données, elles sont appelées clés primaires ou secondaires.)
-
Variables mesurées: Ceci représente les mesures que vous avez observées.
Dans notre exemple, les variables identificatrices sont Game et Venue, alors que les variables mesurées sont les goals (c'est-à-dire les colonnes Granny, Geraldine et Gertrude).
