Vidéo: [Tuto] Comment faire le meilleur export sur Première Pro ? 2025
Si vous avez un ensemble de données en fusion (un ensemble de données en format long), vous êtes prêt à le remodeler avec R. Pour illustrer que le processus de remodelage conserve toutes vos données intactes, essayez de reconstruire l'original: >> dcast (mgoals, Venue + Game ~ variable, somme) Lieu de jeu Granny Geraldine Gertrude 1 1 Bruges 12 5 11 2 2e Gand 4 4 5 3 3ème Gand 5 2 6 4 4ème Bruges 6 4 7
Pouvez-vous voir comment dcast () prend une formule comme deuxième argument? Plus à ce sujet dans une minute, mais d'abord inspecter vos résultats. Cela devrait correspondre au cadre de données original.
Vous utilisez la fonction dcast () pour lancer une trame de données en fusion. Pour être clair, vous l'utilisez pour convertir un format long en un format large, mais vous pouvez également l'utiliser pour agréger dans des formats intermédiaires, similaire au fonctionnement d'un tableau croisé dynamique.
La fonction dcast () prend trois arguments:
-
: Une trame de données en fusion. formula
-
: Formule qui spécifie comment vous souhaitez convertir les données. Cette formule prend la forme x_variable ~ y_variable. Mais il est simplifié pour faire un point. Vous pouvez utiliser plusieurs variables x , plusieurs variables y et même z . amusant. aggregate
-
: Fonction à utiliser si la formule de conversion aboutit à l'agrégation de données (par exemple, longueur (), somme () ou moyenne ()).
Si vous voulez obtenir une table avec le lieu descendant les lignes et le joueur à travers les colonnes, votre formule de casting devrait être Venue ~ variable: >> dcast (mgoals, Venue ~ variable, somme) Lieu Granny Geraldine Gertrude 1 Bruges 18 9 18 2 Gand 9 6 11
Il est en effet possible d'avoir des formules de moulage plus compliquées. Selon la page d'aide de dcast (), la formule de conversion prend ce format:
x_variable + x_2 ~ y_variable + y_2 ~ z_variable ~ …
Notez que vous pouvez combiner plusieurs variables dans chaque dimension avec le signe plus (+), et vous séparez chaque dimension avec un tilde (~). En outre, si vous avez deux ou plusieurs tildes dans la formule (c'est-à-dire que vous incluez une variable
z
), votre résultat sera un tableau multidimensionnel.
Donc, pour obtenir un résumé des objectifs par Lieu, joueur (variable), et Jeu, vous faites ce qui suit: >> dcast (mgoals, Venue + variable ~ Jeu, somme) Lieu variable 1er 2nd 3rd 4th 1 Bruges Mamie 12 0 0 6 2 Bruges Geraldine 5 0 0 4 3 Bruges Gertrude 11 0 0 7 4 Gand Mamie 0 4 5 0 5 Gand Geraldine 0 4 2 0 6 Ghent Gertrude 0 5 6 0 Une des raisons pour lesquelles vous devriez comprendre les données en format long est que les deux paquets graphiques lattice et ggplot2 utilisent largement les données de format long.L'avantage est que vous pouvez facilement créer des graphiques de vos données qui comparent différents sous-groupes.
