Table des matières:
Vidéo: R Studio 1ers pas - 3 procédures à effectuer avant d'écrire un script 2025
Un geom ggplot2 dans R indique à l'intrigue comment vous voulez afficher vos données. Par exemple, vous utilisez geom_bar () pour créer un graphique à barres. Dans ggplot2, vous pouvez utiliser une variété de geoms prédéfinis pour créer des types de tracé standard.
Un geom définit la disposition d'une couche ggplot2. Par exemple, il existe des geoms pour créer des diagrammes à barres, des diagrammes de dispersion et des diagrammes linéaires (ainsi qu'une variété d'autres diagrammes).
Chaque geom a une statistique par défaut, et chaque stat a un geom par défaut. En pratique, vous devez en spécifier un seul.
Geom | Description | Valeur par défaut |
---|---|---|
geom_bar () | Diagramme à barres | stat_bin () |
geom_point () | Diagramme de dispersion | stat_identity () |
geom_line () | Diagramme de ligne, reliant les observations en ordre de
x - valeur |
stat_identity () |
geom_boxplot | Trame à moustaches | stat_boxplot () |
geom_path | Diagramme linéaire, reliant les observations dans l'ordre original | stat_identity () |
geom_smooth | Ajouter une moyenne conditionnée lissée | stat_smooth () |
geom_histogram | An alias pour geom_bar () et stat_bin () | stat_bin () |
Comment créer un graphique à barres en utilisant ggplot2 dans R
Pour créer un diagramme à barres, utilisez la fonction geom_bar (). Cependant, notez que la statistique par défaut est stat_bin (), qui est utilisée pour découper vos données dans des chutiers. Ainsi, le comportement par défaut de geom_bar () est de créer un histogramme.
Par exemple, pour créer un histogramme de la profondeur des tremblements de terre dans le jeu de données des séismes, vous devez: >> ggplot (tremblements, aes (x = profondeur)) + geom_bar ()> ggplot (tremblements, aes (x = profondeur)) + geom_bar (binwidth = 50)
Notez que votre mapping ne définit que la variable
x -axis (dans ce cas, quakes $ depth). Un argument utile pour geom_bar () est binwidth, qui contrôle la taille des classes dans lesquelles vos données sont coupées.
Dans l'exemple suivant, vous utilisez aggregate () pour calculer le nombre de tremblements à différentes strates de profondeur: >> tremblements. noms agg (quakes. agg) <- c ("depth", "mag")
Vous pouvez maintenant tracer l'objet tremble. agg avec geom_bar (stat = "identité"): >> ggplot (tremblements, agg, aes (x = profondeur, y = mag)) + + geom_bar (stat = "identité")
En résumé, vous pouvez Utilisez geom_bar () pour créer un histogramme et laissez ggplot2 résumer vos données, ou vous pouvez pré-synthétiser vos données, puis utiliser stat = "identity" pour tracer un graphique à barres.
Comment créer un nuage de points dans ggplot2
Pour créer un nuage de points, utilisez la fonction geom_point ().Un diagramme de dispersion crée des points (ou parfois des bulles ou d'autres symboles) sur votre graphique. Chaque point correspond à une observation dans vos données.
Vous avez probablement vu ou créé ce type de graphique un million de fois, vous savez donc déjà que les nuages de points utilisent le système de coordonnées cartésiennes, où une variable est mappée sur l'axe
x
et une seconde variable est mappé à l'axe
y . De la même manière, dans ggplot2 vous créez un mapping entre les variables x -axis et
y -axis. Ainsi, pour créer un tracé des données de tremblements, vous devez mapper $ quakes à l'axe x et trancher $ lat sur l'axe y : ggplot (tremblements de terre, aes (x = long, y = lat)) + geom_point () Comment créer des graphiques en ligne ggplot2 Pour créer un graphique en courbes, vous utilisez la fonction geom_line (). Vous utilisez cette fonction d'une manière très similaire à geom_point (), avec la différence que geom_line () dessine une ligne entre des points consécutifs dans vos données.
Ce type de graphique est utile pour les données de séries temporelles dans les trames de données, telles que les données de population dans l'ensemble de données intégré longley. Pour créer un graphique linéaire des chiffres du chômage, vous utilisez ce qui suit: >> ggplot (longley, aes (x = Année, y = Sans emploi)) + geom_line ()
