Table des matières:
- Comment faire de l'arithmétique sur des colonnes de une trame de données
- La fonction with () vous permet de faire référence à des colonnes dans un bloc de données sans utiliser explicitement le symbole dollar ou même le nom de la trame de données elle-même. Donc, dans notre exemple, parce que vous utilisez avec (iris, …) R sait évaluer les deux Sepal. Longueur et Sepal. Largeur dans le contexte de l'iris.
Vidéo: Ms Access - Requête par année et mois (dates) 2025
Après avoir créé le sous-ensemble approprié de vos données, l'étape suivante de votre analyse sera probablement d'effectuer quelques calculs avec R.
Comment faire de l'arithmétique sur des colonnes de une trame de données
R rend très facile l'exécution de calculs sur des colonnes d'une trame de données car chaque colonne est elle-même un vecteur. S'en tenir à la trame de données de l'iris, essayez de faire quelques calculs sur les colonnes. Par exemple, calculer le rapport entre les longueurs et la largeur des sépales:
Vous pouvez maintenant utiliser tous les outils R pour examiner votre résultat. Par exemple, inspectez les cinq premiers éléments de vos résultats avec la fonction head (): >> head (x) [1] 1. 457143 1. 633333 1. 468750 1. 483871 1. 388889 1. 384615
Comme vous pouvez le voir, effectuer des calculs sur les colonnes d'une trame de données est simple. Gardez juste à l'esprit que chaque colonne est vraiment un vecteur, donc vous devez simplement vous rappeler comment effectuer des opérations sur des vecteurs.
Comment utiliser avec et pour améliorer la lisibilité du code
Après un court moment d'écriture d'instructions dans R, vous serez fatigué de taper le symbole du dollar pour extraire les colonnes d'une trame de données. Heureusement, il existe un moyen de réduire la quantité de frappe et de rendre votre code beaucoup plus lisible en même temps. L'astuce consiste à utiliser la fonction with (). Essayez ceci: >> y <- avec (iris, Sepal. Length / Sepal. Width)La fonction with () vous permet de faire référence à des colonnes dans un bloc de données sans utiliser explicitement le symbole dollar ou même le nom de la trame de données elle-même. Donc, dans notre exemple, parce que vous utilisez avec (iris, …) R sait évaluer les deux Sepal. Longueur et Sepal. Largeur dans le contexte de l'iris.
J'espère que vous êtes d'accord pour dire que c'est beaucoup plus facile à lire et à comprendre. En imprimant les valeurs de votre nouvelle variable y, vous pouvez confirmer qu'elle est identique à x dans l'exemple précédent. >> head (y) [1] 1. 457143 1. 633333 1. 468750 1. 483871 1. 388889 1. 384615
Vous pouvez également utiliser la fonction identique () pour que R vous indique si ces valeurs sont, en fait, les mêmes:
En plus de with (), la fonction within () vous permet d'attribuer très facilement des valeurs aux colonnes de vos données. Supposons que vous souhaitiez ajouter votre ratio calculé de longueur de sépale à la largeur du cadre de données d'origine. Vous êtes déjà familier avec l'écriture comme ceci: >> iris $ ratio <- iris $ Sepal. Longueur / iris $ Sepal. Largeur
Maintenant, en utilisant within (), il devient:
Cela fonctionne de manière très similaire à avec (), sauf que vous pouvez utiliser l'opérateur assign (<-) dans votre fonction. Si vous regardez maintenant la structure de l'iris, vous remarquerez que le ratio est une colonne:
tête (iris $ ratio) [1] 1. 457143 1. 633333 1. 468750 1. 483871 1. 388889 1. 384615
