Vidéo: Tutoriel 05 Bis R - Manipuler une table de données (data frame) 2025
La première décision à prendre avant d'analyser vos données est de savoir comment représenter ces données dans R. Si vos données n'ont qu'une dimension, alors vous savez déjà que les vecteurs représentent très bien ce type de données. Toutefois, si vos données comportent plusieurs dimensions, vous pouvez choisir d'utiliser des matrices, des listes ou des blocs de données. Donc, la question est: Quand utilisez-vous quoi?
Les matrices et les tableaux de plus grande dimension sont utiles lorsque toutes vos données appartiennent à une même classe. En d'autres termes, toutes vos données sont numériques ou toutes vos données sont des caractères. Si vous êtes un mathématicien ou un statisticien, vous connaissez les matrices et utilisez très souvent ce type d'objet.
Mais dans de nombreuses situations pratiques, vous aurez des données qui ont beaucoup de classes différentes - en d'autres termes, vous aurez un mélange de données numériques et de caractères. Dans ce cas, vous devez utiliser des listes ou des trames de données.
Si vous imaginez vos données sous la forme d'une seule feuille de calcul, une trame de données est probablement un bon choix. Rappelez-vous qu'une trame de données est simplement une liste de vecteurs nommés de la même longueur, qui est conceptuellement très similaire à une feuille de calcul avec des colonnes et un en-tête de colonne pour chacun.
Si vous connaissez les bases de données, vous pouvez considérer une trame de données comme similaire à une seule table dans une base de données. Les trames de données sont extrêmement utiles et, dans de nombreux cas, seront votre premier choix d'objets pour stocker vos données.
Si vos données sont constituées d'une collection d'objets mais que vous ne pouvez pas les représenter comme un tableau ou une trame de données, alors une liste est votre choix idéal. Comme les listes peuvent contenir toutes sortes d'autres objets, y compris d'autres listes ou cadres de données, elles sont extrêmement flexibles. Par conséquent, R dispose d'une grande variété d'outils pour traiter les listes.
Vous trouverez peut-être qu'une trame de données est un choix très approprié pour la plupart des tâches d'analyse et de traitement de données. C'est un moyen très pratique de représenter vos données, et c'est similaire à travailler avec des tables de base de données. Lorsque vous lisez des données à partir d'un fichier CSV (valeurs séparées par des virgules) avec la fonction read. csv () ou lire. table (), R place les résultats dans une trame de données.
Objet | Description | Commentaires |
---|---|---|
vecteur | Objet de données de base dans R, constitué d'une ou de plusieurs valeurs
d'un seul type (par exemple, caractère, nombre ou entier). |
Considérez ceci comme une seule colonne ou ligne dans une feuille de calcul, ou une colonne
dans une table de base de données. |
matrice ou tableau | Objet multidimensionnel d'un seul type (connu sous le nom
atomique ). Une matrice est un tableau de deux dimensions. |
Lorsque vous devez stocker des nombres dans plusieurs dimensions, utilisez des tableaux
. |
list | Les listes peuvent contenir des objets de n'importe quel type. | Les listes sont très utiles pour stocker des collections de données
. Parce que les listes peuvent contenir des listes, ce type d'objet est très utile. |
données. frame | Les trames de données sont un type particulier de liste nommée où tous les éléments
ont la même longueur. |
Les blocs de données sont similaires à une seule feuille de calcul ou à une table
dans une base de données. |
