Vidéo: Tutoriel 03 R - Lire des données au format CSV ou TXT 2025
Malgré le fait que les fichiers CSV (valeurs séparées par des virgules) sont très largement utilisés pour importer et exporter des données dans R, ils ne sont pas toujours le format le plus approprié. Certains formats de données permettent la spécification de données qui ne sont pas de nature tabulaire. D'autres formats de données permettent la description des données en utilisant métadonnées (données qui décrivent les données).
La distribution de base de R inclut un paquet appelé foreign qui contient des fonctions permettant d'importer des fichiers de données à partir d'un certain nombre de paquets statistiques commerciaux, notamment SPSS, Stata, SAS, Octave et Minitab.
Pour utiliser ces fonctions, vous devez d'abord charger le paquetage étranger:
library (foreign)> read. spss (file = "location / of / myfile")
Lecture du fichier | Fonction à importer vers R |
---|---|
SPSS | . spss |
SAS | lu. xport ou lire. ssd |
Stata | lire. dta |
Minitab | lire. mtp |
Lisez attentivement la documentation d'aide sur ces fonctions. Étant donné que les trames de données dans R peuvent avoir une structure très différente de celle des ensembles de données dans les packages statistiques, vous devez accorder une attention particulière à la façon dont ces fonctions traitent les étiquettes de valeurs et de variables. Vérifiez également le traitement des valeurs manquantes spéciales.
Ces fonctions nécessitent un format de fichier spécifique. La fonction a lu. xport () ne fonctionne qu'avec le format XPORT de SAS. Pour lire. mtp (), le fichier doit être au format feuille de calcul portable Minitab (.mtp).
Notez que certaines de ces fonctions sont plutôt anciennes. Les dernières versions des paquets statistiques mentionnés ici peuvent avoir des spécifications différentes pour le format, donc les fonctions ne sont pas toujours garanties pour fonctionner.
Enfin, notez que certaines de ces fonctions nécessitent l'installation du paquet statistique lui-même sur votre ordinateur. Le lire. La fonction ssd (), par exemple, ne peut fonctionner que si SAS est installé.
La ligne du bas: Si vous pouvez transférer des données en utilisant des fichiers CSV, vous vous épargnerez beaucoup de problèmes.
Enfin, si vous avez besoin de connecter R à une base de données, les chances sont qu'il existe un paquet qui peut se connecter à la base de données de votre choix. Voir la barre latérale voisine, "Travailler avec des bases de données dans R", pour certains pointeurs.
