Vidéo: Tutoriel 03 R - Lire des données au format CSV ou TXT 2024
L'un des plus faciles et fiables Les moyens d'obtenir des données dans R consistent à utiliser des fichiers texte, en particulier des fichiers CSV (valeurs séparées par des virgules). Le format de fichier CSV utilise des virgules pour séparer les différents éléments d'une ligne, et chaque ligne de données est dans sa propre ligne dans le fichier texte, ce qui rend les fichiers CSV idéaux pour représenter les données tabulaires.
L'avantage supplémentaire des fichiers CSV est que presque toutes les applications de données prennent en charge l'exportation des données au format CSV. C'est certainement le cas pour la plupart des tableurs, y compris Microsoft Excel et OpenOffice Calc.
Dans les exemples suivants, supposez que vous avez un fichier CSV stocké dans un dossier approprié de votre système de fichiers. Pour convertir une feuille de calcul Excel au format CSV, vous devez sélectionner Fichier → Enregistrer sous, ce qui vous permet de sauvegarder votre fichier dans différents formats.
Gardez à l'esprit qu'un fichier CSV ne peut représenter qu'une seule feuille de calcul d'une feuille de calcul. Enfin, veillez à utiliser la première ligne de votre feuille de calcul (ligne 1) pour les en-têtes de colonne.
Dans R, vous utilisez la lecture. Fonction csv () pour importer des données au format CSV. Cette fonction a un certain nombre d'arguments, mais le seul argument essentiel est file, qui spécifie l'emplacement et le nom du fichier. Pour lire un fichier appelé éléments. csv situé à f: use read. csv () avec le fichier. chemin: >> éléments str (éléments) 'données. cadre ': 10 obs. de 9 variables: $ Atomique. nombre: int 1 2 3 4 5 6 7 8 9 10 $ Nom: Facteur w / 10 niveaux "Béryllium", "Boron", …: 6 5 7 1 2 3 9 10 4 8 $ Symbole: Facteur w / 10 niveaux " B "," Be "," C "," F ", …: 5 6 7 2 1 3 8 10 4 9 $ Groupe: int 1 18 1 2 13 14 15 16 17 18 $ Période: int 1 1 2 2 2 2 2 2 2 2 $ Bloc: Facteur w / 2 niveaux "p", "s": 2 2 2 2 1 1 1 1 1 1 $ État. à. STP: Facteur w / 2 niveaux "Gaz", "Solide": 1 1 2 2 2 2 1 1 1 1 $ Occurrence: Facteur w / 1 niveau "Primordial": 1 1 1 1 1 1 1 1 1 1 $ Description: Facteur w / 6 niveaux "Métal alcalin", …: 6 5 1 2 4 6 6 6 3 5
R importe les données dans une trame de données. Comme vous pouvez le voir, cet exemple a dix observations de neuf variables.
Cette option par défaut permet de convertir des chaînes en facteurs lorsque vous utilisez read. table () peut être une source de grande confusion. Il est souvent préférable d'importer des données contenant des chaînes de telle sorte que les chaînes ne soient pas des facteurs convertis, mais restent des vecteurs de caractères.Pour importer des données contenant des chaînes, utilisez l'argument stringsAsFactors = FALSE pour lire. csv () ou lire. table ():