Vidéo: Tutoriel 03 R - Lire des données au format CSV ou TXT 2025
Si vous demandez aux utilisateurs de R quel est le meilleur moyen d'importer des données directement depuis Microsoft Excel, la plupart d'entre eux répondra probablement que votre meilleure option est d'exporter d'Excel vers un fichier CSV, puis d'utiliser read. csv () pour importer vos données en R.
En fait, c'est toujours le conseil du chapitre 8 du manuel d'importation et d'exportation R, qui dit: «Le premier conseil est d'éviter de le faire si possible! «La raison en est que bon nombre des méthodes existantes d'importation de données à partir d'Excel dépendent de logiciels tiers ou de bibliothèques qui peuvent être difficiles à configurer, non disponibles sur tous les systèmes d'exploitation ou qui ont des termes de licence restrictifs.
Cependant, depuis février 2011, il existe une nouvelle alternative: l'utilisation du paquet XLConnect, disponible chez CRAN. Ce qui différencie XLConnect, c'est qu'il utilise une bibliothèque Java pour lire et écrire des fichiers Excel. Cela a deux avantages:
-
Il fonctionne sur tous les systèmes d'exploitation qui supportent Java. XLConnect est écrit en Java et fonctionne sous Windows, Linux et Mac OS.
-
Il n'y a rien d'autre à charger. XLConnect ne nécessite aucune autre bibliothèque ou logiciel. Si vous avez Java installé, cela devrait fonctionner.
XLConnect peut également écrire des fichiers Excel, notamment en changeant la mise en forme des cellules, dans les formats Excel 97-2003 et Excel 2007/10.
Pour en savoir plus sur XLConnect, vous pouvez lire l'excellente vignette du paquet.
Vous êtes probablement impatient de commencer avec un exemple. Supposons que vous vouliez lire une feuille de calcul Excel dans votre répertoire utilisateur appelé Elements. xlsx. D'abord, installez et chargez le paquet; puis créez un objet avec le nom de fichier:
Vous êtes maintenant prêt à lire une feuille de ce classeur avec la fonction readWorksheetFromFile (). Vous devez lui passer au moins deux arguments:
fichier
-
: Une chaîne de caractères avec un chemin vers un valide. xls ou. Fichier xlsx feuille
-
: Un entier indiquant la position de la feuille de calcul (par exemple, feuille = 1) ou le nom de la feuille de calcul (par exemple, sheet = "Sheet2") les deux lignes suivantes font exactement la même chose - elles importent toutes deux les données de la première feuille de calcul (appelée Sheet1):
elements elements <- readWorksheetFromFile (excel file, sheet = "Sheet1")
