Vidéo: reparer les erreurs de fichiers system windows/ chkdsk C: /F /R 2025
Probablement les erreurs les plus courantes dans R sont faites en lisant des données à partir de fichiers texte en utilisant read. table () ou lire. csv (). Beaucoup d'erreurs entraînent des erreurs de lancement R, mais parfois vous remarquez que quelque chose s'est mal passé lorsque vous regardez la structure de vos données. Dans ce dernier cas, vous trouvez souvent que certaines ou toutes les variables sont converties en facteurs alors qu'elles ne devraient vraiment pas l'être.
Lorsque R donne des erreurs ou que la structure de vos données n'est pas ce que vous pensez qu'elle devrait être, vérifiez ce qui suit:
-
Avez-vous oublié de spécifier l'argument header = TRUE ? Si c'est le cas, R verra les noms des colonnes comme valeurs et, par conséquent, convertira chaque variable en un facteur comme il le fait toujours avec les données de caractères dans un fichier texte.
-
Avez-vous des espaces dans vos noms de colonnes ou vos données? Le lire. La fonction table () peut interpréter des espaces dans, par exemple, des noms de colonne ou dans des données de chaîne en tant que séparateur. Vous obtenez alors des erreurs vous disant que «la ligne x n'a pas d'éléments y».
-
Avez-vous un séparateur décimal différent? Dans certains pays, les décimales sont séparées par une virgule. Vous devez spécifiquement dire à R que c'est le cas en utilisant l'argument dec = "," dans le read. fonction table ().
-
Avez-vous oublié de spécifier stringsAsFactors = FALSE ? Par défaut, R modifie les données de caractères en facteurs, donc vous devez toujours ajouter cet argument si vous voulez que vos données restent des variables de caractères.
-
Aviez-vous une autre façon de spécifier les valeurs manquantes? R lit 'NA' dans un fichier texte comme valeur manquante, mais le fichier peut utiliser un code différent (par exemple, 'missing'). R verra cela comme du texte et convertira à nouveau cette variable en un facteur. Vous résolvez ceci en spécifiant l'argument na. cordes dans la lecture. fonction table ().
Si vous vérifiez toujours la structure de vos données immédiatement après leur lecture, vous pouvez détecter les erreurs beaucoup plus tôt et éviter des heures de frustration. Votre meilleur pari est d'utiliser str () pour des informations sur les types et head () pour voir si les valeurs sont ce que vous attendiez.