Vidéo: [Tuto R : les indispensables] Supprimer les lignes d'une dataframe contenant na 2025
Une autre application utile des trames de données de sous-ensembles est de trouver et supprimer des lignes avec des données manquantes. La fonction R pour vérifier cela est terminée. cas (). Vous pouvez essayer ceci sur la qualité d'air de l'ensemble de données intégré, une trame de données avec une bonne quantité de données manquantes: >> str (qualité de l'air)> complète. cas (qualité de l'air)
Les résultats de complète. cases () est un vecteur logique avec la valeur TRUE pour les lignes terminées et FALSE pour les lignes ayant des valeurs NA. Pour supprimer les lignes avec des données manquantes de la qualité de l'air, essayez ce qui suit:
Comme toujours avec R, il existe plusieurs façons d'atteindre votre objectif. Dans ce cas, vous pouvez utiliser na. omit () pour omettre toutes les lignes contenant des valeurs NA: >> x <- na. omit (qualité de l'air)
Lorsque vous êtes certain que vos données sont propres, vous pouvez commencer à les analyser en ajoutant des champs calculés.
Si vous utilisez l'une de ces méthodes pour sous-traiter vos données ou effacer des valeurs manquantes, n'oubliez pas de stocker le résultat dans un nouvel objet. R ne change rien dans le bloc de données d'origine sauf si vous l'écrasez explicitement. C'est une bonne chose, car vous ne pouvez pas accidentellement gâcher vos données.
