Vidéo: Compter et détecter le nombre de cellules inferieur/supérieur à – Tableur Excel 2025
Pour comprendre quelles données peuvent être factorisées lorsque vous travaillez dans R, jetons un coup d'œil à l'ensemble de données mtcars. Ce jeu de données intégré décrit la consommation de carburant et dix points de conception différents de 32 voitures des années 1970. Il contient, au total, 11 variables, mais toutes sont numériques.
Bien que vous puissiez travailler avec la trame de données telle quelle, certaines variables pourraient être converties en facteur car elles ont une quantité limitée de valeurs.
Si vous ne connaissez pas le nombre de valeurs différentes d'une variable, vous pouvez obtenir cette information en deux étapes simples:
-
Obtenez les valeurs uniques de la variable en utilisant unique () .
-
Obtenez la longueur du vecteur résultant en utilisant length () .
En utilisant la fonction sapply (), vous pouvez le faire pour toute la trame de données à la fois. Vous appliquez une fonction anonyme combinant les deux étapes mentionnées sur l'ensemble de la trame de données, comme ceci:
spply (mtcars, fonction (x) longueur (unique (x))) mpg cyl disp hp drat wt qsec vs am engrenage carb 25 3 27 22 22 29 30 2 2 3 6 > Ainsi, il semble que les variables cyl, vs, am, gear et carb peuvent bénéficier d'une conversion en facteur.
Vous avez 32 observations différentes dans cet ensemble de données, donc aucune des variables n'a des valeurs uniques seulement.
Quand traiter une variable comme un facteur dépend un peu de la situation, mais, en règle générale, évitez plus de dix niveaux différents dans un facteur et essayez d'avoir au moins cinq valeurs par niveau.
