Table des matières:
- Calcul de la plage
- La plage ne vous donne que des informations limitées. Souvent, les statisticiens signalent le premier et le troisième
- quantile (voitures $ mpg, probs = c (0,05, 0,95) ) 5% 95% 11. 995 31. 300
Vidéo: Comment faire le test de normalité dans R avec Rcmdr 2025
En plus de la moyenne et de la variation, vous pouvez aussi regarder les quantiles dans R. A quantile, ou percentile, vous indique combien de vos données se trouvent en dessous d'une certaine valeur. Le quantile 50 pour cent, par exemple, est le même que la médiane. Encore une fois, R a quelques fonctions pratiques pour vous aider à regarder les quantiles.
Calcul de la plage
Les quantiles les plus utilisés sont en fait les quantiles à 0 et 100 pour cent. Vous pourriez tout aussi bien les appeler le minimum et le maximum, parce que c'est ce qu'ils sont. Vous pouvez obtenir les deux ensemble en utilisant la fonction range (). Cette fonction vous donne commodément la plage des données. Donc, pour connaître la gamme de mileages, vous faites simplement:
Calcul des quartiles
La plage ne vous donne que des informations limitées. Souvent, les statisticiens signalent le premier et le troisième
quartile ainsi que la fourchette et la médiane. Ces quartiles sont, respectivement, les quantiles de 25% et de 75%, qui sont les nombres pour lesquels le quart et les trois quarts des données sont plus petits. Vous obtenez ces nombres en utilisant la fonction quantile (), comme ceci:
Activer la vitesse avec la fonction quantile
La fonction quantile () peut vous donner n'importe quel quantile que vous voulez. Pour cela, vous utilisez l'argument probs. Vous donnez les probabilités (ou probabilités) sous la forme d'un nombre fractionnaire. Pour le quantile de 20%, par exemple, vous utilisez 0. 20 comme argument pour la valeur. Cet argument prend également un vecteur comme une valeur, de sorte que vous pouvez, par exemple, obtenir les quantiles de 5% et 95% comme ceci:quantile (voitures $ mpg, probs = c (0,05, 0,95)) 5% 95% 11. 995 31. 300
La valeur par défaut de l'argument probs est un vecteur représentant le minimum (0), le premier quartile (0,25), la médiane (0,5), le troisième quartile (0. 75), et le maximum (1).
L'argument na. rm vous permet de supprimer toutes les valeurs NA avant de calculer la statistique correspondante. Si vous ne le faites pas, tout vecteur contenant NA aura NA en conséquence. Cela fonctionne identiquement à la na. argument rm de la fonction sum ().