Table des matières:
Vidéo: 1.7 Comment créer un histogramme avec R ? 2025
Pour avoir une idée plus claire de la distribution de vos données, vous pouvez tracer un histogramme en utilisant R. Pour faire un histogramme des données de kilométrage, il suffit d'utiliser la fonction hist (), comme ceci: >> hist (cars $ mpg, col = "gray")
Vous voyez que la fonction hist () coupe d'abord la plage des données dans un certain nombre d'intervalles pairs, puis compte le nombre d'observations dans chaque intervalle. La hauteur des barres est proportionnelle à ces fréquences. Sur l'axe
y , vous trouvez les comptes.
Comment jouer avec les sauts
R choisit le nombre d'intervalles qu'il considère comme les plus utiles pour représenter les données, mais vous pouvez être en désaccord avec ce que fait R et choisir les sauts vous-même. Pour cela, vous utilisez l'argument breaks de la fonction hist ().
Vous pouvez indiquer à R le nombre de barres que vous voulez dans l'histogramme en donnant un seul nombre comme argument.
-
Gardez juste à l'esprit que R décidera quand même si c'est vraiment raisonnable, et il essaie de réduire la portée en utilisant de beaux chiffres arrondis. Vous pouvez indiquer à R exactement où placer les coupures en donnant un vecteur avec les points de rupture comme valeur à l'argument
-
breaks .
Donc, si vous n'êtes pas d'accord avec R et que vous voulez avoir des barres représentant les intervalles 5 à 15, 15 à 25 et 25 à 35, vous pouvez le faire avec le code suivant:
hist (voitures $ mpg, breaks = c (5, 15, 25, 35))
Vous pouvez aussi donner le nom de l'algorithme que R doit utiliser pour déterminer le nombre de ruptures comme valeur pour le casse l'argument. Vous pouvez trouver plus d'informations sur ces algorithmes sur la page d'aide? hist. Essayez d'expérimenter un peu ces algorithmes pour vérifier lequel fonctionne le mieux.
