Vidéo: Boites a moustaches - représenter simplement des distributions de données 2024
tracé de boîte est conçu pour afficher plusieurs statistiques clés pour un ensemble de données sous la forme d'un rectangle vertical ou d'une boîte. Les statistiques qu'il peut montrer sont les suivantes: Valeur minimale
-
Valeur maximale
-
Premier quartile (Q
-
1 ) Deuxième quartile (Q
-
2 ) < Troisième quartile (Q 3
-
) Interquartile range (IQR)
-
d'un ensemble de données est une mesure numérique qui divise les données en deux parties: la plus petite 25% des observations et la plus grande 75% des observations. En d'autres termes, le premier quartile est une valeur numérique ayant les propriétés suivantes:
25% des observations de l'ensemble de données sont
plus petites que le premier quartile. 75% des observations de l'ensemble de données sont
-
supérieures à dans le premier quartile.
-
(également connu sous le nom de médiane ) divise les données en deux, de sorte que 50% des éléments sont plus petits que la médiane et 50 pour cent sont plus grands.
Le
est la valeur pour laquelle les valeurs suivantes sont vraies: 75% des observations de l'ensemble de données sont inférieures à le troisième quartile. 25% des observations de l'ensemble de données sont
supérieures à le troisième quartile.
-
L'intervalle interquartile est la différence entre le troisième quartile et le premier quartile: IQR = Q
-
3 - Q 1 >.
L'intervalle interquartile est une mesure de dispersion
; il montre combien il y a d'écart entre les éléments dans les 50% moyens d'un ensemble de données. Un cadre est dessiné de sorte que Le haut de la boîte représente le troisième quartile (Q 3) des données. Le bas de la boîte représente le premier quartile
(Q
-
1 ) des données. Le milieu de la boîte (représenté par une ligne) représente le deuxième quartile (Q
-
2 ). De plus, il y a une ligne au-dessus de la case pour indiquer la valeur
-
maximum dans les données qui ne dépasse pas Q 3 + 1. 5 x IQR et une ligne au-dessous de
la case pour indiquer la valeur minimum dans les données qui ne sont pas inférieures à Q 1 - 1. 5 x IQR. Les valeurs en dehors de cette plage sont valeurs aberrantes et sont affichées sur la boîte comme des points individuels. Cette figure montre une boîte à moustaches des prix quotidiens des actions de Microsoft du 1er janvier 2013 au 31 décembre 2013. Tableau des prix quotidiens pour l'action Microsoft. Il n'y a pas de valeurs aberrantes dans ces données.Par conséquent, la ligne du bas de la boîte à moustaches montre que le prix le plus bas durant cette période était légèrement inférieur à 26 $. 00, et la ligne supérieure montre que le prix le plus élevé était juste un peu plus de 38 $. Le bas de la boîte correspond au premier quartile, soit 27 $. 43; la ligne continue au milieu de la boîte correspond au deuxième quartile (médiane), soit 31 $. 89. Le haut de la case correspond au troisième quartile, soit 33 $. 78. La hauteur de la boîte est égale à la plage interquartile (IQR), qui est de 6 $. 35. Comme autre exemple, cette figure montre une boîte à moustaches des prix quotidiens du stock d'Apple du 1er janvier 2013 au 31 décembre 2013. Tableau des prix quotidiens des actions Apple du 1er janvier 2013 au 31 décembre 2013. Le prix le plus bas en 2013 pour l'action Apple était de 53 $. 84, et le prix le plus élevé était de 80 $. 11. Il n'y a pas de valeurs aberrantes dans les données, donc ces valeurs sont indiquées par la ligne du bas et la ligne du haut, respectivement. Le premier quartile, affiché au bas de la boîte, était de 60 $. 48. Le deuxième quartile était de 63 dollars. 65 (indiqué par la ligne noire continue) et le troisième quartile était de 70 $. 32, montré en haut de la boîte. En conséquence, la gamme interquartile (IQR) est de 9 $. 84.