Vidéo: Formation SPSS: Effectifs et Diagrammes 2024
Un diagramme tige-feuille est un dispositif graphique dans lequel la distribution d'un ensemble de données est organisée par la valeur numérique des observations dans l'ensemble de données. Le diagramme se compose d'une "racine", montrant les différentes catégories dans les données, et une "feuille", qui montre les valeurs des observations individuelles dans l'ensemble de données.
Par exemple, ce qui suit est un diagramme tige-feuille pour les prix quotidiens des actions de Microsoft du 1er janvier 2013 au 31 décembre 2013. Les prix varient de 25 $. 16 à 38 $. 14:
Sur le diagramme tige-feuille, chaque ligne représente une seule catégorie; pour ce jeu de données, chaque catégorie est un montant en dollars. Par exemple, la catégorie 32 comprend tous les prix entre 32 $. 00 et 32 $. 99. Chaque prix pour les actions de Microsoft est indiqué en dollars et en cents. Le côté gauche de la barre montre les dollars (les tiges); le côté droit de la barre montre les cents (les feuilles), après avoir arrondi aux 10 cents les plus proches. Par exemple, un prix de 32 $. 23 est arrondi à 32 $. 20, et cela apparaît comme un 2 sur le côté droit de la barre pour la catégorie 32. Un prix de 33 $. 48 est arrondi à 33 $. 50; cela apparaît comme un 5 sur le côté droit de la barre pour la catégorie 33.
En utilisant cette technique, il est facile de voir combien de prix tombent dans chaque catégorie. Par exemple, il y avait 14 jours de bourse dans l'ensemble de données dans lequel le prix du stock de Microsoft se situait entre 25 $. 00 et 25 $. 99. Il y a eu trois jours de bourse au cours desquels le prix des actions de Microsoft se situait entre 29 dollars. 00 et 29 $. 99. Un prix entre 33 $. 00 et 33 $. 99 s'est produit le plus souvent, et un prix entre 38 $. 00 et 38 $. 99 était le plus rare au cours de l'année.
L'un des avantages d'un diagramme tige-feuille est qu'il est facile d'identifier le mode d'un ensemble de données. (Rappelez-vous que le mode est la valeur la plus fréquente dans un jeu de données.) Si vous regardez uniquement les plages de dollars, il est facile de repérer quelle plage contient le plus d'observations - celle avec la feuille la plus longue. Dans ce cas, un prix de l'ordre de 33 (33,00 $ - 33,99 $) serait considéré comme le mode parce qu'il contient le plus d'observations.
Un autre avantage de ce diagramme est que valeurs aberrantes sont faciles à repérer. Une valeur aberrante est une observation dans un ensemble de données significativement plus grande ou plus petite que les autres observations de l'ensemble de données. Une valeur aberrante serait indiquée par un grand écart entre la première ou la dernière tige et la suivante la plus proche.(Le chapitre 10 parle plus des valeurs aberrantes.)
Un inconvénient des diagrammes à tige et feuille est qu'ils deviennent difficiles à interpréter pour les grands ensembles de données parce que la taille de la feuille devient trop lourde.