Vidéo: FT#5 - Comment passer des statistiques aux graphiques 2024
Un histogramme est un graphique qui représente la distribution de probabilité d'un ensemble de données. Un histogramme a une série de barres verticales où chaque barre représente une seule valeur ou une plage de valeurs pour une variable. Les hauteurs des barres indiquent les fréquences ou les probabilités pour les différentes valeurs ou plages de valeurs.
Par exemple, cette figure montre un histogramme des prix quotidiens des actions Apple du 1er janvier 2013 au 31 décembre 2013.
Selon cet histogramme, la plupart des prix se situaient entre 60 et 65 dollars; le prix était dans cette gamme 81 fois pendant l'année. Les deuxièmes prix les plus fréquemment observés se situaient entre 55 et 60 dollars; le prix a atterri dans cette gamme 44 fois au cours de l'année. La troisième gamme de prix la plus fréquente se situait entre 65 et 70 dollars, et la fourchette de prix la plus fréquente se situait entre 70 et 75 dollars. Très peu de prix se situaient entre 50 et 55 dollars, et les prix les plus bas observés au cours de l'année se situaient entre 80 et 85 dollars.
D'après le graphique, les prix moyen et médian se situaient près de la fourchette de 60 $ à 65 $. La moyenne réelle était de 65 $. 67, et la médiane réelle était de 63 $. 65. Comme la moyenne dépasse la médiane, la distribution des prix pour 2013 était positivement biaisée. Cela indique que la probabilité d'un prix extrêmement élevé est quelque peu supérieure à la probabilité d'un prix extrêmement bas.
Une distribution est positivement asymétrique si la moyenne est supérieure à la médiane; il est biaisé négativement si la moyenne est inférieure à la médiane. La distribution est symétrique par rapport à la moyenne si la moyenne est égale à la médiane. Le degré d'asymétrie des données dépend de la distance entre la moyenne et la médiane. Si elles sont très proches, il est parfois pratique de traiter la distribution comme symétrique.
Comme autre exemple, cette figure présente un histogramme des cours quotidiens de l'indice boursier S & P 500 entre le 1er janvier 2013 et le 31 décembre 2013.
Histogramme des cours quotidiens du S & P 500Selon l'histogramme de la figure 12-10, la fourchette de prix la plus fréquemment observée au cours de l'année se situait entre 1 650 et 1 700 dollars. La moyenne s'établissait à 1 643 80 dollars et la médiane 1 650 $. 41. Contrairement au stock d'Apple, la moyenne était inférieure à la médiane; la distribution des prix pour 2013 est biaisée négativement. Cela indique que le Standard and Poor's 500 a eu une tendance légèrement supérieure à la moyenne au-dessus de la moyenne en 2013.
L'une des utilisations les plus importantes des histogrammes consiste à déterminer si un ensemble de données suit un distribution de probabilité.Bien qu'il existe de nombreux tests statistiques formels pour déterminer la distribution de probabilité qu'un ensemble de données suit, il est recommandé d'inspecter visuellement les données à l'aide d'un graphique avant de procéder à des tests statistiques formels.
L'histogramme des prix Apple fournit des preuves solides que les cours des actions Apple sont et non normalement distribués. La distribution normale est symétrique par rapport à sa moyenne, alors que les cours des actions d'Apple sont positivement asymétriques. L'histogramme des prix S & P fournit des preuves solides que le S & P 500 est également peu susceptible d'être distribué normalement parce que sa distribution est biaisée négativement.
Des tests statistiques formels seraient nécessaires pour montrer qu'aucune distribution n'est normale, mais les graphiques sont très suggestifs. Comme de nombreux tests statistiques sont basés sur l'hypothèse de normalité, il est important de déterminer si une distribution est vraiment normale avant d'utiliser l'un de ces tests.