Vidéo: Le Cloud - Un centre de données de milliers de serveurs 2024
Vous identifiez le centre d'un ensemble de données avec plusieurs mesures récapitulatives différentes. Ceux-ci incluent les trois grands: moyenne, médiane et mode. Vous calculez la moyenne d'un ensemble de données en additionnant les valeurs de tous les éléments et en divisant par le nombre total d'éléments. Par exemple, supposons qu'un petit ensemble de données se compose du nombre de jours requis pour recevoir un paquet par les résidents d'un complexe d'appartements:
1, 2, 2, 4, 7, 9, 10
La moyenne de cet ensemble de données serait la suivante:
Durée moyenne de la réception d'un colis par les résidents est de 5 jours.
La médiane d'un ensemble de données est une valeur qui divise les données en deux. La première moitié contient les plus petits éléments et la seconde moitié est constituée des éléments les plus grands. Dans l'exemple précédent, parce que les données consistent en sept observations, la quatrième plus petite valeur serait la médiane:
1, 2, 2, 4, 7, 9, 10
La médiane est 4, car la moitié des observations sont inférieures à 4, et la moitié sont plus grandes que 4.
Le mode d'un ensemble de données est simplement la valeur la plus fréquente. Avec l'exemple de livraison de colis, le mode est 2.
Pour un exemple concret, cette figure montre un histogramme des retours quotidiens au stock d'ExxonMobil en 2013.
Chaque barre représente un intervalle des valeurs; la largeur de chaque intervalle est 0. 005. Les hauteurs des barres indiquent combien de retours sont tombés dans chaque intervalle. L'histogramme permet de voir plus facilement quelles sont les plages de valeurs les plus fréquentes et celles qui se produisent le plus rarement.
L'histogramme montre que la plupart des retours sont proches de la moyenne, soit 0. 000632 (0,632%). La médiane est -0. 000118, et le mode pourrait être considéré comme la gamme de valeurs entre -0. 005 et 0.