Table des matières:
- Connaître la probabilité qu'un événement se produise
- Application de la variance pour montrer l'ampleur de la modification
- Prévoir l'avenir
Vidéo: La Magie des Maths de Prépa (2/2) - L'analyse 2024
Le mot statistiques peut évoquer la peur chez certains débutants de la visualisation de données, mais si vous ignorez ce sujet, vous oubliez l'un des les moyens les plus puissants de dériver une véritable compréhension et valeur de Big Data.
Statistiques est la pratique ou la science de la collecte de données numériques en grandes quantités. Vous n'avez pas à sortir et à devenir un scientifique de données (un terme utilisé pour les statisticiens qui sont aussi des geeks de données déguisés et qui détiennent généralement un certain degré d'études supérieures, comme un doctorat), mais vous pouvez envisager de ramasser un livre ou un cours de Statistiques 101 si vous avez un intérêt.
Les formules statistiques telles que la probabilité, la variance et la prévision sont populaires aujourd'hui. Ils sont assez faciles à appliquer à n'importe quel ensemble de données, et la plupart des lecteurs les comprendront clairement. Vous pouvez incorporer certaines de ces formules statistiques dans vos visualisations Big Data pour fournir une véritable valeur aux utilisateurs en utilisant les techniques présentées dans les sections suivantes.
Connaître la probabilité qu'un événement se produise
Une formule statistique que vous connaissez peut-être est p robabilité - la probabilité ou la probabilité qu'un événement se produise. La formule suivante calcule la probabilité de base pour un scénario linéaire. (Les scénarios non linéaires sont un peu complexes et trop ambitieux pour un débutant.)
Probabilité = Probabilité qu'un événement se produise / nombre de résultats possibles
La figure suivante montre une probabilité avec des couleurs d'alerte ajoutées pour rendre le message facile à lire et, surtout, indiquer clairement qu'une action immédiate est nécessaire.
Les probabilités permettent une vérification rapide de la réalité et définissent le ton général de l'histoire que la visualisation des données fournira pendant une période donnée (jour, semaine, trimestre, etc.).
Application de la variance pour montrer l'ampleur de la modification
Une autre mesure statistique courante est v ariance , qui est la différence entre un ensemble de points de données.
La formule la plus couramment utilisée pour calculer la variance est
Variance = Final Désiré - État actuel
Que la sortie affichée soit un nombre entier ou un pourcentage, la formule indique l'ampleur du changement entre l'état initial et l'état final un point de données.
L'affichage de la variance est toujours une victoire rapide et un excellent substitut à la combinaison ligne / graphique à barres, qui est la façon dont la relation de variance est affichée dans la plupart des visualisations.
Le graphique de la figure ci-dessous montre un combo ligne / histogramme qui permet à l'utilisateur de déchiffrer la variance pour chaque mois.
Le deuxième graphique, illustré dans la figure suivante, trace clairement la variance et élimine toute conjecture du visuel.
Prévoir l'avenir
Une autre formule statistique populaire que vous connaissez peut-être est f ou bien , , qui consiste à prédire ou estimer un événement ou une tendance.
Lorsque vous calculez une prévision, vous utilisez réellement un certain nombre de données historiques pour prédire le comportement, un événement spécifique ou une tendance. Par exemple, vous pouvez calculer les ventes de l'année en se basant sur le fait historique que janvier représente habituellement 5% des ventes. Si vous avez réalisé des ventes de 500 $ en janvier, vous utiliserez la formule suivante pour prévoir combien de ventes vous pouvez anticiper pour l'année:
500 $ /. 05 = 10 000 $
Dans cette équation, 500 $ correspondent aux ventes de janvier;. 05 représente le pourcentage historique des ventes pour janvier; et 10 000 $ sont les ventes prévues pour l'année.
La figure ci-dessous montre comment les prévisions sont affichées dans la plupart des visualisations de données sous la forme d'une simple ligne dans un graphique. Les prévisions indiquent comment une activité donnée peut fonctionner dans le futur.
Cet affichage typique d'une ligne de prévision montre que les flux de trésorerie finiront par devenir un problème pour cette organisation.