Table des matières:
- Points aberrants causés par des erreurs
- Points aberrants causés par le premier indicateur des changements de longue durée dans vos ensembles de mesures
Vidéo: ? LIVE : BLOCKCHAIN In Toulouse - CRYPTOACTIFS et ENTREPRENEURIAT - Episode 7 2025
Un aberrant est un point de données qui ne correspond pas à votre profil de données moyen établi. En prêtant attention aux valeurs aberrantes de vos statistiques sur les médias sociaux, vous pouvez voir où vous positionner en vous concentrant sur les valeurs aberrantes qui se répètent et celles qui commencent à se multiplier, indiquant une tendance.
Il existe deux types de valeurs aberrantes dans les données:
-
Les valeurs aberrantes causées par des erreurs de mesure ou des données.
-
Points aberrants causés par le premier indicateur des changements de longue durée dans vos ensembles de mesures. (Long-tail est un terme marketing faisant référence aux résultats affichés au fil du temps.)
Points aberrants causés par des erreurs
Pour traiter le premier type de valeur aberrante (erreur que vous voulez éliminer avant de corrompre vos données), besoin de l'éliminer. L'élimination de la valeur aberrante nécessite plusieurs étapes, dont la première consiste à exporter vos données vers une feuille de calcul:
-
Triez les données de votre feuille de calcul par ordre croissant.
-
Localisez votre numéro médian.
Le nombre médian de 3 et 4, par exemple, est 3. 5.
-
Trouvez le point auquel 25% des métriques de votre feuille de calcul sont plus grandes.
C'est le quartile supérieur , ou Q2.
-
Trouvez le point auquel 25% des métriques de votre feuille de calcul sont plus petites.
Ceci est appelé le quartile inférieur , ou Q1.
-
Soustrayez Q1 de Q2.
Le résultat est la plage interquartile . Vous avez besoin de cette plage pour exclure les données incorrectes.
-
Multipliez le QI (intervalle interquartile) par 1. 5.
-
Ajoutez les résultats de l'étape 6 au quartile supérieur, puis soustrayez-le du quartile inférieur.
Cette étape définit les paramètres.
-
Marquez toutes les données en dehors de cet ensemble de paramètres comme valeurs aberrantes.
-
Multipliez le QI par 3.
-
Prenez les résultats de l'étape 9 et ajoutez-le au quartile supérieur et soustrayez-le du quartile inférieur.
Le nombre résultant se qualifie comme une valeur aberrante extrême. Les valeurs aberrantes extrêmes sont les points de données que vous devez exclure de vos ensembles de données si vous avez de mauvaises données.
Points aberrants causés par le premier indicateur des changements de longue durée dans vos ensembles de mesures
Si vous rencontrez le deuxième type de valeur aberrante (le premier indicateur d'un changement de longue traîne), vous devez le suivre et créer plus de métriques pour comprendre ce que cela signifie pour votre marque et votre modèle d'affaires.
Au lieu d'éliminer les données, vous souhaitez les trier dans leur propre jeu de données afin de pouvoir les suivre au fil du temps. Ce tri vous permet de comparer les valeurs aberrantes des données à votre modèle d'entreprise et à vos objectifs pour voir s'il s'agit d'une mesure croissante.
Si vous trouvez que la métrique prend de l'ampleur, pour ainsi dire, alors vous savez que c'est une tendance future qui se dessine et que vous pouvez vous tourner vers l'avenir et faire croître votre entreprise dans une nouvelle direction.
