Table des matières:
Vidéo: What is Data Analytics - 5 Concepts of Data Analytics [2019] 2024
Bien que l'EDA soit principalement basée sur des techniques graphiques, elle consiste aussi en quelques techniques quantitatives. Cet article traite de deux d'entre elles: l'estimation d'intervalle et le test d'hypothèse.
Estimation d'intervalle
L'estimation d'intervalle est une technique utilisée pour construire une gamme de valeurs dans lesquelles une variable est susceptible de tomber. Un exemple important de ceci est l'intervalle de confiance. Un intervalle de confiance est une plage de nombres susceptible de contenir la valeur d'une mesure de population telle que la moyenne. Un intervalle de confiance est construit comme suit:
L'intervalle de confiance se compose d'une limite inférieure égale à l'estimation ponctuelle moins de la marge d'erreur et d'une limite supérieure égal à l'estimation ponctuelle plus la marge d'erreur.
L'estimation ponctuelle est une valeur unique estimée à partir d'un échantillon. Par exemple, la moyenne de l'échantillon est une estimation ponctuelle de la moyenne de la population. De même, l'écart-type de l'échantillon est une estimation ponctuelle de l'écart-type de la population.
La marge d'erreur reflète la quantité d'incertitude associée à l'estimation ponctuelle. En d'autres termes, cela montre à quel point l'estimation ponctuelle peut changer d'un échantillon à l'autre. La marge d'erreur est basée sur l'écart-type et la taille de l'échantillon utilisé. Le résultat de ces calculs est une gamme de valeurs susceptibles de contenir la vraie valeur de la mesure de la population.
Test d'hypothèseUne hypothèse statistique
est une affirmation supposée vraie à moins de preuves contradictoires solides. Le test d'hypothèse est largement utilisé dans de nombreuses disciplines pour déterminer si une proposition est vraie ou fausse. Par exemple, un test d'hypothèse pourrait être utilisé pour déterminer si L'âge moyen des résidents d'un État est de 43 ans. Le rendement moyen des actions d'un portefeuille est de 7,2%.
-
La quantité de pluie annuelle dans une ville suit la distribution normale.
-
Le test d'hypothèse est un processus en plusieurs étapes comprenant les éléments suivants:
-
L'énoncé de l'hypothèse nulle: C'est l'énoncé supposé être vrai.
L'énoncé de l'hypothèse alternative: C'est la déclaration qui sera acceptée si l'hypothèse nulle est rejetée.
-
Le niveau de signification auquel le test d'hypothèse sera effectué: Cela équivaut à la probabilité de rejeter l'hypothèse nulle lorsqu'elle est fausse.
-
La statistique de test: C'est une mesure numérique qui montre si les données de l'échantillon sont cohérentes avec l'hypothèse nulle.
-
Valeur critique: si la statistique de test est plus extrême que la valeur critique, l'hypothèse nulle est rejetée.
-
La décision: En fonction de la relation entre la statistique de test et la valeur critique, vous décidez si l'hypothèse nulle doit ou non être rejetée.