10 Choses à savoir sur les statistiques à utiliser Excel - les nuls

Excel est un outil formidable lorsque vous devez utiliser des statistiques. Si vous n'avez jamais été exposé à des statistiques à l'école ou si cela fait une décennie ou deux que vous l'avez été, laissez ces conseils vous aider à utiliser certains des outils statistiques fournis par Excel.

Les statistiques descriptives sont simples

La première chose que vous devez savoir, c'est que certaines analyses statistiques et certaines mesures statistiques sont très simples. Les statistiques descriptives, qui comprennent des éléments tels que les tableaux croisés des tableaux croisés dynamiques, ainsi que certaines fonctions statistiques, ont du sens même pour quelqu'un qui n'est pas aussi quantitatif.

Les moyennes ne sont pas si simples parfois

Quand quelqu'un utilise le terme moyen, ce à quoi il se réfère habituellement est la mesure moyenne la plus courante, qui est signifier. Comprendre que le terme moyen est imprécis rend la plupart des fonctionnalités statistiques d'Excel plus compréhensibles.

Pour rendre cette discussion plus concrète, supposons que vous regardiez un petit ensemble de valeurs: 1, 2, 3, 4 et 5. Comme vous le savez peut-être, la moyenne dans ce petit ensemble de valeurs est 3. Vous pouvez calculer la moyenne en additionnant tous les nombres de l'ensemble (1 + 2 + 3 + 4 + 5) et en divisant cette somme (15) par le nombre total de valeurs de l'ensemble (5).

La valeur médiane est la valeur qui sépare les plus grandes valeurs des plus petites valeurs. Dans l'ensemble de données 1, 2, 3, 4 et 5, la médiane est 3. La valeur 3 sépare les plus grandes valeurs (4 et 5) des plus petites valeurs (1 et 2).

Vous n'avez pas besoin de comprendre différentes mesures moyennes, mais vous devez vous rappeler que le terme moyen est assez imprécis.

Les écarts-types décrivent la dispersion

La formule de l'écart-type et de la logique sont assez faciles à comprendre.

Un écart-type décrit comment les valeurs d'un ensemble de données varient autour de la moyenne. La chose intéressante à propos des mesures statistiques comme un écart-type, vous obtenez souvent un aperçu réel des caractéristiques des données que vous regardez. Une autre chose est qu'avec ces deux bits de données, vous pouvez souvent tirer des inférences sur les données en regardant des échantillons.

Une observation est une observation

L'observation est l'un des termes que vous rencontrerez si vous lisez quelque chose sur les statistiques. Une observation est juste une observation. Une façon de définir le terme d'observation est la suivante: Chaque fois que vous attribuez une valeur à l'une de vos variables aléatoires, vous créez une observation.

Un échantillon est un sous-ensemble de valeurs

Un échantillon est un ensemble d'observations provenant d'une population. Par exemple, si vous créez un ensemble de données qui enregistre la température quotidienne élevée dans votre voisinage, votre petite collection d'observations est un échantillon.

En comparaison, un échantillon n'est pas une population. Une population inclut toutes les observations possibles.

Les statistiques inférentielles sont cool mais compliquées

Si vous regardez un échantillon de valeurs d'une population et que l'échantillon est représentatif et assez grand, vous pouvez tirer des conclusions sur la population en fonction des caractéristiques de l'échantillon.

Les statistiques inférentielles, bien que très puissantes, possèdent deux qualités que vous devez savoir:

Problèmes d'exactitude
Courbe d'apprentissage abrupte

Les fonctions de distribution de probabilité ne sont pas toujours confuses

P la fonction semble assez délicate; mais vous pouvez réellement comprendre intuitivement ce qu'est une fonction de distribution de probabilité avec quelques exemples utiles.

Une distribution commune dont vous entendez parler dans les classes de statistiques, par exemple, est une distribution en T. Une distribution T est essentiellement une distribution normale sauf avec des queues plus lourdes et plus grosses.

Une fonction de distribution de probabilité commune est une distribution uniforme. Dans une distribution uniforme , chaque événement a la même probabilité d'occurrence. La seule chose à propos de cette distribution, c'est que tout est très bon niveau.

Un autre type commun de fonction de distribution de probabilité est la distribution normale, également connue sous le nom de courbe en cloche ou distribution gaussienne.

Une distribution normale se produit naturellement dans de nombreuses situations. Par exemple, les quotients intellectuels (QI) sont distribués normalement.

Les paramètres ne sont pas si compliqués

Un paramètre est une entrée de la fonction de distribution de probabilité. En d'autres termes, la formule ou la fonction ou l'équation qui décrit une courbe de distribution de probabilité a besoin d'intrants. En statistiques, ces entrées sont appelées paramètres.

Certaines fonctions de distribution de probabilité n'ont besoin que d'un seul paramètre simple. Par exemple, pour travailler avec une distribution uniforme, tout ce dont vous avez vraiment besoin est le nombre de valeurs dans l'ensemble de données. Un dé à six faces, par exemple, n'a que six possibilités.

L'asymétrie et le kurtosis décrivent la forme d'une distribution de probabilité

Quelques autres termes statistiques utiles à connaître sont l'asymétrie et l'aplatissement. Skewness quantifie le manque de symétrie dans une distribution de probabilité. Dans une distribution parfaitement symétrique, comme la distribution normale, l'asymétrie est égale à zéro. Cependant, si une distribution de probabilité se penche sur la droite ou la gauche, l'asymétrie équivaut à une valeur autre que zéro et la valeur quantifie l'absence de symétrie.

Kurtosis quantifie la lourdeur des queues dans une distribution. Dans une distribution normale, kurtosis est égal à zéro. La queue est la chose qui tend vers la gauche ou la droite. Cependant, si une queue dans une distribution est plus lourde qu'une distribution normale, le kurtosis est un nombre positif.Si les queues d'une distribution sont plus maigres que dans une distribution normale, le kurtosis est un nombre négatif.

Les intervalles de confiance semblent compliqués au début, mais sont utiles

Les probabilités confondent souvent les gens. Une chose importante à comprendre au sujet des niveaux de confiance est qu'ils sont liés à la marge d'erreur.

Une autre chose importante à comprendre au sujet des niveaux de confiance est que plus la taille de l'échantillon est grande, plus la marge d'erreur sera faible et plus le niveau de confiance sera faible.

À titre d'exemple, disons que vous possédez des données Google Analytics sur deux annonces Web différentes que vous diffusez pour promouvoir votre petite entreprise et que vous souhaitez savoir quelle annonce est la plus efficace. Vous pouvez utiliser la formule de l'intervalle de confiance pour déterminer combien de temps vos annonces doivent être diffusées avant que les données collectées par Google soient suffisantes pour que vous sachiez quelle annonce est réellement meilleure.