Vidéo: TP Concours Mines Ponts : diffusion thermique modélisée par une chaîne de cellules RC. 2025
Pour vous aider à comprendre l'analyse statistique avec Excel, il est utile de simuler le théorème de limite centrale. Ça ne sonne presque pas bien. Comment une population qui n'est pas normalement distribuée peut-elle donner une distribution d'échantillonnage normalement distribuée?
Pour vous donner une idée du fonctionnement du théorème central, il existe une simulation. Cette simulation crée quelque chose comme une distribution d'échantillonnage de la moyenne pour un très petit échantillon, basé sur une population qui n'est pas normalement distribuée. Comme vous le verrez, même si la population n'est pas une distribution normale, et même si l'échantillon est petit, la distribution d'échantillonnage de la moyenne ressemble beaucoup à une distribution normale.
Imaginez une population énorme composée de seulement trois scores - 1, 2 et 3 - et chacun d'entre eux est également susceptible d'apparaître dans un échantillon. Imaginez aussi que vous pouvez sélectionner au hasard un échantillon de trois scores de cette population.
Échantillon | Moyenne | Échantillon | Moyenne | Échantillon | Moyenne |
1, 1, 1 | 1. 00 | 2, 1, 1 | 1. 33 | 3, 1, 1 | 1. 67 |
1, 1, 2 | 1. 33 | 2, 1, 2 | 1. 67 | 3, 1, 2 | 2. 00 |
1, 1, 3 | 1. 67 | 2, 1, 3 | 2. 00 | 3, 1, 3 | 2. 33 |
1, 2, 1 | 1. 33 | 2, 2, 1 | 1. 67 | 3, 2, 1 | 2. 00 |
1, 2, 2 | 1. 67 | 2, 2, 2 | 2. 00 | 3, 2, 2 | 2. 33 |
1, 2, 3 | 2. 00 | 2, 2, 3 | 2. 33 | 3, 2, 3 | 2. 67 |
1, 3, 1 | 1. 67 | 2, 3, 1 | 2. 00 | 3, 3, 1 | 2. 33 |
1, 3, 2 | 2. 00 | 2, 3, 2 | 2. 33 | 3, 3, 2 | 2. 67 |
1, 3, 3 | 2. 33 | 2, 3, 3 | 2. 67 | 3, 3, 3 | 3. 00 |
Si vous regardez attentivement la table, vous pouvez presque voir ce qui va se passer dans la simulation. La moyenne d'échantillon qui apparaît le plus fréquemment est de 2. 00. Les moyennes d'échantillon qui apparaissent le moins fréquemment sont 1. 00 et 3. 00. Hmmm …
Dans la simulation, un score a été choisi au hasard parmi la population et ensuite deux plus. Ce groupe de trois scores est un échantillon. Ensuite, vous calculez la moyenne de cet échantillon. Ce processus a été répété pour un total de 60 échantillons, résultant en 60 échantillons. Enfin, vous représentez graphiquement la distribution des moyennes d'échantillon.
À quoi ressemble la distribution d'échantillonnage simulée de la moyenne? L'image ci-dessous montre une feuille de calcul qui répond à cette question.
Dans la feuille de calcul, chaque rangée est un échantillon.Les colonnes étiquetées x1, x2 et x3 montrent les trois scores pour chaque échantillon. La colonne E montre la moyenne de l'échantillon dans chaque rangée. La colonne G montre toutes les valeurs possibles pour la moyenne de l'échantillon, et la colonne H montre à quelle fréquence chaque moyenne apparaît dans les 60 échantillons. Les colonnes G et H, et le graphique, montrent que la distribution a sa fréquence maximale lorsque la moyenne de l'échantillon est de 2. 00. Les fréquences s'arrêtent lorsque les moyennes de l'échantillon s'éloignent de 2. 00.
Le point de tout cela est que la population n'a rien à voir avec une distribution normale et que la taille de l'échantillon est très petite. Même sous ces contraintes, la distribution d'échantillonnage de la moyenne basée sur 60 échantillons commence à ressembler à une distribution normale.
Qu'en est-il des paramètres que le théorème de la limite centrale prédit pour la distribution d'échantillonnage? Commencez avec la population. La moyenne de population est 2. 00 et l'écart-type de la population est. 67. (Ce genre de population nécessite des mathématiques un peu fantaisistes pour déterminer les paramètres.)
Sur la distribution d'échantillonnage. La moyenne des 60 moyennes est 1. 98, et leur écart-type (une estimation de l'erreur-type de la moyenne) est. 48. Ces nombres s'approchent étroitement des paramètres théoriques du théorème limite limite pour la distribution d'échantillonnage de la moyenne, 2,00 (égale à la moyenne de la population) et. 47 (l'écart-type, 67, divisé par la racine carrée de 3, la taille de l'échantillon).
Si vous êtes intéressé par cette simulation, voici les étapes à suivre:
- Sélectionnez une cellule pour votre premier numéro sélectionné au hasard.
Sélectionnez la cellule B2.
- Utilisez la fonction de feuille de calcul
RANDBETWEEN
pour sélectionner 1, 2 ou 3.Ceci simule le dessin d'un nombre d'une population composée des chiffres 1, 2 et 3 où vous avez une chance égale de sélectionner chaque nombre. Vous pouvez sélectionner
FORMULES | Math & Trig | RANDBETWEEN
et utilisez la boîte de dialogue Arguments Fonction ou tapez simplement= RANDBETWEEN (1, 3)
dans B2 et appuyez sur Entrée. Le premier argument est le plus petit nombre RANDBETWEEN renvoie, et le second argument est le plus grand nombre. - Sélectionnez la cellule à droite de la cellule d'origine et choisissez un autre nombre aléatoire compris entre 1 et 3. Procédez à nouveau pour un troisième nombre aléatoire dans la cellule à la droite du second.
La méthode la plus simple consiste à remplir automatiquement les deux cellules à droite de la cellule d'origine. Dans cette feuille de calcul, ces deux cellules sont C2 et D2.
- Considérez ces trois cellules comme un échantillon et calculez leur moyenne dans la cellule à droite de la troisième cellule.
Le plus simple est de taper
= MOYENNE (B2: D2)
dans la cellule E2 et d'appuyer sur Entrée. - Répétez ce processus pour autant d'échantillons que vous souhaitez inclure dans la simulation. Chaque rangée correspond à un échantillon.
60 échantillons ont été utilisés ici. Le moyen rapide et facile d'y parvenir est de sélectionner la première rangée de trois nombres choisis au hasard et leur moyenne, puis remplir automatiquement les lignes restantes. L'ensemble des moyennes d'échantillons dans la colonne E est la distribution d'échantillonnage simulée de la moyenne.Utilisez
MOYEN
et
STDEV. P
pour trouver sa déviation moyenne et standard.
Pour voir à quoi ressemble cette distribution d'échantillonnage simulée, utilisez la fonction de tableau
FREQUENCY
sur les moyennes de l'échantillon dans la colonne E. Procédez comme suit:
- Entrez les valeurs possibles de la moyenne de l'échantillon dans un tableau.
Vous pouvez utiliser la colonne G pour cela. Vous pouvez exprimer les valeurs possibles de la moyenne de l'échantillon sous forme de fraction (3/3, 4/3, 5/3, 6/3, 7/3, 8/3 et 9/3) comme celles entrées dans les cellules G2 à G8. Excel les convertit en forme décimale. Assurez-vous que ces cellules sont au format numérique.
- Sélectionnez un tableau pour les fréquences des valeurs possibles de la moyenne de l'échantillon.
Vous pouvez utiliser la colonne H pour maintenir les fréquences, en sélectionnant les cellules H2 à H8.
- Dans le menu Fonctions statistiques, sélectionnez
FREQUENCY
pour ouvrir la boîte de dialogue Arguments de fonction pourFREQUENCY
- Dans la boîte de dialogue Arguments de la fonction, entrez les valeurs appropriées pour les arguments.
Dans la zone Data_array, entrez les cellules contenant les moyennes d'échantillon. Dans cet exemple, c'est E2: E61.
- Identifiez le tableau contenant les valeurs possibles de la moyenne de l'échantillon.
FREQUENCY
contient ce tableau dans la boîte Bins_array. Pour cette feuille de calcul, G2: G8 va dans la boîte Bins_array. Après avoir identifié les deux tableaux, la boîte de dialogue Arguments de la fonction affiche les fréquences à l'intérieur d'une paire d'accolades. - Appuyez sur Ctrl + Maj + Entrée pour fermer la boîte de dialogue Arguments de fonction et afficher les fréquences.
Utilisez cette combinaison de touches car
FREQUENCY
est une fonction de tableau. - Enfin, avec H2: H8 en surbrillance, sélectionnez
Insérer | Graphiques recommandés
et choisissez la disposition Clustered Column pour produire le graphique des fréquences. Votre graphique sera probablement légèrement différent du mien, car vous aurez probablement un nombre aléatoire différent.
En passant, Excel répète le processus de sélection aléatoire chaque fois que vous faites quelque chose qui oblige Excel à recalculer la feuille de calcul. L'effet est que les nombres peuvent changer pendant que vous travaillez par ceci. (C'est-à-dire que vous réexécutez la simulation.) Par exemple, si vous revenez en arrière et que vous remplissez de nouveau automatiquement l'une des lignes, les chiffres changent et le graphique change.
