Vidéo: Comment calculer le coefficient de corrélation avec excel 2025
Le coefficient de corrélation de Spearman, r S , était le premier test non paramétrique basé sur les rangs. Pour un échantillon d'individus chacun mesuré sur deux variables dans Excel, l'idée est de classer chaque score dans sa propre variable. Ensuite, pour chaque individu, soustrayez un rang de l'autre. Si la corrélation est parfaite (dans le sens positif), toutes les différences sont nulles.
L'image ci-dessous montre un exemple. Un psychologue industriel a évalué la sociabilité de 20 employés de la FarDrate Timepiece Corporation. L'échelle variait de 1 (moins sociable) à 100 (plus sociable). Chaque employé de FarDrate a également évalué sa satisfaction au travail sur une échelle de 1 (la moins satisfaisante) à 80 (la plus grande satisfaction). L'hypothèse nulle est que la sociabilité n'est pas corrélée avec la satisfaction au travail. L'hypothèse alternative est que ces deux variables sont corrélées.
Les données sont dans les colonnes B et C, et les rangs sont dans les colonnes E et F. Les différences entre chaque paire de rangs sont dans la colonne G.
La formule est
où d est une différence d'interpolation. Comme c'est le cas avec le coefficient de corrélation régulier, si l'hypothèse nulle est vraie, la valeur de r S devrait être proche de zéro.
Pour calculer les rangs dans la colonne E, tapez
= RANK. AVG (B2, $ B $ 2: $ B $ 21, 1)
en E2 et autofilled. Pour les rangs de la colonne E, tapez
= RANK. AVG (C2, $ C $ 2: $ C $ 21, 1)
en F2 et autofilling.
Vous n'avez pas besoin de taper une formule Excel compliquée dans la cellule J4 pour calculer le coefficient de corrélation. Pourquoi? Parce qu'Excel et les statistiques mathématiques font équipe pour surprendre: il suffit de taper
= CORREL (E2: E21, F2: F21)
en J4. C'est tout ce qu'on peut en dire. Utiliser
CORREL
dans les rangs donne la même réponse que la formule ci-dessus. (Il n'est donc pas vraiment nécessaire de calculer les différences de rang d'interphase dans la colonne G.)
Calculer
N est le nombre de paires, et le test a N-2 degrés de liberté.
Vous pouvez définir
Number_of_pairs
comme nom de la valeur de la cellule I2. Donc tapez
= J4 * SQRT (Number_of_Pairs-2) / SQRT (1-J4 ^ 2)
dans J6 et
= T. DIST. 2T (J6, Number_of_Pairs-2)
en J7. Vous pouvez utiliser la fonction de distribution t bilatérale si vous ne connaissez pas la direction de la corrélation à l'avance. Et encore une fois, la valeur p faible vous dit de rejeter l'hypothèse nulle.
