Table des matières:
- Comment utiliser la fonction Wilcoxon de R pour des données anormalement distribuées
- Avec le test de base T et le test de Wilcoxon, vous testez si les échantillons diffèrent sans spécifier de quelle manière. Les statisticiens appellent cela un test bilatéral
Vidéo: Comparer la moyenne de 2 échantillons indépendants - Logiciel R Studio 3/3 2025
R vous donne deux tests standard pour comparer deux groupes avec des données numériques: le test t avec le t. test (), et le test de Wilcoxon avec le wilcox. test (). Si vous voulez utiliser le t. test (), vous devez d'abord vérifier, entre autres choses, si les deux échantillons sont normalement distribués. Pour le test de Wilcoxon, ce n'est pas nécessaire.
Comment utiliser la fonction Wilcoxon de R pour des données anormalement distribuées
Dans certains cas, vos données s'écartent considérablement de la normalité et vous ne pouvez pas utiliser le t. test (). Pour ces cas, vous avez le wilcox. La fonction test () que vous utilisez exactement de la même manière, comme indiqué dans l'exemple suivant: >> wilcox. test (temp ~ activ, données = beaver2)
Vous obtenez la sortie suivante:
Test de somme de Wilcoxon avec données de correction de continuité: temp par activ W = 15, valeur p <2. 2e-16 alternative Hypothèse: le décalage d'emplacement vrai n'est pas égal à 0
Encore une fois, vous obtenez la valeur de la statistique de test (W dans ce test) et une valeur p. Sous cette information, vous lisez l'hypothèse alternative, et cela diffère un peu de l'hypothèse alternative d'un test t. Le test de Wilcoxon vérifie si le centre de vos données (l'emplacement) diffère entre les deux échantillons.
Comment utiliser le test T de R et le test de Wilcoxon pour tester la direction
Avec le test de base T et le test de Wilcoxon, vous testez si les échantillons diffèrent sans spécifier de quelle manière. Les statisticiens appellent cela un test bilatéral
. Imaginez que vous ne voulez pas savoir si la température corporelle diffère entre les périodes actives et inactives, mais si la température corporelle est plus basse pendant les périodes inactives.
Par défaut, il a la valeur 'deux. côté ', ce qui signifie que vous voulez le test standard recto verso.
-
Si vous voulez tester si la moyenne (ou l'emplacement) du premier groupe est inférieure, vous lui donnez la valeur «moins».
-
Si vous voulez tester si cette moyenne est plus grande, vous spécifiez la valeur 'plus grand'.
-
Si vous utilisez l'interface de formule pour ces tests, les groupes sont classés dans le même ordre que les niveaux du facteur que vous utilisez. Vous devez en tenir compte pour savoir quel groupe est considéré comme le premier groupe.Si vous donnez les données pour les deux groupes en tant que vecteurs séparés, le premier vecteur est le premier groupe.
