Test de Wilcoxon-Mann-Whitney

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Test de Mann-Whitney

Type	Test statistique
Inventeurs	Henry Mann, Frank Wilcoxon, Donald Whitney
Nommé en référence à	Henry Mann, Frank Wilcoxon, Donald Whitney
Formule	$U=\sum _{i=1}^{n}\sum _{j=1}^{m}{\begin{cases}1&Y_{i}<X_{j}\\{\frac {1}{2}}&Y_{i}=X_{j}\\0&Y_{i}>X_{j}\end{cases}}$

modifier - modifier le code - modifier Wikidata

En statistique, le test de Wilcoxon-Mann-Whitney (ou test U de Mann-Whitney ou encore test de la somme des rangs de Wilcoxon) est un test statistique non paramétrique qui permet de tester l'hypothèse selon laquelle les distributions de chacun de deux groupes de données sont proches.

Il a été proposé par Frank Wilcoxon en 1945^[1] et par Henry Mann et Donald Ransom Whitney en 1947^[2].

L'énorme avantage de ce test est sa simplicité, même si de ce fait son utilisation est limitée. Comme tous les tests statistiques, il consiste, à partir de ce qui est observé, à mettre en évidence un évènement dont on connait la loi de probabilité (au moins sa forme asymptotique). La valeur obtenue, si elle est peu probable selon cette loi, suggèrera de rejeter l'hypothèse nulle.

Présentation formelle

On considère deux populations X et Y de tailles respectives $n_{x}$ et $n_{y}$ . On suppose les observations indépendantes et disposant d'une relation d'ordre. On souhaite tester l'hypothèse suivante :

H₀ : la probabilité qu'une observation de la population X soit supérieure à une observation de la population Y est égale à la probabilité qu'une observation de la population Y soit supérieure à une observation de la population X : P(X > Y) = P(Y > X).

En général l'hypothèse plus forte « les deux distributions sont égales » est utilisée.

Si nous ordonnons les $(n_{x}+n_{y})$ éléments de $X\cup Y$ par ordre croissant, nous pouvons définir, pour chaque individu, son rang dans la séquence ainsi formée. Soit $S_{x}$ la somme des $n_{x}$ rangs des éléments de X.

On montre que, sous H₀, l'évènement $S_{x}=t$ suit une distribution connue, tabulée pour de petits échantillons et qui peut être approchée par une loi de probabilité gaussienne de moyenne $E=n_{x}n_{y}/2$ et de variance $V={\frac {n_{x}n_{y}(n_{x}+n_{y}+1)}{12}}$ pour des échantillons de taille supérieure à 20 environ.

Le test est construit en confrontant la valeur effectivement obtenue à cette moyenne et cet écart type : on peut ainsi estimer la probabilité de cette valeur sous l'hypothèse nulle et ainsi décider ou non de rejeter cette hypothèse nulle.

On calculera la valeur : $\varepsilon =\left|S_{x}-E\right|/{\sqrt {V}}$ , qui, si elle est supérieure à 1,96 (risque de 5 %), permet de rejeter l'hypothèse nulle H₀ d'égalité des deux échantillons.

Implémentation

wilcox.test avec R et la bibliothèque "stats"
scipy.stats.mannwhitneyu avec Python3 et le module "scipy.stats"
pingouin.mwu avec Python3 et le module "pingouin"

Notes et références

↑ (en) Frank Wilcoxon, « Individual comparisons by ranking methods », Biometrics Bulletin (en), vol. 1, n^o 6,‎ 1945, p. 80–83 (DOI 10.2307/3001968, JSTOR 3001968).
↑ (en) Henry B. Mann et Donald R. Whitney, « On a test of whether one of two random variables is stochastically larger than the other », Ann. Math. Stat., vol. 18, n^o 1,‎ 1947, p. 50–60 (DOI 10.1214/aoms/1177730491).

v · m

Tests statistiques

Tests de comparaison d'une seule variable

Pour un échantillon	Test Z Test t pour un échantillon Test des signes Test des rangs signés de Wilcoxon Estimateur de Hodges-Lehmann
Pour deux échantillons	Test F Test de Student Test t de Welch Test U de Mann-Whitney Test du χ² d'homogénéité Test de McNemar Test de la médiane
Pour 3 échantillons ou plus	Analyse de la variance (ANOVA) Test de Kruskal-Wallis ANOVA de Friedman Test de Bartlett Test de Levene Test de Brown-Forsythe

Tests de comparaison de deux variables

Deux variables quantitatives : Tests de corrélation	Corrélation de Pearson Corrélation de Spearman Corrélation de Kendall
Deux variables qualitatives	Test exact de Fisher Test du χ² d'indépendance Test Gamma
Plus de deux variables	Concordance de Kendall Analyse de variance multivariée Test Q de Cochran