Prueba de Mann-Whitney

Esta calculadora en línea realiza la prueba U de Mann-Whitney (también llamada prueba de Mann-Whitney-Wilcoxon (MWW), prueba de suma de rangos de Wilcoxon o prueba de Wilcoxon-Mann-Whitney).

Esta página existe gracias a los esfuerzos de las siguientes personas:

Timur

Timur

Juan Manuel Gimenez

Juan Manuel Gimenez

Creado: 2021-03-21 17:14:55, Última actualización: 2021-03-21 17:14:55

Como se indicó en la prueba T de dos muestras, se puede aplicar la prueba t si se cumplen los siguientes supuestos

  • Que las dos muestras se extraen de forma independiente y aleatoria de la población o poblaciones de origen.
  • Que la escala de medición de ambas muestras tiene las propiedades de una escala de intervalo igual.
  • Que se puede suponer razonablemente que la(s) población(es) fuente(s) tiene(n) una distribución normal.

Sin embargo, a veces los datos no cumplen el segundo y/o tercer requisito. Por ejemplo, no hay nada que indique que tiene una distribución normal, o no tiene una escala de intervalo igual, es decir, no se puede suponer que el espacio entre valores adyacentes sea constante. Pero aún así quiere averiguar si la diferencia entre dos muestras es significativa. En estos casos, puede utilizar la prueba U de Mann-Whitney, una alternativa no paramétrica de la prueba t.

En estadística, la prueba U de Mann-Whitney (también llamada prueba de Mann-Whitney-Wilcoxon (MWW), prueba de suma de rangos de Wilcoxon o prueba de Wilcoxon-Mann-Whitney (WMW)) es una prueba no paramétrica de la hipótesis nula de que es igualmente probable que un valor seleccionado al azar de una muestra sea menor o mayor que un valor seleccionado al azar de una segunda muestra1, o p(X<Y)=0,5. Sin embargo, también se utiliza como sustituto de la prueba t de grupos independientes, con la hipótesis nula de que las dos medianas de la población son iguales.

En realidad hay dos pruebas: la prueba U de Mann-Whitney y la prueba de suma de rangos de Wilcoxon. Se desarrollaron de forma independiente y utilizan medidas diferentes, pero son estadísticamente equivalentes.

Los supuestos de la prueba de Mann-Whitney son:

  • Que las dos muestras se extraen de forma aleatoria e independiente;
  • Que la variable dependiente es intrínsecamente continua - capaz en principio, si no en la práctica, de producir medidas llevadas a la enésima cifra decimal;
  • Que las medidas dentro de las dos muestras tengan las propiedades de al menos una escala ordinal de medición, de modo que tenga sentido hablar de "mayor que", "menor que" e "igual a".2

Como puede ver, esta prueba no paramétrica no asume (ni requiere) muestras de poblaciones con distribución normal. Estas pruebas también se denominan pruebas sin distribución.

Palabra de advertencia

Se sabe desde hace tiempo que la prueba de Wilcoxon-Mann-Whitney se ve afectada por la heterogeneidad de la varianza cuando los tamaños de las muestras no son iguales. Sin embargo, incluso cuando los tamaños de las muestras son iguales, las diferencias muy pequeñas entre las varianzas de la población hacen que la prueba de Wilcoxon-Mann-Whitney de muestras grandes sea demasiado liberal, es decir, la tasa de error real de tipo I para la prueba de Wilcoxon-Mann-Whitney de muestras grandes aumenta a medida que aumenta el tamaño de la muestra3.

Por lo tanto, debe recordar que esta prueba es verdadera solo si las dos distribuciones de la población son iguales (incluida la homogeneidad de la varianza) aparte de un cambio de ubicación.

El método

El método sustituye los valores brutos por sus correspondientes rangos. Con esto, se pueden conseguir algunos resultados usando matemáticas simples. Por ejemplo, la suma total de rangos ya se conoce a partir del tamaño total y es \frac{N*(N+1)}{2}. Por lo tanto, el rango medio es \frac{N*(N+1)}{2}*\frac{1}{N}=\frac{N+1}{2}.

La idea general es que si la hipótesis nula es verdadera y las muestras no son significativamente diferentes, entonces los rangos están algo equilibrados entre A y B, y el rango medio de cada muestra debería aproximarse al rango medio total, y las sumas de rangos deberían aproximarse a \frac{n_A*(N+1)}{2} y \frac{n_B*(N+1)}{2} respectivamente.

El cálculo

Para realizar la prueba, primero hay que calcular una medida conocida como U para cada muestra.

Se empieza combinando todos los valores de ambas muestras en un único conjunto, ordenándolos por valor y asignando un rango a cada valor (en caso de empate, cada valor recibe un rango medio). Los rangos van de 1 a N, donde N es la suma de los tamaños n_A y n_B. Entonces se calcula la suma de rangos para los valores de cada muestra R_A y R_B.

Ahora puede calcular U como
U_A=n_A*n_B+\frac{n_A*(n_A+1)}{2}-R_A\\U_B=n_A*n_B+\frac{n_B*(n_B+1)}{2}-R_B

Para tamaños de muestra pequeños se pueden utilizar valores tabulados. Se toma el mínimo de dos Us, y luego se compara con el valor crítico correspondiente a los tamaños de muestra y al nivel de significación elegido. Los libros de texto de estadística suelen enumerar los valores críticos en tablas para tamaños de muestra de hasta 20.

Para tamaños de muestra grandes se puede utilizar la prueba z. Se ha demostrado que U se distribuye aproximadamente de forma normal si ambos tamaños de muestra son iguales o mayores que 5 (algunas fuentes dicen si n_A*n_B>204).

z=\frac{U-\mu_U}{\sigma_U},
donde
\mu_U=\frac{n_A*n_B}{2}\\ \sigma_U=\sqrt{\frac{n_A*n_B*(N+1)}{12}}

En caso de empate, la fórmula de la desviación estándar pasa a ser
\sigma_U=\sqrt{\frac{n_A*n_B}{N*(N-1)}*[\frac{N^3-N}{12}-\sum_{j=1}^g\frac{t_{j}^3-t_j}{12}]}
donde g es el número de grupos de empates, tj es el número de rangos empatados en el grupo j.

La calculadora de abajo utiliza la prueba z. Por supuesto, hay una limitación en los tamaños de las muestras (ambos tamaños de las muestras deben ser iguales o mayores que 5), pero probablemente no sea una gran limitación para los casos reales.

PLANETCALC, Prueba U de Mann-Whitney

Prueba U de Mann-Whitney

Dígitos después del punto decimal: 2
El archivo es muy grande; La ralentización del navegador puede ocurrir durante la carga y creación.
U para la muestra A
 
U para la muestra B
 
Mediana de U
 
Desviación estándar de U
 
Puntuación Z (valor absoluto)
 
Nivel de confianza para la hipótesis no direccional
 
Nivel de confianza para la hipótesis direccional
 

URL copiada al portapapeles
PLANETCALC, Prueba de Mann-Whitney

Comentarios