Prueba t de dos muestras

La calculadora para realizar la prueba t para la significación de la diferencia entre las medias de dos muestras independientes

Esta página existe gracias a los esfuerzos de las siguientes personas:

Timur

Timur

Juan Manuel Gimenez

Juan Manuel Gimenez

Creado: 2021-05-04 16:54:42, Última actualización: 2021-05-04 16:54:42

La calculadora que aparece a continuación implementa la prueba estadística más conocida, a saber, la prueba t de muestras independientes o la prueba t de dos muestras. La prueba t es también conocida como prueba t de Student, en honor a William Sealy Gosset. "Student" era su seudónimo.

La prueba trata de la hipótesis nula de que las medias de dos poblaciones son iguales. En otras palabras, la diferencia que encontremos entre las medias de las dos muestras no debe ser significativamente distinta de cero.

De nuevo, la prueba solo funciona si se cumplen ciertos supuestos. Estos son:

  • Que las dos muestras se extraigan de forma independiente y aleatoria de la población o poblaciones de origen.
  • Que la escala de medición de ambas muestras tenga las propiedades de una escala de intervalos iguales.
  • Que se pueda suponer razonablemente que la(s) población(es) fuente(s) tiene(n) una distribución normal.
  • Y, para esta implementación particular de la prueba, que la varianza de cada población sea la misma

La calculadora muestra un nivel de confianza para las pruebas direccionales y no direccionales. Digamos que se obtiene un resultado del 96%. Esencialmente, esto significa que tiene un 96% de confianza en que la diferencia obtenida muestra algo más que simple suerte. La probabilidad de que obtenga la diferencia obtenida y las medias de las dos muestras sean iguales es solo del 4%. Este es el nivel de significación que calcula. Ahora, dependiendo del nivel de significación que haya elegido, puede rechazar o no rechazar su hipótesis nula.

Para estimar la confianza, necesitamos calcular el valor t y luego buscar la CDF inversa de la distribución t de Student con (N_a-1)+(N_b-1) grados de libertad. N_a es el tamaño de la muestra A y N_b es el tamaño de la muestra B.

Para hallar el valor t se empieza por calcular la media M_x y la suma de las desviaciones al cuadrado, o suma de cuadrados SS=\sum{(X_i-M_x)^2 para cada muestra.

Entonces se estima la varianza de la población fuente como
\{s^{2}_p\}=\frac{SS_a+SS_b}{(N_a-1)+(N_b-1)}
Esta estimación se denomina varianza compartida, y es un método para estimar la varianza de varias poblaciones diferentes cuando la media de cada población puede ser diferente. Aun así, se puede suponer que la varianza de cada población es la misma.

Entonces se estima la desviación estándar de la distribución muestral de las diferencias de la media de la muestra (el "error estándar" de M_X_a-M_X_b) como
est.\sigma_{M-M}=\sqrt{\frac{\{s^{2}_p\}}{N_a}+\frac{\{s^{2}_p\}}{N_a}}.

Finalmente, se calcula t como
t=\frac{M_X_a-M_X_b}{est.\sigma_{M-M}}

Si quiere saber más, puede leer excelentes explicaciones aquí, a partir del capítulo 9.

PLANETCALC, Prueba t de dos muestras

Prueba t de dos muestras

Dígitos después del punto decimal: 1
Media de la muestra A
 
Media de la muestra B
 
Valor t
 
Hipótesis no direccional
 
Nivel de confianza para la prueba de significación de dos colas
 
Hipótesis direccional
 
Nivel de confianza para la prueba de significación de una cola
 

URL copiada al portapapeles
PLANETCALC, Prueba t de dos muestras

Comentarios