2.3 Test sobre una y dos muestras
Se introducen dos funciones: t.test
y wilcox.test
para el test t y el test de Wilcoxon respectivamente. Ambos pueden ser usados para una muestra o dos muestras así como para datos pareados. Note que el test de Wilcoxon para dos muestras es lo mismo que el test de Mann–Whitney.
2.3.1 El test t
Este test se basa en el supuesto de normalidad de los datos. Es decir que los datos \(x_1 \ldots, x_n\) se asumen como realizaciones independientes de variables aleatorias con media \(\mu\) y media \(\sigma^2\), \(N(\mu,\sigma^2)\). Se tiene que la hipótesis nula es que \(\mu = \mu_0\).
Se puede estimar los parámetros \(\mu\) y \(\sigma\) por la media \(\bar{x}\) y la desviación estándar \(\sigma\), aunque recuerde que solo son estimaciones del valor real.
Veamos un ejemplo del consumo diario de calorías de \(11\) mujeres:
Veamos algunas estadísticas de resumen:
## [1] 6753.636
## [1] 1142.123
## 0% 25% 50% 75% 100%
## 5260 5910 6515 7515 8770
Se podría querer saber si el consumo de energía de las mujeres se desvía de una valor recomendado de \(7725\). Asumiendo que los datos vienen de una distribución normal, el objetivo es hacer una prueba para saber si la media de la distribución es \(\mu = 7725\).
##
## One Sample t-test
##
## data: daily.intake
## t = -2.8208, df = 10, p-value = 0.01814
## alternative hypothesis: true mean is not equal to 7725
## 95 percent confidence interval:
## 5986.348 7520.925
## sample estimates:
## mean of x
## 6753.636
Analicemos el resultado como Jack el Destripador (por partes).
One Sample t-test
: Muestra el tipo de test.data: daily.intake
: Indica los datos usados para el testt = -2.8208, df = 10, p-value = 0.01814
: Aquí se empieza a poner interesante. Arroja el valor del estadístico t, los grados de libertad y el valor p. Como tenemos el valor p, no es necesario ir a la tabla de valores de la distribución t. Con un nivel de significancia de \(5\%\), en este caso se rechaza la hipótesis nula.alternative hypothesis: true mean is not equal to 7725
. Esto contiene dos pedazos de información importante: + El valor puntual sobre el que realizamos el test. + Que el test es de dos colas (not equal to
).95 percent confidence interval
: es el intervalo de confianza de la media verdadera.sample estimates
: es la estimación puntual de la media verdadera.
2.3.2 Prueba de los rangos con signo de Wilcoxon
Si se desea evitar el supuesto de normalidad de los datos, los métodos de distribución libre son una alternativa. Estos generalmente se obtienen reemplazando los datos con estadísticos de orden.
##
## Wilcoxon signed rank test with continuity correction
##
## data: daily.intake
## V = 8, p-value = 0.0293
## alternative hypothesis: true location is not equal to 7725
Se ve que no se tiene tantos resultados como en el test t
. Esto es porque no se tiene la estimación de un parámetro por lo que no hay intervalos de confianza, etc. Para efectos prácticos, cuando se trata de una muestra, el test t
y el de Wilcoxon suelen arrojar resultados muy similares.
2.3.3 Test t para dos muestras
Se usa esta prueba con la hipótesis nula de que dos muestras provengan de distribuciones normales con la misma media.
Se puede tener dos enfoques, que las muestras tengan la misma varianza (enfoque clásico) o difieran en varianza.
uu <- "https://raw.githubusercontent.com/vmoprojs/DataLectures/refs/heads/master/energy.csv"
energy <- read.csv(uu)
t.test(energy$expend~energy$stature)
##
## Welch Two Sample t-test
##
## data: energy$expend by energy$stature
## t = -3.8555, df = 15.919, p-value = 0.001411
## alternative hypothesis: true difference in means between group lean and group obese is not equal to 0
## 95 percent confidence interval:
## -3.459167 -1.004081
## sample estimates:
## mean in group lean mean in group obese
## 8.066154 10.297778
El intervalo de confianza es para las diferencias entre las medias (note que no contiene a 0). Por defecto se calcula el test asumiendo que se tiene varianzas diferentes en las muestras. Si se desea especificar que las varianzas con iguales se tiene:
##
## Two Sample t-test
##
## data: energy$expend by energy$stature
## t = -3.9456, df = 20, p-value = 0.000799
## alternative hypothesis: true difference in means between group lean and group obese is not equal to 0
## 95 percent confidence interval:
## -3.411451 -1.051796
## sample estimates:
## mean in group lean mean in group obese
## 8.066154 10.297778
Note que ahora los grados de libertad ahora son \(13+9-2 = 20\)
2.3.4 Comparación de varianzas
Aún cuando en R
se puede hacer la prueba sobre dos muestras sin el supuesto de igualdad en las varianzas, podrías estar interesado en hacer una prueba exclusiva de este supuesto.
##
## F test to compare two variances
##
## data: energy$expend by energy$stature
## F = 0.78445, num df = 12, denom df = 8, p-value = 0.6797
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.1867876 2.7547991
## sample estimates:
## ratio of variances
## 0.784446
Note que este test asume que los grupos son independientes, no se debe aplicar el test cuando los datos son dependientes.