Chapter 3 Modelos lineales generales
3.1 Ejemplo en R
Karl Pearson recopiló en 1903 las alturas de 1078 parejas formadas por un padre y un hijo. Cada fila contiene las alturas en pulgadas de un par Padre-Hijo.
Padres | Hijos |
---|---|
65.04851 | 59.77827 |
63.25094 | 63.21404 |
64.95532 | 63.34242 |
65.75250 | 62.79238 |
61.13723 | 64.28113 |
63.02254 | 64.24221 |
3.1.1 Descriptivo
- Comparemos en un scatter plot ambas variables.
3.1.2 Muestra
Seleccionaremos una muestra del 10 % del conjunto de datos:
set.seed(19)
muestra = sample_n(tbl = datos, size = 0.1*nrow(datos), replace = F)
pml2 = muestra %>%
ggplot(aes(x = Padres, y = Hijos)) +
geom_point() +
theme_minimal()
pml2
3.1.3 Modelo
- Construimos una regresion lineal con R.
Call:
lm(formula = Hijos ~ Padres, data = muestra)
Residuals:
Min 1Q Median 3Q Max
-4.7032 -1.0905 0.0068 1.3447 5.1066
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 26.13020 5.09384 5.130 1.33e-06 ***
Padres 0.62818 0.07498 8.378 2.58e-13 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.1 on 105 degrees of freedom
Multiple R-squared: 0.4006, Adjusted R-squared: 0.3949
F-statistic: 70.19 on 1 and 105 DF, p-value: 2.578e-13
3.1.4 Supuestos del modelo
- Normalidad
Shapiro-Wilk normality test
data: .
W = 0.98553, p-value = 0.3006
- Homogenidad de varianzas
Non-constant Variance Score Test
Variance formula: ~ fitted.values
Chisquare = 0.5571725, Df = 1, p = 0.4554
3.1.5 Intervalos de confianza
2.5 % 97.5 %
(Intercept) 16.0300435 36.2303473
Padres 0.4795086 0.7768547
3.1.6 Conclusiones
Modelo:
De una manera amigable, planteamos el modelo, por cada pulgada extra que el papá tenga, se puede esperar que en promedio la estatura del hijo aumente en 0.62818 pulgadas.
Aun hay detalles que observar como que el \(R^2\) es de apenas 40.06%.
3.2 Ajustes de modelos lineales generales en R
Estructura en R | Descripción |
---|---|
y ~ x1 | Regresion simple |
y ~ 0 + x1 | Regresion simple sin intercepto |
y ~ -1 + x1 | Regresion simple sin intercepto |
y ~ f1 + x1 | Factor + Continuo |
y ~ f1 + x1 + f1:x1 | Efectos principales e interaccion factor*continuo |
y ~ f1 + f2 + f1:f2 | ANOVA de dos vias |
y ~ f1*f2 | ANOVA de dos vias |
y ~ f1 + f2 + x1 + f1:x1 + f2:x1 + f1:f2 | Interacciones dobles |
y ~ (x1 + f1 + f2)^2 | Interacciones dobles |
y ~ f1 + f1:f3 | f3 anidado en f1 |
y ~ f1 + f1%in%f3 | f3 anidado en f1 |
y ~ f1/f3 | f3 anidado en f1 |