Análisis de la varianza de una vía.
3.4.1 Idea general.
El problema básico es contrastar la hipótesis nula de que el factor no influye en la variable de interés,
o equivalentemente
frente a la alternativa de que el factor si influye. Esto es, existen diferencias entre los valores medios de los distintos tratamientos,
La idea básica del test análisis de la varianza es comparar:
- * la suma de cuadrados residual bajo el modelo matemático cuando H1 es cierto, (modelo completo),
- * con la suma de cuadrados residual del modelo que resulta cuando H0 es cierto (modelo reducido).
Es decir:
Si H0 es cierto, el único parámetro de medias es
que se estima por
Por tanto, la suma de cuadrados residual del modelo reducido (H0) es:
Se verifica que
Si H0 es falsa y al menos dos efectos tratamiento difieren, la suma de cuadrados residual scR bajo el modelo completo es considerablemente más pequeña que la suma de cuadrados residual del modelo reducido scR0. Por el contrario, si H0 es cierta ambas serán muy similares.
|
El valor scT es grande si se rechaza H0, pero no se puede utilizar como medida de discrepancia del contraste porque es dimensionada (tiene las unidades de Y ). Por ello se utiliza como estadístico del contraste el cociente entre scT y scR.
Si scT es grande en relación a scR se rechaza H0.
3.4.2 Descomposición de la variabilidad.
Teniendo en cuenta que:
elevando al cuadrado se obtiene
este resultado es debido a que se anulan los dobles productos que aparecen al elevar al cuadrado. Los grados de libertad de estos términos son:
- • n - 1 es el número de grados de libertad de scG, porque hay n observaciones relacionadas por la ecuación
i = 1I
j = 1ni
= 0.
- • I - 1 es el número de grados de libertad de scT, porque hay I efectos de los tratamientos relacionados por la ecuación
i = 1Ini
=
i = 1Ini
i = 0.
- • n - I es el número de grados de libertad de scR, porque hay n residuos relacionados por las ecuaciones
i = 1I
j = 1ni
=
i = 1I
j = 1nieij = 0, i = 1,...,I.
Dividiendo las sumas de cuadrados por los correspondientes grados de libertad se obtienen tres estimaciones distintas de
2:
Si H0 (las medias son iguales) es cierta, se verifica que
Por tanto,
|
Se rechaza H0 al nivel de significación
si
Comentarios.
- Si el test F resulta significativo (se rechaza H0, por tanto, el factor es influyente) se deberá estudiar entre qué tratamientos existen diferencias significativas.
- Una medida relativa de la variabilidad explicada por el factor es el coeficiente de determinación, definido como
(3.21) - Si de desea aumentar la precisión del contraste, puede hacerse de dos formas:
- En algunos textos se utiliza la siguiente notación: scG = V T (Variabilidad Total), scT = V E (Variabilidad Explicada), scR = V NE (Variabilidad No Explicada).
- En general, sea cierta o no la hipótesis nula, se verifica quesiendo
(3.22)
| |||||||||||||
|
|
|
|
| |||||||||
| Tratamientos |
| I - 1 |
| ||||||||||
| Residual |
| n - I |
| ||||||||||
| Global |
| n - 1 | |||||||||||
| Rechazar H0 : | |||||||||||||
| Coeficiente de Determinación: R2 = | |||||||||||||
Cuadro 1.1: Cuadro del análisis de la varianza para un diseño completamente aleatorizado de efectos fijos.
No hay comentarios:
Publicar un comentario