Diseño en bloques completamente aleatorizados.
El modelo de diseño de experimentos con bloques más sencillo es el diseño de bloques completamente aleatorizados, con este diseño se quiere estudiar la influencia de un factor tratamiento (T
) con I niveles en una variable de interés en presencia de una variable extraña, el factor bloque, B
, que tiene J bloques.
El motivo de la denominación de este modelo es la siguiente: se ha agrupan las unidades experimentales en J bloques, en función de B
, aleatorizando la forma de asignar los tratamientos dentro de cada bloque y es un diseño completo y equilibrado porque cada tratamiento se utiliza exactamente una vez dentro de cada bloque.
En este modelo, un bloque es un grupo de I unidades experimentales tan parecidas como sea posible con respecto a la variable B
, asignándose aleatoriamente cada tratamiento a una unidad dentro de cada bloque.
5.2.1 Modelo matemático.
La formulación matemática del modelo de diseño en bloques completamente aleatorizados con un factor principal (factor tratamiento), T
, con I niveles y un factor secundario (factor bloque), B
, con J niveles o bloques es la siguiente:
Para cada i = 1,...,I; j = 1,...,J,
|
- * Y ij el resultado del tratamiento i-ésimo, i = 1,2,...,I de T
al bloque j-ésimo, j = 1,2,...,ni.
- *
es la media de toda la población. Mide el nivel medio de todos los resultados.
- *
i es el efecto del tratamiento i-ésimo de T
, i = 1,2,...,I. Mide el efecto incremental del tratamiento del nivel i de T
sobre el efecto global. Se verifica que
i = 1I
i = 0,
- *
j es el efecto del bloque j-ésimo, j = 1,2,...,J, mide el efecto incremental del tratamiento del factor secundario (bloque) sobre el efecto global (
). Se verifica que
j = 1J
i = 0,
- *
ij es el error experimental o perturbación, son variables aleatorias independientes idénticamente distribuidas (i.i.d.) con distribución N
.
El número de observaciones es: n = IJ,
El problema básico que se plantea es contrastar la hipótesis nula de que el factor-tratamiento no influye,
|
En el estudio de este modelo debe de tenerse en cuenta que no existe interacción entre el factor-tratamiento y el factor-bloque y en el desarrollo el problema puede hacerse un segundo contraste acerca de si el factor-bloque es influyente o no. Este contraste es
|
Por ello en la práctica:
“Carece de interés plantearse la hipótesis nula de igualdad de los efectos bloque. El único objetivo puede ser el de concluir si bloquear el experimento resultó o no beneficioso”.
En efecto, si la suma de cuadrados medios atribuibles a los bloques es considerablemente mayor que la suma de cuadrados medios residual, habrá resultado útil bloquear en el sentido de que tal acción derivó en una reducción del tamaño del error experimental. En otro caso, bloquear es contraproducente.
5.2.2 Estimación de los parámetros.
utilizando n = IJ observaciones hay que estimar un número de parámetros
Se utiliza el método de mínimos cuadrados que se basa en minimizar la suma de los cuadrados de los residuos
|
se obtienen los siguientes estimadores:
|
|
|
|
La suma de los residuos en cada fila y cada columna es cero, por tanto, hay I + J - 1 relaciones entre los IJ residuos y el número de grados de libertad es
Razonando como en el modelo de diseño completamente aleatorizado se obtiene que el estimador de la varianza es la varianza residual
|
La distribución de los estimadores anteriores es la siguiente,
|
|
|
|
Para calcular intervalos de confianza acerca de las medias de los niveles, las distribuciones de referencia son:
Para las medias de los niveles
del factor tratamiento T
|
|
5.2.3 Análisis de la varianza.
Utilizando
se puede hacer la siguiente descomposición de las diferencias para cada i = 1,...,I;
j = 1,...,J,
j = 1,...,J,
elevando al cuadrado en (5.16) y teniendo en cuenta que los dobles productos se anulan, la suma de cuadrados global se puede descomponer de la forma:
esto es,
|
de donde se deduce la siguiente tabla ANOVA
| |||||||||||
|
|
|
| ||||||||
| Tratamientos |
| I - 1 |
| ||||||||
| Bloques |
| J -1 |
| ||||||||
| Residual |
| (I -1)(J -1) |
| ||||||||
| Global |
| IJ - 1 |
| ||||||||
| Rechazar H0(1) : | |||||||||||
| Rechazar H0(2) : | |||||||||||
Tabla 5.1: Análisis de la varianza para un diseño en bloques completamente aleatorizados.
De esta tabla ANOVA se deducen dos contrastes:
Comentarios.
| La eficacia de este diseño depende de los efectos de los bloques. Si éstos son pequeños, es más eficaz el diseño completamente aleatorio ya que el denominador en la comparación de tratamientos tiene menos grados de libertad. Sin embargo si los bloques influyen es mucho mejor y más eficaz este modelo, ya que disminuye la variabilidad no explicada. Por ello, es mejor estudiar primero el modelo de bloques aleatorizados y, si los bloques no influyen, sepasa fácilmente al modelo de un solo factor sumando en la tabla ANOVA la fila del factor bloque con la de la variabilidad residual. | ||||
| Se define el Coeficiente de Determinación como:
siendo R2(T
| ||||
| El tratamiento estadístico expuesto para el modelo de diseño de experimentos completamente aleatorizado con un factor tratamiento y un factor bloque es exactamente igual que el diseño de experimentos con dos factores tratamiento sin interacción. | ||||
| Si de la tabla ANOVA del modelo de diseño de experimentos completamente aleatorizado se deduce que existen diferencias entre los tratamientos, estas diferencias
Se pueden obtener intervalos de confianza de
| ||||
La eficacia de este diseño depende de los efectos de los bloques. Si éstos son pequeños, es más eficaz el diseño completamente aleatorio ya que el denominador en la comparación de tratamientos (ver (5. 13)) tiene menos grados de libertad. Sin embargo si los bloques influyen es mucho mejor y más eficaz este modelo ya que disminuye la variabilidad no explicada.
Por ello es mejor estudiar primero el modelo de bloques aleatorizados y, si los bloques no influyen, se pasa fácilmente al modelo de un solo factor sumando en la tabla ANOVA la fila del factor bloque con la de la variabilidad residual. Aunque existe una discusión acerca de si se puede pasar de un modelo a otro ya que una diferencia importante entre los dos modelos es que en un diseño completamente aleatorizado, los tratamientos y, equivalentemente, los niveles de los factores tratamiento son asignados aleatoriamente a las unidades experimentales. Por el contrario, en un diseño en bloques, aunque las observaciones son también tomadas sobre todas las combinaciones de tratamientos y bloques, sólo los niveles del factor tratamiento son asignados aleatoriamente a las unidades experimentales. Hay que tener en cuenta que la división de las unidades experimentales para formar los bloques es determinista. Esto ha hecho que exista una fuerte controversia acerca de si es apropiado o no contrastar la igualdad de los efectos bloque. Al fin y al cabo, en el diseño que se está analizando los bloques representan fuentes de variación “nuisance”, esto es, no existe interés alguno en la posible significación del efecto bloque. Más aún, es poco probable que sea factible utilizar los mismos bloques en una hipotética réplica del experimento.
Por todo ello, en la práctica
“Bloquear sin ser necesario conduce a pruebas de hipótesis menos potentes y a intervalos de confianza más amplios que aquellos que se obtendrían mediante un diseño completamente aleatorizado”.
| ||||
Si se tiene un diseño de experimentos con dos factores tratamiento (T
|
5.2.4 Análisis de residuos.
Como en cualquier modelo estadístico hay que contrastar que se verifican las hipótesis del modelo. Esto se hace, básicamente, por medio del análisis de los residuos. Todo lo estudiado sobre este particular en el modelo de un solo factor (diseño completamente aleatorizado) sigue siendo válido para este modelo. Secontrastarán las hipótesis de:
| Normalidad de los residuos. | ||||
| Homocedasticidad: la varianza en los diferentes niveles de cada uno de los dos factores es constante. | ||||
| Independencia de los residuos. | ||||
| Homogeneidad de los datos, todos provienen de la misma distribución y no hay datos atípicos. | ||||
| No existe interacción entre los dos factores. El concepto de interacción se estudia con mayor detalle en la sección siguiente. Intuitivamente y basándose en el ejemplo 5.1. que no exista interacción entre el factor tratamiento T
Si existe interacción entre T
|
5.2.5 Análisis de un caso.
Se desarrolla el problema presentado en el Ejemplo 5.1. cuyo enunciado más concreto es el siguiente,
Ejemplo 5.1.b.
“Una empresa fotográfica tiene que realizar una compra de impresoras de gran calidad que se van a utilizar en imprimir fotografías digitales. La empresa tiene ofertas de I = 5 marcas de impresoras de similares características y precio. Para la empresa fotográfica es muy importante la “velocidad de impresión” y, por este motivo, está interesada en saber si las 5 impresoras ofertadas tienen la misma velocidad o hay una que es más rápida. Para responder a esta pregunta decide hacer un experimento que consiste en elegir una única muestra de J = 4 fotos e imprimirlas en las 5 impresoras.
Los resultados del experimento se recogen en la tabla adjunta”
| Foto A | Foto B | Foto C | Foto D | |
| Impresora 1 |
89
|
88
|
97
|
94
|
| Impresora 2 |
84
|
77
|
92
|
79
|
| Impresora 3 |
81
|
87
|
87
|
85
|
| Impresora 4 |
87
|
92
|
89
|
84
|
| Impresora 5 |
79
|
81
|
80
|
88
|
Estimación de los parámetros.
Se obtienen las siguientes estimaciones
Estimaciones
| Foto A | Foto B | Foto C | Foto D | |||
| Impresora 1 |
89
|
88
|
97
|
94
| 92 | 6 |
| Impresora 2 |
84
|
77
|
92
|
79
| 83 | -3 |
| Impresora 3 |
81
|
87
|
87
|
85
| 85 | -1 |
| Impresora 4 |
87
|
92
|
89
|
84
| 88 | 2 |
| Impresora 5 |
79
|
81
|
80
|
88
| 82 | -4 |
84
|
85
|
89
|
86
| |||
-2
|
-1
|
3
|
0
| |||
Predicciones
| F. A | F. B | F. C | F. D | |
| I.1 |
90
|
91
|
95
|
92
|
| I.2 |
81
|
82
|
86
|
83
|
| I.3 |
83
|
84
|
88
|
85
|
| I.4 |
86
|
87
|
91
|
88
|
| I.5 |
80
|
81
|
85
|
82
|
Residuos
| F. A | F. B | F. C | F. D | |
| I.1 | -1 | -3 | 2 | 2 |
| I.2 | 3 | -5 | 6 | -4 |
| I.3 | -2 | 3 | -1 | 0 |
| I.4 | 1 | 5 | -2 | -4 |
| I.5 | -1 | 0 | -5 | 6 |
Intervalos de confianza.
Intervalos de confianza al 90% para los parámetros del modelo son:
Para
2,
Para
(tiempo medio global)
Para
I3 =
+
3 (tiempo medio de imprimir de la impresora 3)
Para
3 (el efecto de la impresora 3)
Para
31 =
3 -
1 =
I3 -
I1 (diferencia entre la impresora 3 y la 1)
Trabajando al 90% se obtienen los siguientes grupos homogéneos de impresoras:
• Imp. 5 - Imp. 2 - Imp. 3
• Imp. 2 - Imp. 3 - Imp. 4
• Imp. 4 - Imp. 1
Tabla ANOVA.
| Fuentes de | Suma de | Grados de | Varianzas |
| variación | cuadrados | libertad | |
| scT |
264
|
4
|
66'00
|
| scB |
70
|
3
|
23'33
|
| scExplicada |
334
|
7
|
47'71
|
| scR |
226
|
12
|
18'83
|
| scG |
560
|
19
|
29'47
|
H0
1 =
2 = ... =
5 = 0 (el “tipo de impresora” no influye)
p-valor= 0'0407. Se rechaza H0
para
= 0'05, pero el p-valor ofrece dudas acerca de la influencia del factor “tipo de impresora”.
H0
1 =
2 = ... =
4 = 0 (el “tipo de foto” no influye)
p-valor= 0'3387. Se acepta H0
para cualquier
razonable y el factor bloque “tipo de foto” no influye, por tanto, no convenía bloquear.
Coeficientes de determinación.
Los coeficientes de determinación parciales son
el factor “tipo de impresora” explica el 47'14% de variabilidad.
el factor “tipo de foto” explica el 12'50% de variabilidad.
El coeficiente de determinación total es la suma de los parciales,
el modelo explica el 59'64% de variabilidad.
Un modelo alternativo.
En conclusión, parece razonable aceptar la influencia del factor-tratamiento “tipo de impresora” y la no influencia del factor bloque “tipo de foto”. Se puede pasar facilmente al modelo completamente aleatorizado, la tabla ANOVA con un solo factor que se obtiene de la anterior sumando las filas de scB
y scR, obteniendo
Tabla ANOVA
Resultados con un solo factor
| |||
| Fuentes de | Suma de | Grados de | Varianzas |
| Variación | Cuadrados | libertad | |
| scT |
264
|
4
|
66'00
|
| scR |
296
|
15
|
19'73
|
| scG |
560
|
19
|
29'47
|
p-valor= 0'038. Se rechaza H0
para
> 0'038. Se tiene mayor seguridad acerca de la influencia del factor “tipo de impresora” que en el modelo anterior.
No hay comentarios:
Publicar un comentario