Análisis de un caso de diseño con un factor fijo.
En esta sección se analiza con detalle un problema de un diseño de experimentos completamente aleatorizado. El enunciado del problema es el dado en el Ejemplo 3.1.
Ejemplo 3.1.
“Una empresa desea estudiar la productividad media por hora en el montaje de un mecanismo electrónico en las tres fábricas que tiene: FA, FB y FC. Para ello se han recogido los datos que aparecen en la tabla. La recogida de datos se ha aleatorizado y nada presupone que existan factores con influencia en los resultados obtenidos.”
| Factor: Fábrica | FA | FB | FC | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Y : Product/hora |
|
|
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Número datos | 16 | 20 | 18 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Media | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Desviación Típica | sY/A = 0'338 | sY/B = 0'423 | sY/C = 0'270 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| sY = 0'371 |
Estimación de los parámetros.
Se obtienen las siguientes estimaciones
Teniedo en cuenta el modelo ajustado
Las medias en cada una de las fábricas son:
Intervalos de confianza.
Un intervalo de confianza al 95% para la media de la fábrica A es
Un intervalo de confianza al 95% para la varianza
2 es
Tabla ANOVA del modelo
Tabla ANOVA
| |||
Fuentes de variación
| Suma de cuadrados | Grados de libertad | Varianzas |
| Entre fábricas (scT) | 0'9141 | 2 | 0'4570 |
| Residual (scR) | 6'3673 | 51 | 0'1248 |
| Total (scG) | 6'3673 | 53 | 0'1373 |
El estadístico del contraste es
La tabla de la F proporciona un p - valor = 0'0327. Por tanto se rechaza la influencia del factor fábrica para
= 0'05 y se acepta para
= 0'01. Ver la Figura 3.1.
Figura 3.1. p-valor del contraste.
El factor explica el 12’55% de la variabilidad total.
Intervalo de confianza para la diferencia de medias.
Se calcula un intervalo de confianza al 90% para la diferecia de medias entre la productividad de la fábrica B y la de la fábrica C
.
Utilizando el estadístico dado en (3.25 ) se obtiene
A partir de este estadístico pivote (con distribución t) se puede hacer el siguiente test de hipótesis
Utilizando los resultados anteriores se obtiene
El p - valor = 0'0047 y se rechaza claramente la igualdad de medias de las fábricas B y C.
Comparando las medias de los niveles dos a dos se obtienen los siguientes grupos homogéneos:
• Fábrica A y Fábrica B.
• Fábrica A y Fábrica C.
Efectos aleatorios.
En lo expuesto en este capítulo se supone que el factor tratamiento del modelo de diseño completamente aleatorizado es de efectos fijos, esto es, los niveles del factor son seleccionados específicamente por el experimentador ya que el interés del experimento se centra en conocer los efectos sobre la respuesta de estos niveles particulares. En este caso los efectos del factor
son “constantes” desconocidas (parámetros). Los modelos conteniendo únicamente efectos fijos se denominan también modelos de efectos fijos.
En muchas situaciones el experimentador tiene interés en un factor con un número elevado de “posibles niveles” y para realizar el experimento es necesario seleccionar una muestra de ellos al azar. En este caso el factor es de efectos aleatorios y, en el modelo matemático del diseño los factores son variables aleatorias idénticamente distribuidas según la distribución de la población de niveles. Los modelos con factores de efectos aleatorios se denominan modelos de efectos aleatorios. En estos modelos el interés radica en medir la variabilidad existente en la totalidad de los efectos de la población de niveles. El objetivo es distinto del caso de efectos fijos y, por consiguiente, la planificación y análisis difiere en ambos modelos.
Hay modelos de diseños de experimentos con factores fijos y factores aleatorios que se denominan modelos mixtos.
En esta sección se estudia el modelo de diseño completamente aleatorizado con el factor de efectos aleatorios. Se supone que la población de niveles es infinita o lo suficientemente grande como para ser considerada como tal, en caso contrario es necesario aplicar correcciones para poblaciones finitas en la formulación matemática del modelo.
Ejemplo 3.2.
Una marca de coches está interesada en controlar la variabilidad en el consumo de los coches que fabrica de un determinado modelo y para ello somete a un número de coches a una prueba que consiste en que los coches hagan un recorrido predeterminado y se calcule el consumo realizado. Las causas más probables de esta variabilidad son dos: los coches utilizados (no todos tienen el mismo consumo) y los conductores que hacen la prueba.
Pueden considerarse dos situaciones:
[1] Los conductores que participan en el experimento son personal de la empresa acostumbrado a realizar este tipo de pruebas y se cree que su influencia es casi nula, de modo que casi con total seguridad el problema radica en las unidades de coche fabricadas que se están provando. El factor tratamiento es “los coches” y los niveles son todos los coches fabricados y que se podrían fabricar en el futuro. Teóricamente esta población de niveles es infinita y se puede suponer que los coches elegidos entre los últimos fabricados son una muestra aleatoria de todas los fabricados. El efecto del coche sobre el consumo es un efecto aleatorio y se modela mediante una variable aleatoria.
[2] Se sabe que hay muy pocas diferencias entre los coches fabricados o están son mínimas, y se supone que su influencia en el consumo es prácticamente nula. Por otra parte, la fábrica de coches ha querido hacer una prueba de consumo de carácter realista y ha elegido como conductores para hacer la prueba a personas de la ciudad donde está ubicada con la única condición de que tengan el carnet de conducir. Por tanto cabe esperar que el origen de la variabilidad debe encontrarse en los conductores. La ciudad es relativamente grande y el número de conductores es elevado, por este motivo los operarios seleccionados para hacer la prueba son una pequeña muestra de todos los conductores de la ciudad. Asumido que el grupo seleccionado es representativo de la población, éste puede considerarse una muestra aleatoria de la población total de conductores. De nuevo el factor “conductor” es un factor de efectos aleatorios y se debe utilizar un diseño de una vía completamente aleatorizado. En su planificación, habrá que seleccionar al azar una muestra de tamaño I de la población de niveles del factor tratamiento aleatorio y, a continuación, asignar al azar las unidades experimentales a los I niveles seleccionados. Aquí, para conseguir una potencia específica en las pruebas de hipótesis, hay que determinar con antelación el valor apropiado de I, además del tamaño muestral de cada nivel.
3.7.1 El modelo matemático de un factor aleatorio.
Para un diseño completamente aleatorizado con I niveles seleccionados al azar de un factor tratamiento T, el modelo de un factor aleatorio es
|
para i = 1,...,I, j = 1,...,ni. Las Ti son variables aleatorias i.i.d. con distribución N(0,
2), y los
ij son variables aleatorias i.i.d. con distribución N(0,
2). Siendo las
i y los
ij mutuamente independientes.
Comparando el modelo de efectos aleatorios con el modelo de efectos fijos, se observa que la forma de ambos modelos y las hipótesis sobre el error son exactamente iguales. La única diferencia está en la modelización del efecto tratamiento. Dado que el i-ésimo nivel del factor tratamiento
observado en el experimento ha sido seleccionado aleatoriamente de una población infinita, su efecto observado es el resultado de la variable aleatoria
i. La media de la población de los efectos del tratamiento es la constante
y, por tanto, se justifica que la media de las
i sea cero. El parámetro de interés es ahora 
2. Su importancia es fundamental: si todos los efectos de la totalidad de niveles del factor tratamiento son iguales, entonces 
2 = 0. Si, por el contrario, existen niveles con efectos muy diferentes, entonces 
2 es grande.
La independencia entre
i y
ij implica que el factor tratamiento no tiene incidencia sobre cualquier fuente de variación que haya sido englobada en el error.
Comparando el modelo de efectos fijos y efectos aleatorios, se tiene:
| Efectos Fijos | Efectos Aleatorios | |
Modelo
| yij = | yij = |
Los efectos son
| parámetros desconocidos | variables aleatorias |
Influyen en
| la respuesta media | en la variabilidad |
Objetivo
| estimar | estimar |
Los niveles
| son predeterminados | se eligen al azar |
El contraste
| H0 : | H0 : |
En el modelo con factor aleatorio se tiene:
|
Por tanto
|
Al contrario que en el modelo de efectos fijos, las observaciones pertenecientes a un mismo tratamiento son correladas:
Estimación de
2.
Por la similitud entre los modelos de una vía de efectos aleatorios y de efectos fijos y realizando un sencillo cálculo matemático puede probarse que la varianza residual residual
obtenida en (3.15) para el modelo de efectos fijos también es un estimador insesgado de
2 en el modelo de efectos aleatorios.
|
Estimación de 
2.
Se puede utilizar scmT para obtener un estimador de 
2. Un sencillo desarrollo matemático permite obtener
|
Si todos los ni son iguales (ni = r, para todo i), entonces n = Ir y c = r. Por tanto,
|
De lo anterior se deduce que SCMT es un estimador insesgado de c
2 +
2 (no de 
2).
|
|
donde c = (1 /n - I)
; si ni = r para todo i, entonces c = r.
3.7.2 Contraste de igualdad de los efectos tratamiento.
En el modelo de efectos aleatorios tiene interés la siguiente prueba de hipótesis:
Para resolver este contraste se utiliza la misma medida de discrepancia que la utilizada para contrastar si los efectos eran iguales en un modelo de efectos fijos. En el apartado anterior se obtenía que:
Si H0
es cierta, el valor esperado del cociente SCMT SCMR
1 y, si H1
es cierta, el cociente anterior toma valores positivos grandes. Por lo tanto el estadístico del contraste es
|
Se rechaza H0
al nivel de significación
si
El resultado es análogo al caso de efectos fijos, y el cálculo matemático para resolver el problema con efectos aleatorios o con efectos fijos es el mismo aunque el planteamiento de los problemas son muy diferentes.
La tabla ANOVA para el modelo de una vía de efectos aleatorios es prácticamente igual al de efectos fijos con la diferencia en los valores esperados de las sumas de cuadrados medios. En la tabla 3.2. se presenta la tabla ANOVA del modelo de diseño de experimentos con un factor aleatorio.
| |||||||||||||
|
|
|
|
| |||||||||
| Tratamientos |
| I - 1 |
| c | |||||||||
| Residual |
| n - I |
| ||||||||||
| Global |
| n - 1 |
| ||||||||||
| c = | |||||||||||||
| Rechazar H0 | |||||||||||||
Cuadro 1.2: Cuadro del análisis de la varianza para un diseño completamente aleatorizado de efectos aleatorios.
"Como regla general, los modelos de efectos fijos se utilizan para conocer si deben ó no aplicarse determinados tratamientos, mientras que los modelos de efectos aleatorios permiten medir el efecto de factores que, se quiera o no, están presentes en el proceso. En el primer caso, nos interesa conocer el aumento o disminución de la media de la respuesta según los niveles de los factores, mientras que con el segundo se busca su efecto sobre la variabilidad."
Comparando el modelo de efectos fijos y efectos aleatorios, se tiene:
| Efectos Fijos | Efectos Aleatorios | |
Modelo
| yij = | yij = |
Los efectos
| parámetros desconocidos | variables aleatorias |
Influyen
| en la respuesta media | en la variabilidad |
Objetivo
| estimar | estimar |
Los niveles
| se eligen | al azar |
El contraste
| H0 : | H0 : |
3.7.3 Análisis de un caso de diseño con un factor aleatorio.
En esta sección se estudia un problema de un diseño de experimentos con un factor aleatorio.
Ejemplo 3.3.
“Un laboratorio controla la calidad de los plásticos utilizados en bolsas. Se desea contrastar si existe variabilidad en la calidad de los plásticos que existen en el mercado. Para ello se eligen al azar cuatro plásticos y se los somete a una prueba de resistencia. De cada plástico elegido se han seleccionado ocho muestras y los resultados de la variable que mide la resistencia son los de la tabla adjunta.
¿Qué conclusiones se deducen de este experimento?”
| Plást.A. | Plást.B. | Plást.C. | Plást.D. | ||||||||||||||||||||||||||||||||
|
|
|
| ||||||||||||||||||||||||||||||||
Un primer análisis de estos datos se recoge en la siguiente tabla
| Pintura | Observ. | Media | D. tip. | Sim.Est | Kurt. est |
| Pint.A |
8
|
152’12
|
37’19
|
0’104
|
-0.196
|
| Pint.B |
8
|
192’87
|
44’52
|
0’761
|
0’288
|
| Pint.C |
8
|
214’87
|
39’91
|
0’565
|
-0’671
|
| Pint.D |
8
|
92’75
|
19’70
|
-0’014
|
-0’556
|
| Total |
32
|
163’15
|
58’62
|
0’426
|
-0’815
|
Tabla ANOVA
| |||
| Fuentes de variación | Suma de cuadrados | Grados de libertad | Varianzas |
| Entre pinturas | 69094'1 | 3 | SCMP= 23.031'4 |
| Residual | 37430'1 | 28 | |
| Total | 106524'0 | 31 | |
el p - valor = 0'000 y se rechaza la hipótesis de no influencia del factor. Esta conclusión concuerda con los resultados de la tabla de estadísticos descriptivos de los datos.
No hay comentarios:
Publicar un comentario