Mapa conceptual
DiseĂąos en bloques
Conceptos clave • Bloque completo • Cuadro grecolatino • Cuadro latino • Cuadro latino estándar • Efecto de interacción • Fuentes de variabilidad
Diseño de bloques completos al azar Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor, es deseable que las posibles diferencias se deban principalmente al factor de interés y no a otros factores que no se consideran en el estudio. Cuando esto no ocurre y existen otros factores que no se controlan o nulifican para hacer la comparación, las conclusiones podrían ser afectadas sensiblemente. Por ejemplo, supongamos que se quieren comprar varias máquinas, si cada máquina es manejada por un operador diferente y se sabe que éste tiene una influencia en el resultado, entonces es claro que el factor operador debe tomarse en cuenta si se quiere comparar a las máquinas de manera justa. Un operador más hábil puede hacer ver a su máquina (aunque ésta sea la peor) como la que tiene el mejor desempeño, lo cual impide hacer una comparación adecuada de los equipos. Para evitar este sesgo hay dos maneras de anular el posible efecto del factor operador: la manera lógica es utilizar el mismo operador en las cuatro máquinas; sin embargo, tal estrategia no siempre es aconsejable, ya que utilizar al mismo sujeto elimina el efecto del factor operador pero restringe la validez de la comparación con dicho operador, y es posible que el resultado no se mantenga al utilizar a otros operadores. La otra forma de anular el efecto operador en la comparación consiste en que cada operador trabaje durante el experimento con cada una de las máquinas. Esta estrategia es la más recomendable, ya que utilizar a todos los operadores con todas las máquinas permite tener resultados de la comparación que son válidos para todos los operadores. Esta última forma de nulificar el efecto de operadores, recibe el nombre de bloqueo.
Factores de bloque Factores de bloque Son las variables adicionales al factor de interés que se incorporan de manera explícita en un experimento comparativo para no sesgar la comparación.
Fuentes de variabilidad Son los factores que provocan la variabilidad en los datos.
A los factores adicionales al factor de interés que se incorporan de manera explícita en un experimento comparativo se les llama factores de bloque. Éstos tienen la particularidad de que no se incluyen en el experimento porque interese analizar su efecto, sino como un medio para estudiar de manera adecuada y eficaz al factor de interés. Los factores de bloque entran al estudio en un nivel de importancia secundaria con respecto al factor de interés y, en este sentido, se puede afirmar que se estudia un solo factor, porque es uno el factor de interés. Por ejemplo, en el caso de comparar cuatro máquinas que son manejadas por cuatro operadores, es pertinente incluir explícitamente al factor operadores (bloques) para lograr el propósito del estudio, pero esta inclusión no es con el fin de estudiar el efecto del factor operador (o comparar a los operadores). Más bien, la inclusión de los operadores es un medio y no un fin para lograr una comparación adecuada y eficaz de las máquinas. Puede ser que además de los operadores existan otros factores de bloque que deban controlarse durante el experimento para lograr una comparación adecuada de las máquinas. También se podrían controlar: el tipo de material, lotes, tipo de producto, día, turno, etc., pero no se trata de caer en el extremo de querer controlarlo todo, sino básicamente aquellos factores que por conocimiento del proceso o experiencia previa, se sabe que afectan en forma considerable el resultado de la comparación. En un diseño en bloques completos al azar (DBCA) se consideran tres fuentes de variabilidad: el factor de tratamientos, el factor de bloque y el error aleatorio, es
Diseño de bloques completos al azar
decir, se tienen tres posibles “culpables” de la variabilidad presente en los datos. La palabra completo en el nombre del diseño se debe a que en cada bloque se prueban todos los tratamientos, o sea, los bloques están completos. La aleatorización se hace dentro de cada bloque; por lo tanto, no se realiza de manera total como en el diseño completamente al azar. El hecho de que existan bloques hace que no sea práctico o que incluso sea imposible aleatorizar en su totalidad. Los factores de bloqueo que aparecen en la práctica son: turno, lote, día, tipo de material, línea de producción, operador, máquina, método, etc. La imposibilidad de aleatorizar de bloque a bloque se aprecia claramente cuando se bloquean factores como día o turno, ya que no tiene sentido pensar en seleccionar al azar el orden de los días o los turnos porque es imposible regresar el tiempo. Supongamos una situación experimental con k tratamientos y b bloques. El aspecto de los datos para este caso se muestra en la tabla 4.1, y considera una repetición en cada combinación de tratamiento y bloque. En el ejemplo 3.1 se presenta el problema de comparar cuatro métodos de ensamble (A, B, C y D), pero si además se sospecha que los cuatro operadores que se utilizarían para realizar el ensamble pueden afectar significativamente los tiem- pos de ensamble y, por ende, la comparación de los métodos, entonces se debe utili- zar un diseño en bloques para que la fuente adicional de variación, que representan los operadores, no vaya a sesgar las comparaciones. Esto se ve más adelante en el ejemplo 4.1.
Modelo estadístico Cuando se decide utilizar un DBCA, el experimentador piensa que cada medición será el resultado del efecto del tratamiento donde se encuentre, del efecto del bloque al que pertenece y de cierto error que se espera sea aleatorio. El modelo estadístico para este diseño está dado por:
Y ; ij
i
j
ij
i 1, 2, , k j 1, 2, , b
(4.1)
donde Yij es la medición que corresponde al tratamiento i y al bloque j (ver tabla 4.1); m es la media global poblacional; ti es el efecto debido al tratamiento i, gj es el efecto Tabla 4.1 Arreglo de los datos en un diseño en bloques completos al azar. Bloque 1
2
3
…
b
1
Y11
Y12
Y13
…
Y1b
2
Y21
Y22
Y23
…
Y2b
3
Y31
Y32
Y33
…
Y3b
k
Yk1
Yk2
Yk3
…
Ykb
Tratamiento
103
Bloque completo En el DBCA se refiere a que en cada bloque se prueban todos los tratamientos.
Diseño de bloques completos al azar
104
debido al bloque j, y eij es el error aleatorio atribuible a la medición Yij. Se supone que los errores se distribuyen de manera normal con media cero y varianza constante s2 [N(0, s2)], y que son independientes entre sí.
Hipótesis a probar La hipótesis de interés es la misma para todos los diseños comparativos, y está dada por: H0 : 1 2 3 k
(4.2)
HA : i j para algún i j que también se puede expresar como H0 : 1 2 3 k 0 HA : i 0 para algún i
(4.3)
En cualquiera de estas hipótesis la afirmación a probar es que la respuesta media poblacional lograda con cada tratamiento es la misma para los k tratamientos y que, por lo tanto, cada respuesta media mi es igual a la media global poblacional, m. De manera alternativa, es posible afirmar que todos los efectos de tratamiento sobre la variable de respuesta son nulos, porque cuando el efecto ti = mi – m = 0, entonces necesariamente la respuesta media del tratamiento es igual a la media global (mi = m).
Análisis de varianza La hipótesis dada por (4.2 o 4.3) se prueba con un análisis de varianza con dos criterios de clasificación, porque se controlan dos fuentes de variación: el factor de tratamientos y el factor de bloque. En la tabla 4.2 se muestra el aspecto del ANOVA para diseño DBCA. Los cálculos necesarios pueden ser manuales, pero siempre es más práctico hacerlos con un software estadístico, porque además proporciona muchas otras opciones gráficas y tabulares útiles (no sólo el ANOVA). Utilizando la notación de puntos Tabla 4.2 ANOVA para un diseño en bloques completos al azar. Fuente de variabilidad
Suma de cuadrados
Grado de libertad
Cuadrado medio
Tratamientos
SCTRAT
k–1
CMTRAT
Bloques
SCB
b–1
Error
SCE
(k – 1)(b – 1)
Total
SCT
N–1
CMB CME
F0
F0 F0
Valor-p
CM TRAT
CM
CM B CM
E
P(F > F0)
E
P(F > F0)
Diseño de bloques completos al azar
vista al inicio del capítulo 3, las fórmulas más prácticas para calcular las sumas de cuadrados son:
y la del error se obtiene por sustracción como: SCE = SCT – SCTRAT – SCB
Ejemplo 4.1 En el ejemplo 3.1, donde se planteó la comparación de cuatro métodos de ensamble, ahora se va a controlar activamente en el experimento a los operadores que realizarán el ensamble, lo que da lugar al siguiente diseño en bloques completos al azar.
Operador Método
1
A
6
B
7
C
10
D
10
2
3
4
9
7
8
10
11
8
16
11
14
13
11
9
Recordemos que la variable de respuesta son los minutos en que se realiza el ensamble. Para comparar los cuatro métodos se plantea la hipótesis: H0 : A B C D HA : i j para algún i j A, B, C, D
la cual se prueba mediante el análisis de varianza dado en la tabla 4.3. De esta tabla se observa que para los métodos se obtuvo un valor-p = 0.003 < a = 0.05, por lo que se rechaza la hipótesis H0 de que el tiempo medio poblacional de los métodos de ensamble son iguales, y se acepta que al menos dos de los métodos son diferentes en cuanto al tiempo promedio que requieren. De la misma manera para operadores, como su valor-p = 0.030 < a = 0.05, el factor de bloques (operadores) también afecta, es decir, existen diferencias entre los operadores en cuanto al tiempo promedio.
105
Diseño de bloques completos al azar
106
Sin embargo, recordemos que no es objetivo del experimento comparar a los operadores, y su control en el estudio se utiliza para lograr una comparación más justa y precisa de los métodos de ensamble. En otras palabras, mientras que los métodos de ensamble se comparan con el objetivo final de elegir el más eficiente en términos de tiempo, con los operadores no se trata de elegir uno; en todo caso, quizá como información extra se pueda tomar alguna decisión sobre los operadores, como por ejemplo dar mayor entrenamiento a quien lo requiera por salirse en forma significativa del comportamiento del resto. Cuando mediante un diseño de bloques se concluye que los tratamientos son diferentes, es probable que no se haya llegado a esa conclusión, si no que se haya considerado el factor de bloque. Por ejemplo, si en el ANOVA de la tabla 4.3 no se considera el efecto de bloque (operador), entonces la variabilidad y los grados de libertad atribuibles a operadores se irían al error, lo cual puede modificar las conclusiones sobre los tratamientos (métodos). Los detalles de esto se presentan al lector como ejercicios. Aunque el objetivo no es que el experimentador haga los cálculos a mano, en caso de no contar con un software es posible hacer las cuentas con las fórmulas de las sumas de cuadrados dadas por la ecuación 4.4. Para calcular estas sumas es necesario obtener antes la media global y los totales por tratamiento y por bloque, como se ilustra a continuación. Operador Método
1
2
3
4
A
6
9
7
8
Total por tratamiento
Y1• = 30
B
7
10
11
8
Y2• = 36
C
10
16
11
14
Y3• = 51
D
10
13
11
9
Y4• = 43
Total
Y•1 = 33
Y•2 = 48
Y•3 = 40
Y•4 = 39
Total global Y•• = 160
Con estos totales las sumas de cuadrados se obtienen fácilmente como:
Tabla 4.3 ANOVA para el ejemplo 4.1. Suma de cuadrados
Grado de libertad
Cuadrado medio
F0
Valor-p
Métodos
61.5
3
20.5
10.25
0.003
Operadores
28.5
3
9.5
4.75
0.030
Error
18.0
9
2.0
Total
108.0
15
Fuente de variabilidad
Diseño de bloques completos al azar
Los grados de libertad de la SCT corresponden al número total de observaciones menos uno (N – 1 = 16 – 1 = 15), mientras que los de las SCTRAT y SCB son el número de tratamientos menos uno y el número de operadores menos uno, respectivamente. En este caso ambas sumas tienen 4 – 1 = 3 grados de libertad. Por último, la SCE tiene 15 – 3 – 3 = 9 grados de libertad. Con esta información se procede a llenar la tabla de ANOVA de la tabla 4.3. Comparación de parejas de medias de tratamiento en el DBCA. Cuando se rechaza
la hipótesis de igualdad de los cuatro tratamientos, es natural preguntar- se cuáles de ellos son diferentes entre sí. Para averiguarlo se utiliza alguna de las pruebas que se estudiaron en la sección “Comparaciones o pruebas de rango múlti- ples” del capítulo anterior. Por ejemplo, recordemos que la diferencia mínima signi- ficativa (LSD) para dos tratamientos, i y l, en un DCA está dada por LSD t /2, N k
2CME n
Entonces, en bloque esta expresión se transforma en LSD t /2, ( k 1)(b 1)
2CME b
donde b es el número de bloques, que hace las veces de número de réplicas, y (k – 1) (b – 1) son los grados de libertad del CME. De aquí que en el ejemplo que nos ocupa, como t0.025, 9 = 2.26, entonces, LSD 2.26 2 2 / 4 2.26 Al comparar esta diferencia mínima significativa con los datos del ejemplo 4.1 se obtiene la siguiente tabla: Diferencia poblacional
Diferencia muestral
Decisión
mA – mB
|–1.5| < 2.26
No significativa
mA – mC
|–5.25| > 2.26
Significativa
mA – mD
|–3.25| > 2.26
Significativa
mB – mC
|–3.75| > 2.26
Significativa
mB – mD
|–1.75| < 2.26
No significativa
mC – m D
2.00 < 2.26
No significativa
107
Diseño de bloques completos al azar
Se concluye que el tratamiento A es diferente de C y D, y que el tratamiento B es diferente de C. Las otras tres comparaciones (A con B, B con D y C con D) aceptan la hipótesis de igualdad. De acuerdo mues– con esto,–y dadas las – respuestas medias – trales YA • = 7.5, YB • = 9.0, YC • = 10.75, YD • = 12.75, se concluye que el método A es mejor (requiere menos tiempo para el ensamble) que los métodos C y D, pero el método A no es mejor que el B.
Efecto de bloque Como ya vimos en el ejemplo anterior, la tabla de ANOVA también proporciona una prueba para el efecto de los bloques. En el segundo renglón de la tabla 4.3 se verifica la hipótesis H0 : 1 2 3 b 0 H A : j 0 para algún blooque j que en caso de rechazarse se acepta que el efecto de un bloque es diferente de cero. Por cierto, ésta no es una prueba F exacta, sino aproximada, debido a la restricción de aleatorización (sólo se aleatoriza dentro de bloque). Sin embargo, en la práctica se recomienda su interpretación porque es evidencia a favor o en contra de que valió la pena el esfuerzo de controlar el factor de bloque. Si resulta significativa implica que el factor de bloques tiene influencia sobre la variable de respuesta, y debe ser tomado en cuenta para mejorar la calidad de ésta. Pero, si no se rechaza y se acepta que los bloques son iguales en respuesta media, entonces se tiene el argumento a favor de no controlar este factor en futuros experimentos sobre esta misma respuesta, además de que su influencia en la calidad de la respuesta no es significativa. Por ejemplo, en este caso los operadores sí tienen efecto sobre el tiempo de ensamble, dado el valor-p = 0.030 que resulta en el ANOVA o, dicho en otras palabras, el tiem- po medio que tardan en el ensamble los operadores es significativamente diferente. Si se hacen las comparaciones dos a dos con la prueba LSD, se encuentra que el operador 1 es estadísticamente diferente al operador 2, los demás son iguales. La restricción de aleatorización se debe al hecho de que no se aleatoriza el or- den de las corridas experimentales en relación a los bloques. El experimento supone que sólo se aleatoriza el orden de las corridas dentro de cada bloque, lo cual evita sesgos en la comparación de los tratamientos, pero no los impide en la comparación de los bloques. De hecho, todas las corridas de un bloque particular se pueden ha- cer de manera consecutiva, lo que puede causar sesgos a la hora de comparar los bloques. Estos sesgos
108
Diseño de bloques completos al azar
se deben a factores de ruido que actúan en el transcurso de las corridas experimentales, como las variables ambientales. El error de restricción no es estimable porque se confunde con el efecto de los bloques. Por lo general se apuesta a que dicho error sea pequeño, de aquí que se recomiende interpretar la prue- ba F para los bloques dada en el ANOVA. Si fuera de interés el estudio del factor de bloque al mismo nivel del factor de tratamientos, entonces se debería correr el experimento aleatorizando completamen- te el orden de todas las combinaciones posibles entre bloques y tratamientos. Si ése fuera el caso y suponiendo que sea posible aleatorizar por completo, el resultado sería un diseño factorial k × b, que se presenta en el capítulo 5. Otro supuesto del diseño de bloques al azar es que no existe efecto de interacción1 entre el factor de bloque y el factor de tratamientos. Cuando este supuesto no se cumple, la variabili- dad debida a la interacción se incorpora como parte del error que, al ser grande y artificial, enmascara el efecto de los tratamientos. La existencia del efecto de interac- ción se puede evaluar obteniendo una suma de cuadrados aproximada para dicho efecto en el ANOVA
109