3 minute read

Diseño y análisis en investigación

Tabla 7.3 Tabla de contingencia 2 × 2 de asociación entre dos variables nominales dicotómicas y análisis mediante test de ji cuadrado y exacto de Fisher (continuación) a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mínimo esperado es 25,22. b. Sólo se ha calculado para una tabla 2 x 2.

La prueba de ji cuadrado se basa en la comparación de los recuentos observados y esperados en cada casilla de la tabla de contingencia. Si las variables que se trata de asociar fueran independientes (no hubiera relación entre ellas), el recuento de cada casilla dependería exclusivamente del azar. Si fuera así, en la casilla superior izquierda (donde cruzan la columna “Sí” y la fila “Sí”), debería haber un recuento equivalente al producto de las probabilidades de tener un familiar celíaco (56/928 = 0,018) y de introducir el gluten entre los 4 y 6 meses (418/928 = 0,450); si multiplicamos dicho producto por el tamaño muestral (0,018 × 0,450 × 928), obtendremos un recuento esperado de 7,65. Sin embargo, en esa casilla hay un recuento observado de 17. Ese mismo cálculo se hace para cada casilla. Cuanto mayor sea la diferencia entre los valores esperados y observados en cada casilla, más baja será la probabilidad de que esa diferencia se deba al azar; si esa probabilidad es menor de 0,05, asumiremos que la asociación es estadísticamente significativa.

En la tabla 7.3 podemos ver los recuentos observados de cada casilla, los porcentajes respecto a las filas (30,4 % y 46 %) y en la parte inferior la estimación del error tipo I (significación) por varios métodos. Señalado con un sombreado naranja se destaca la “p” estimada mediante test de ji cuadrado (chi cuadrado en la figura) y en sombreado azul las dos estimaciones, bilateral y unilateral, mediante la prueba exacta de Fisher. La prueba de Fisher será obligatoria cuando en la nota que aparece en la parte inferior de la tabla nos indiquen un porcentaje de casillas con recuentos esperados menores de 5 en más del 20 % de ellas. Esta prueba se basa en la distribución de probabilidad binomial, por lo que no necesita cumplir los requerimientos de la aproximación a la normal ni de la distribución de ji cuadrado. En nuestro ejemplo no es necesario usar esta prueba, ya que el porcentaje de casillas es 0 % (señalado en negrita).

Si escogemos la “p” correspondiente a la prueba de ji cuadrado, vemos que al decir que las variables analizadas están asociadas, asumimos un error tipo I de 0,023 (2,3 %), menor de 0,05 (5 %). La existencia de asociación se puede interpretar igualmente diciendo que las proporciones o porcentajes comparados (30,4 % y 46 %) son diferentes y que esta diferencia es estadísticamente significativa.

Si hubiéramos elegido las estimaciones correspondientes al test exacto de Fisher, también hubiera dado estadísticamente significativo. Llamamos la atención de que la “p” para el contraste unilateral es más baja que para el bilateral (sombreado verde).

Variable nominal dicotómica frente a continua: comparación de medias entre dos grupos independientes

En un estudio transversal se midió la presión arterial en una muestra de 1.410 niños; queremos saber si los niños con obesidad abdominal (Índice cintura/talla ≥ 0,50) tienen una mayor presión arterial sistólica que los niños sin obesidad abdominal.

Sigamos los pasos para elegir la prueba más adecuada en la tabla 7.2:

1. Las variables independiente y dependiente son: obesidad abdominal y presión arterial sistólica.

2. La variable independiente es nominal dicotómica con muestras independientes (primera fila).

3. La variable dependiente es continua (tercera columna).

La opción que nos ofrece el esquema es el test de la t de Student para muestras independientes. Debemos advertir que para poder elegir las pruebas que aparecen en la tercera columna, bajo la cabecera de “Continua”, la variable debe ser continua (con escala de intervalos o razones) y seguir una distribución normal. Los test correspondientes se basan en estimaciones de probabilidad que emplean medidas de centralización (media) y dispersión (varianza o desviación típica), por lo que si dichas medidas no tienen sentido en la variable analizada, la interpretación de los resultados se verá comprometida, aunque las estimaciones de probabilidad sean correctas (según el teorema central del límite para medias de variables continuas con tamaño muestral superior a 30). Así, mientras la comparación de medias de presión arterial entre grupos permite analizar las diferencias, podría no ser igualmente correcto comparar las medias de niveles de colesterol (variable que no suele seguir una distribución normal y cuya media podría estar sesgada). Si tenemos dudas sobre la validez de la comparación de medias, tendríamos que elegir uno de los test situados en la columna del medio, correspondiente a variables ordinales.

Aunque hay test estadísticos que permiten cuantificar la normalidad de una variable, la forma más simple de comprobar si una variable sigue una distribución normal es comparar la media y la mediana de los datos y observar su histograma de frecuencias. Si la

This article is from: