Introducción a la Estadística Analítica

Page 1

UNIVERSIDAD VERACRUZANA FACULTAD DE NFERMERÍA-XALAPA

Experiencia Educativa: Bioestadística Módulo: INTRODUCCIÓN A LA ESTADÍSTICA ANALÍTICA (RESUMEN)

Docentes: M. en C. Sergio A. González Ortiz y M.A.S.S. Diana Aurora Carmona Cortés

Abril de 2020


Distinguidos estudiantes:

Les envío un resumen de las clases de estadística analítica, con la finalidad de ir avanzando en el proceso virtual de enseñanza aprendizaje y no rezagarnos debido a la contingencia que vivimos. Será necesario que fortalezcan este aprendizaje con los libros electrónicos que tienen en la plataforma EMINUS, dentro de la sección de Material Didáctico.

En este caso solo revisaremos 3 pruebas estadísticas: “Z”, “t” y X2 (Chi cuadrada), los cuales revisaremos a partir de ejercicios prácticos y el uso de las tablas estadísticas que ya tienen en EMINUS.

Como nota introductoria, recuerden que cuando n sea menor a 30, se utilizará la prueba estadística “t” de Student. Cuando n sea mayor a 30 se aplicará la prueba estadística “Z” y cuando se conozcan las varianzas sin importar el tamaño de la muestra, siempre se utilizará la prueba estadística “Z”. Que el valor bajo la curva de Gauss es 1 y que las tablas estadísticas se construyen con la mitad de la campana de Gauss.

Xalapa, Equez., Ver. 27 de Abril de 2020.

1


INTRODUCCIÓN A LA ESTADÍSTICA ANALÍTICA (RESUMEN) Como ya sabemos, la estadística es un conjunto de métodos y teorías que han sido desarrolladas para tratar la recolección, análisis y descripción de datos muestrales con el objeto de tomar decisiones con base a los resultados obtenidos. En este sentido, la estadística se divide para su aplicación en estadística descriptiva y estadística inferencial. La primera, simplemente describe las observaciones de un conjunto de datos, mediante la aplicación de medidas estadísticas descriptivas como: • Medidas de tendencia central: media aritmética o promedio, mediana y moda. Y en algunos casos específicos, como las ciencias agrícolas, la aplicación de la media ponderada. • Medidas de posición: cuartiles y centiles. • Medidas de dispersión: rango, varianza, desviación estándar y coeficiente de variación, y • Medidas de asociación: “r” de Pearson (estadística paramétrica) y “rho” de Spearman (estadística no paramétrica). Pero la aplicación de la estadística va más allá, cuando se desea incluso realizar esstudios sobre poblaciones extremadamente grandes en los cuales los costos serían altos y el tiempo de realización sería prolongado. En estos casos, se aplica la estadística inferencia, que en algunas ciencias se conoce de igual forma como estadística analítica, dado que analiza. En este sentido, la estadística inferencial tiene dos divisiones: estadística paramétrica, en la cual los datos se distribuyen de forma simétrica o normal (Figura 1) bajo la campana de Gauss, y la estadística no paramétrica en la cual los datos se distribuyen de forma asimétrica o anormal (Figura 2). Esto es:

Figura 1.

Figura 2. 2


Para el caso de cada tipo, se aplica una prueba especial. En el caso de la estadística paramétrica, las pruebas estadísticas que pueden aplicarse son: • Distribución Z • Distribución t • Distribución r • Análisis de varianza (ANOVA) Para el caso de la estadística no paramétrica las pruebas estadísticas que pueden aplicarse son: • Distribución binomial • Distribución Poisson • Chi cuadrada (X2) • McNemar • Exacta de Fisher • “Q” de Crochan • Kolmogorov-Smirnov • “T” Wilcoxon • “U” Mann-Whitney • “H” de Kruskal-Wallis • Rangos de Friedman Todas estas pruebas van a depender en parte, de la escala de medición (Figura 3) de los datos, de tal forma que las primeras (estadística paramétrica) se deben encontrar en escala de intervalo o razón (cuantitativas), mientras que las últimas (estadística no paramétrica) se deben encontrar en escala nominal u ordinal (cualitativas).

3


Figura 3. Escalas de medición.

En el presente módulo, trataremos únicamente 3 pruebas estadísticas paramétricas: “Z”, “t” de Student y X2 (chi cuadrada), y aprenderemos el uso de sus correspondientes tablas estadísticas. Para ello, es necesario realizar una formulación, en la cual interviene 6 aspectos a desarrollar y comprender: 1. Planteamiento de la hipótesis. 2. Nivel de significancia. 3. Regla de decisión. 4. Cálculo del estadístico. 5. Conclusión. 6. Intervalo de confianza (en algunos casos).

4


1. Planteamiento de la hipótesis. Existen dos tipos de hipótesis, nula (Ho o H1) y alterna (Ha o H2). La hipótesis que debe comprobarse es siempre la hipótesis alterna, que en investigación se conoce como hipótesis de trabajo. En este sentido, se emplean los siguientes símbolos: < (menor), ≤ (menor que), = (igual), ≠ (diferencia), ≥ (mayor que) y > (mayor), y serán aplicados de acuerdo a la dirección que establezca el enunciado, como unilateral (una dirección) o bilateral (ambas direcciones). Estos signos serán colocados primeramente en la hipótesis alterna, que es la que se desea demostrar. En dichas hipótesis, el parámetro que por lo regular se aplican son  o 0, si se trata de un grupo, o 1 y 2, si se trata de dos grupos o poblaciones diferentes. Recuerde que los estadísticos (x, S, S2) se miden en la muestra, mientras que los parámetros (, , 2) se miden en la población. Ejemplo No. 1: Un Coordinador de Capacitación en Enfermería desea demostrar que las capacitaciones para la colocación del equipo de protección personal, son diferentes entres instructores de dos hospitales diferentes, como parte de la capacitación a personal que atiende a pacientes positivos a Covid-19. Respuesta: En este sentido, el investigador uso la palabra “diferentes” con lo cual ya estableció la dirección de la hipótesis alterna, que es la que debe comprobarse, de tal forma que las hipótesis estarían descritas como: H0: 1 = 2 vs Ha: 1 ≠ 2 Nótese, que el signo de diferencia se colocó en la hipótesis alterna. Ejemplo No. 2: Se desea demostrar que un medicamento con la misma sustancia activa; pero con precio inferior al comercial, no es mejor que el medicamento más caro. Respuesta: En este sentido, el investigador uso la palabra “no es mejor” con lo cual ya estableció la dirección de la hipótesis alterna, que es la que debe comprobarse, lo cual se interpreta de acuerdo a los símbolos que no es mayor, de tal forma que las hipótesis estarían descritas como: 5


H0: 1 ≥ 2 vs Ha: 1 < 2 Observe que una vez que se coloca el símbolo en la hipótesis alterna, en automático sabemos que el signo que debe colocarse en la hipótesis nula, es el contrario. 2. Nivel de significancia. Esta parte es la más sencilla de toda la formulación, ya que si el nivel de confianza es del 95%, el nivel de significancia, expresado como α, será lo que reste para 100%, es decir, 5%, y se emplea en la regla de decisión considerando si la hipótesis es uni o bilateral. Por ejemplo (Marca con una “X”): •

Si el nivel de confianza es del 90%, el nivel de significancia vale: a) 5%

c) 10%

b) 15%

d) Ninguno de los anteriores

Si el nivel de confianza es del 80%, el nivel de significancia vale: c) 5%

c) 10%

d) 20%

d) Ninguno de los anteriores

3. Regla de decisión. Esta regla está dada por la dirección de la hipótesis y el nivel de significancia y el tipo de prueba estadística a emplear. Es decir, si el planteamiento de la hipótesis está descrita como: H0: 1 ≥ 2 vs Ha: 1 < 2, la dirección de la hipótesis es unilateral y el valor del nivel de significancia se dividirá entre 1; pero si el planteamiento de la hipótesis es: H0: 1 = 2 vs Ha: 1 ≠ 2, entonces la hipótesis es bilateral y el nivel de significancia se dividirá entre 2. La regla de decisión permite aceptar o rechazar la hipótesis nula, con la cual se realiza la conclusión. Este rubro lo veremos con calma cuando tratemos cada una de las pruebas estadísticas que aplicaremos. 4. Cálculo del estadístico. El cálculo del estadístico es la fórmula que deberá aplicarse dependiendo del tipo de prueba estadística que vaya a aplicarse. Esto es (Tabla 1): 6


Prueba estadística:

Fórmula:

Z para una muestra simple

Z para dos muestras independientes

t de Student para una muestra simple t de Student para muestras dependientes t de Student para muestras independientes Chi cuadrada (X2) Tabla 1. Fórmulas estadísticas. Elaboración propia.

5. Conclusión. Esta dependerá del valor del cálculo del estadístico determinado, comparado con la regla de decisión. Lo revisaremos más adelante con un ejercicio de forma global. 6. Intervalo de confianza. Todas las investigaciones clínicas se realizan en un grupo determinado de individuos, generalmente pacientes. Sin embargo, el interés del estudio radica, habitualmente, en la generalización de los resultados: no se está tan interesado en lo que ocurre con los individuos particulares que participan en la investigación como en predecir lo que pueda ocurrir en el futuro con otros individuos similares. Esto plantea dos problemas, el primero es el del sesgo de selección, es decir, hasta qué punto los pacientes incluidos en el estudio son similares o, en la terminología estadística, pertenecen a la misma población que aquel o aquellos a quienes se quieren aplicar los resultados del estudio o, dicho de otra manera, hasta qué punto 7


son tan distintos como para que los resultados del estudio no sean útiles para tomar las decisiones sobre éstos. El segundo problema es que los estudios nunca se realizan con todos los pacientes de interés, sino sólo con un grupo de ellos o, en terminología estadística, no se trabaja con la población sino con una muestra. La estadística sirve justamente para solucionar este segundo problema con las técnicas de estimación y contraste de hipótesis. Por ejemplo, en un estudio para evaluar la eficacia de los inhaladores de nicotina para reducir la cantidad de tabaco fumado se definió como éxito en cada individuo que, en el período comprendido entre la sexta semana y el cuarto mes desde el inicio del tratamiento, se redujera al menos en un 50% el número de cigarrillos fumados diariamente. Los participantes en el estudio fueron 400 voluntarios sanos, reclutados por anuncios en los periódicos, que estaban dispuestos a reducir su consumo de tabaco, pero no a dejar de fumar inmediatamente, o eran incapaces de ello. Los participantes fueron distribuidos aleatoriamente en dos grupos de 200, la evaluación de la eficacia se obtuvo de la comparación de las proporciones de éxito entre los grupos tratado (26%) y placebo (9%) y se pretende que este resultado sea aplicable a otros fumadores. En el artículo se describen las características demográficas de los participantes y las de su historia y hábito tabáquico para ayudar al lector a juzgar cuán diferentes puedan ser de otros fumadores a quienes se quiera aplicar el tratamiento (sesgo de selección). Una vez aceptado que son suficientemente parecidos, el siguiente problema es cuánto tienen que ver las proporciones de éxito del 26 y el 9% obtenidas en los 200 individuos concretos que participan en cada grupo del estudio (muestra) con las proporciones respectivas en todos los individuos (población) a los que sea aplicable y cuánto dependen estas proporciones de que se obtengan en 200, 20 o 2.000 individuos. El cálculo del intervalo de confianza se aplica regularmente en las pruebas estadísticas “Z” y “t”, para lo cual es necesario emplear el valor del promedio y el error estándar (Figura 4).

Figura 4. Ubicación del error estándar. 8


La fórmula para determinar el intervalo de confianza es:

Por ejemplo, determine el intervalo de confianza para un procedimiento que tiene una media de 104, un error estándar de 0.34 y un nivel de confianza del 95%. En este cálculo se empleará el valor de Z, el cual ya sabemos determinarlo; pero recordemos:

El valor 1.96 se obtiene de la tabla estadística Z (Tabla 2), buscando en el interior de la tabla el valor 0.475 el cual se intercepta del lado izquierdo con 1.9 y en la parte superior con 6, por lo que el valor de Z con un nivel de confianza del 95% es de 1.96. Recuerde que el valor que se busca en tabla debe ser el más parecido y no aproximado al valor calculado, es decir, si en la tabla existieran los números 0.4749, 0.4750, 0.4751 y 0.4752, debe buscarse el valor más parecido al determinado de 0.475, en este caso observamos 3, siendo el más parecido el 0.4750, el cual presenta un cero al final. Un valor de tabla nunca debe ser aproximado, como en el caso de 0.4749 no puede ser aproximado a 0.475 porque la tabla estadística maneja 4 dígitos que deben respetarse. Ahora bien, calculado el valor de Z, puede determinarse el intervalo de confianza, el cual quedaría expresado como:

9


Que significa que el 95% de los datos del procedimiento se ubican entre valores que van de 103.3 a 104.7 y que un 5% de los valores quedan fuera de este intervalo.

Tabla 2. Tabla estadĂ­stica Z.

10


EJERCICIOS Ejercicio 1: Z para una muestra. Un investigador enfermero desea establecer la diferencia que puede existir entre el valor promedio de hemoglobina para pacientes que egresan de la sala de tococirugía, con el proporcionado por un estándar establecido que indica un valor de hemoglobina menor a 10.9 grs/dL. Los datos obtenidos son: 10.9 9.0 12.0 10.9

10.8 8.7 10.9 10.6

10.9 10.7 10.2 10.9

10.4 12.3 10.8 10.9

10.9 8.7 10.6 10.7

10.4 10.8 10.9 10.6

10.9 10.8 10.7 10.9

10.4 10.9 10.8 12.3

10.9 12.0 10.7 10.6

10.2 10.4 10.8 10.9

10.8 10.2 10.9 9.0

10.9 10.9 10.7 -

Determine, con un valor de confianza del 95%, considerando una distribución simétrica de los datos, si existe diferencia o no entre el grupo de estudio y el previamente investigado y establezca el intervalo de confianza para dicha prueba. Respuesta: Para responder a este cuestionamiento, es necesario aplicar toda la formulación previamente descrita. Esto es: 1. Planteamiento de la hipótesis: Tomando en cuenta que se desea comparar el valor de una muestra, contra un valor previamente establecido de 10.9 grs/dL con el cual se pretende demostrar que el valor de la muestra es inferior, y que solamente se maneja un grupo de datos, y que la hipótesis que debe demostrarse es la hipótesis alterna, las hipótesis quedarían como: Ho:  ≥ 10.9

vs

Ha:  < 10.9

Observe que el enunciado del problema describe al inicio que “se desea establecer la diferencia”; pero a final del mismo describe “con el proporcionado por un estándar establecido que indica un valor de hemoglobina menor a 10.9 grs/dL”, siendo ésta la dirección de la hipótesis alterna. 2. Nivel de significancia: α = 5%

11


3. Regla de decisión: En este caso, debe revisarse en primer lugar la dirección de la hipótesis, verificar si es unilateral (una cola) o bilateral (dos colas). En el ejercicio se aprecia que la dirección de la hipótesis es unilateral, es decir, el planteamiento es de una cola (<), por lo tanto se realiza el siguiente procedimiento:

Se ubica en tabla estadística Z el valor 0.45, observándose que el más parecido es el valor 0.4505 que se intercepta del lado izquierdo con 1.6 y con el lado superior con 5, por lo que el valor de Z con un nivel de confianza al 95% para una prueba con hipótesis unilateral es de 1.65, por lo tanto la regla de decisión queda descrita como: Se rechaza Ho si: Z ≤ 1.65 ó Z ≥ 1.65 / No se rechaza Ho si -1.65 ≤ Z ≤ 1.65 Se recomienda elaborar una campana de Gauss que contenga los valores estimados para poder determinar las zonas de aceptación y de rechazo. Esto es (Figura 5):

Figura 5. Zonas de aceptación y rechazo.

12


Tómese en cuenta que el valor determinado de tabla es de 1.65 y que para poder establecer las zonas de aceptación y rechazo, se requiere de su contraparte negativa. Este procedimiento se aplica tanto para la prueba estadística Z como para la prueba estadística t de Student. 4. Cálculo del estadístico: Para poder aplicar el estadístico Z para una muestra, es necesario revisar la fórmula para identificar los elementos que se deben determinar:

De la fórmula anterior se observa que se requiere determinar los valores de promedio, desviación estándar y error estándar. Estos valores se muestran en la tabla inferior (Tabla 3), calculados a partir de los datos del problema, estadísticos que ya sabemos calcular a partir del módulo de medidas estadísticas descriptivas. De igual forma deben anotarse los valores del tamaño de la muestra (n) y de la población (0): n

x

S

x

0

47

10.68

0.72

0.105

10.9

Tabla 3. Datos del procedimiento. Por lo tanto, el cálculo del estadístico estaría dado por:

5. Conclusión: De acuerdo con el valor del estadístico calculado, se estaría rechazando la hipótesis nula (Figura 6) y se aceptaría la hipótesis alterna, es decir, las pacientes egresan con un valor de hemoglobina menor a 10.9 grs/dL o el valor calculado para la muestra si es inferior a este valor.

13


Figura 6. Rechazo de la hipótesis nula. 6. Intervalo de confianza:

Al revisar el valor del intervalo, puede observarse que el límite superior del mismo es igual al valor contra el cual se contrasto la hipótesis, lo que supondría que la hipótesis no debió rechazarse; pero deben tomarse en cuenta que probablemente existe un sesgo de selección o que el tamaño de la muestra debe incrementarse para notar esta diferencia. Lo que sí es palpable es que el intervalo tiende a la izquierda, igual que el valor calculado del estadístico de -2.09. Tal vez si el planteamiento de la hipótesis tuviera una dirección bilateral, es probable que el valor de 10.9 quede contemplado en el intervalo.

14


Ejercicio 2: Z para dos muestras independientes. Un Investigador Clínico, desea demostrar que una dieta libre de sal aplicada a una muestra de pacientes hipertensos es ventajosa, respecto a otra, sobre la disminución de la tensión arterial. Para ello se analizaron las cifras de TA de 24 pacientes asignados a dos grupos: Grupo 1 (dieta normal) y Grupo 2 (dieta especial). Los resultados se registran a continuación: Grupo 1 Grupo 2

93 92

106 102

87 89

92 92

102 101

95 96

88 88

110 105

120 99

115 100

120 98

120 87

Con un nivel de confianza 95%, determine lo dicho por el investigador, realizando la formulación completa del problema, como en el primer ejercicio mostrado. A partir de este ejercicio, no se enumerarán figuras ni tablas. 1) Planteamiento del problema: H0: 2 ≤ 1 vs Ha: 2 > 1 Tome en cuenta que se trata de dos grupos independientes, donde el grupo 1 son los pacientes que reciben la dieta normal y el grupo dos los pacientes que reciben la dieta libre de sal (dieta especial). 2) Nivel de significancia: α = 5%. 3) Regla de decisión: Se rechaza H0 si Z ≤ -1.65 ó si Z ≥ 1.65 / No se rechaza H0 si -1.65 ≤ Z ≤ 1.65 Observe que la hipótesis es unilateral, por ello el valor de Z será igual a 1.65 con un nivel de confianza del 95%.

15


4) Cálculo del estadístico:

De acuerdo a la fórmula se deben determinar, de los datos del procedimiento, los siguientes estadísticos: Grupo

n

x

S

S2

1

12

104.0

12.88

165.8

2

12

95.8

6.00

36.0

Por lo tanto:

5) Conclusión: Se rechaza Ho, es decir, la dieta libre de sal es mejor que la dieta normal en los pacientes hipertensos.

16


Ejercicio 3: t para una muestra simple. Un grupo de 24 estudiantes de enfermería participo en un estudio cuyo objetivo era medir la tensión sistólica al término de un examen de bioestadística, contra el valor establecido en el periodo pasado igual a 130 mmHg, con la finalidad de identificar si el nivel de estrés había cambiado. Los valores registrados son: 110 110

107 113

111 109

109 124

111 106

107 111

109 106

111 90

111 111

107 105

111 107

109 111

Considerando una distribución simétrica de los datos y que la investigación fue vigilada minuciosamente para evitar sesgos de selección de sujetos, determine, con un nivel de confianza del 95% si la aseveración dada por el investigador es correcta y establezca el intervalo de confianza al 95% para dicho estudio. Compare e interprete. 1. Planteamiento de la hipótesis: Tomando en cuenta que se desea comparar el valor de una muestra, contra un valor previamente establecido de 130 mmHg con el cual se pretende demostrar si el valor dado por la muestra pudo haber cambiado (diferente), y que solamente se maneja un grupo de datos, y que la hipótesis que debe demostrarse es la hipótesis alterna, las hipótesis quedarían como: Ho:  = 1130

vs

Ha:  ≠ 130

Observe que el enunciado del problema describe al final que el valor de la muestra pudo haber “cambiado”, por lo que se está hablando de que puede ser diferente, motivo por el cual el signo ≠ se colocará en la hipótesis alterna y el signo contrario (=) en la hipótesis nula. 2. Nivel de significancia: α = 5% 3. Regla de decisión: En este caso, debe revisarse en primer lugar la dirección de la hipótesis, verificar si es unilateral (una cola) o bilateral (dos colas). En el ejercicio se aprecia que la dirección de la hipótesis es bilateral, es decir, el planteamiento es de dos colas, por lo tanto se realiza el siguiente procedimiento:

17


Este valor se resta a 1, que es el valor bajo la curva, dando como resultado 0.975, valor que se buscará en tabla estadística t utilizando alternadamente los grados de libertad (n-1) que en este problema sería igual a 23 (24-1). Utilizando la tabla de t se buscará el valor que intercepta el 0.975 con los grados de libertad, 23. Esto es:

Por lo tanto: Se rechaza H0 si t ≤ - 2.069 ó si t ≥ 2.069 No se rechaza H0 si -2.069 ≤ t ≤ 2.069

18


Esto es:

Nuevamente tómese en cuenta que el valor determinado de tabla es positivo, por lo que para la regla de decisión se requiere de su contraparte negativa para poder establecer las zonas de aceptación y rechazo. Recordemos que este paso se aplica de igual forma para la prueba estadística Z. 4. Cálculo del estadístico: Para poder aplicar el estadístico Z para una muestra, es necesario revisar la fórmula para identificar los elementos que se deben determinar:

De la fórmula anterior se observa que se requiere determinar los valores de promedio, desviación estándar y error estándar. La fórmula implica también el uso de la varianza; pero es más fácil aplicar la desviación estándar dado que es el estadístico que principalmente se calcula. n

x

S

x

0

24

109

5.46

1.12

130

Por lo tanto, el cálculo del estadístico estaría dado por:

19


5. Conclusión: De acuerdo con el valor del estadístico obtenido, se rechazaría la hipótesis nula, con lo cual se afirmaría que el valor de la tensión sistólica en los estudiantes que presentaron el examen es diferente al anterior valor obtenido. En otras palabras, el nivel de estrés fue menor en la segunda ocasión.

6. Intervalo de confianza:

Puede observarse que el valor de 130 mmHg no está incluido en el intervalo de confianza, con lo cual de igual forma se comprueba el rechazo de la hipótesis nula.

20


Ejercicio 4: t para muestras dependientes o relacionadas. Un investigador clínico, desea determinar si el tratamiento para el control de la diabetes ha sido efectivo, en un grupo de 21 sujetos con diabetes mellitus tipo 2. Para ello, analizó las muestras de glucosa sanguínea de forma basal, y 1 mes posterior al tratamiento. Los datos obtenidos son: Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

Medición Basal Al mes 126 120 134 117 110 89 121 119 124 231 198 224 342 165 176 196 185 160 210 197 194 214 214 202 167 180 266 234 321 401 302 119 209 316 114 98 224 168 136 101 198 116

Comentarios

Observe que se trata de dos grupos de datos provenientes de un solo grupo de pacientes. Debe siempre revisar cuántos grupos de datos analizara y si estos son dependientes o independientes para que pueda establecer la prueba estadística a utilizar, considerando la simetría o asimetría de los datos.

1) Planteamiento del problema: La hipótesis se establece con base en el número de grupos y la dirección del texto, el cual en una parte describe “…si el tratamiento para el control de la diabetes ha sido efectivo,…”, por lo que se presume que se busca mejoría o un cambio, o si por el contrario, el tratamiento es igual, considerando que mucho tiene que ver que el paciente cumpla con las indicaciones. Por lo tanto las hipótesis quedarían descritas como: H0: 1 = 2 (o x = 0) vs Ha: 1 ≠ 2 (o x ≠ 0) 21


2) Nivel de significancia: Como no se menciona en el texto el nivel de confianza, por conveniencia estadística siempre que esto suceda, el nivel de confianza será al 95%, por lo tanto, el nivel de significancia (α) sería del 5%. 3) Regla de decisión: Igual que todas las pruebas, debe revisarse en primer lugar la dirección de la hipótesis, verificar si es unilateral (una cola) o bilateral (dos colas). En el ejercicio se aprecia que la dirección de la hipótesis es bilateral, es decir, el planteamiento es de dos colas, por lo tanto se realiza el siguiente procedimiento:

Este valor se resta a 1, que es el valor bajo la curva, dando como resultado 0.975, valor que se buscará en tabla estadística t utilizando alternadamente los grados de libertad (n-1) que en este problema sería igual a 20 (21-1). Por lo tanto, mediante el empleo de la tabla estadística t, se buscará el valor que intercepta el 0.975 con los grados de libertad, 20. Esto es:

22


Por lo tanto: Se rechaza H0 si t ≤ - 2.086 ó si t ≥ 2.086 No se rechaza H0 si -2.086 ≤ t ≤ 2.086

23


4) Cálculo del estadístico: Como en las pruebas anteriores, debe revisarse que datos se requieren de la fórmula, una vez establecida esta:

Puede apreciarse que en este caso, no se observa el símbolo x, sino el símbolo d, con lo cual de igual forma, se describe que se requiere un promedio, pero en este caso de la diferencia de las mediciones (d). Esto es: Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

Medición Basal Al mes 126 120 134 117 110 89 121 119 124 231 198 224 342 165 176 196 185 160 210 197 194 214 214 202 167 180 266 234 321 401 302 119 209 316 114 98 224 168 136 101 198 116 d S

d 6 17 21 2 -107 -26 177 -20 25 13 -20 12 -13 32 -80 183 -107 16 56 35 82 14.476 72.61

24


Por lo tanto: n

d

S

x

0

21

14.476

72.61

15.8

0*

* Cuando no se establece un valor previo, el valor de 0 = 0.

5) Conclusión: Con base en la regla de decisión, no se rechaza H0, es decir, los resultados son iguales. En palabras clínicas, el tratamiento no surtió efecto tal vez por la poca disposición de los pacientes a cumplir las indicaciones médicas.

6) Intervalo de confianza: ¿Puede determinarse el intervalo de confianza para una prueba estadística t pareada o relacionada?

25


Ejercicio 5: t para muestras independientes. Un grupo de Químicos Clínicos, desea comparar los promedios de las mediciones de tiroxina en el suero de 16 niños con hipotiroidismo, en dos categorías: Grupo 1: Síntomas ligeros o inexistentes. Grupo 2: Síntomas marcados. Para ello midieron los niveles de tiroxina bajo condiciones de ayuno, registrando los siguientes datos: Paciente 1 2 3 4 5 6 7 8 9

Mediciones de Tiroxina Grupo 1 Grupo 2 34 18 49 8 58 5 45 60 55 24 60 84 59 96 62 86

Comentarios Observe que se trata de dos grupos de datos provenientes de dos grupos o muestras diferentes. Debe siempre revisar cuántos grupos de datos analizara y si estos son dependientes o independientes para que pueda establecer la prueba estadística a utilizar, considerando la simetría o asimetría de los datos.

Realice las operaciones con un nivel de confianza del 95%. 1) Planteamiento del problema: La hipótesis se establece con base en el número de grupos y la dirección del texto, el cual en una parte describe …se desea comparar los promedios…”, por lo que se presume que se busca identificar similitud o diferencia de los promedios. Por lo tanto las hipótesis quedarían descritas como: H0: 1 = 2 vs Ha: 1 ≠ 2 2) Nivel de significancia: Como se menciona un nivel de confianza del 95%, sabemos entonces que la diferencia para 100% es 5%, por lo tanto el nivel de significancia (α) es igual a 5%. 3) Regla de decisión: Igual que todas las pruebas, debe revisarse en primer lugar la dirección de la hipótesis, verificar si es unilateral (una cola) o bilateral (dos colas). En el presente ejercicio se aprecia que la dirección de la hipótesis es bilateral, es 26


decir, el planteamiento es de dos colas, por lo tanto se realiza el siguiente procedimiento:

Este valor se resta a 1, que es el valor bajo la curva, dando como resultado 0.975, valor que se buscará en tabla estadística t utilizando alternadamente los grados de libertad (n-1). En este problema tenemos dos grupos, uno con 9 datos y otro con 7 datos, que hacen un total de 16 datos, si aplicamos a cada grupo los grados de libertad (n-1) tendríamos 8 datos para el primer grupo y 6 datos para el segundo grupo, por lo que los grados de libertad es igual a 14. Por lo tanto, mediante el empleo de la tabla estadística t, se buscará el valor que intercepta el 0.975 con los grados de libertad, 14. Esto es:

27


Por lo tanto: Se rechaza H0 si t ≤ - 2.145 ó si t ≥ 2.145 No se rechaza H0 si -2.145 ≤ t ≤ 2.145

4) Cálculo del estadístico: Como en las pruebas anteriores, debe revisarse que datos se requieren de la fórmula, una vez establecida esta:

Puede apreciarse se requiere conocer el tamaño de la muestra, promedio y varianza de ambos grupos. Entonces se calculan por grupo y se obtiene: Por lo tanto: Grupo

n

x

S

S2

1

9

56.4

14.2

202.3

2

7

42.1

37.5

1404.8

28


5) Conclusión: Con base en la regla de decisión, no se rechaza H0, es decir, los promedios de tiroxina no son diferentes en niños con hipotiroidismo con síntomas ligeros o inexistentes de aquellos con síntomas marcados.

6) Intervalo de confianza: ¿Puede determinarse el intervalo de confianza para una prueba estadística t pareada o relacionada?

29


Ejercicio 6: Prueba de X2 para una varianza. Una compañía farmacéutica establece que su medicamento para la tos es tan eficaz que la persona que lo toma, deja de toser casi inmediatamente. Para ello, desea comparar dicha aseveración contra la varianza de una investigación previa que establece un valor de 25. Para la investigación seleccionó una muestra de 10 sujetos en los cuales midió los minutos que tosieron después de ingerir el medicamento. Los datos obtenidos son los siguientes: Pac.

1

2

3

4

5

6

7

8

9

10

Min

9

10

8

4

3

0

10

15

9

8

Realice el ejercicio empleando un nivel de confianza del 95%. 1) Planteamiento del problema: Observe que ya no se trata de una prueba Z o t, ya estamos hablando de una prueba estadística que puede emplearse para demostrar la hipótesis de una varianza y que además puede ser utilizada como prueba de bondad de ajuste o en tabla cuadricelular. En este caso, solamente estudiaremos la primera opción. Observe que el texto describe que “…es tan eficaz…” por lo que se presume que la compañía quiere demostrar que su medicamento es mejor. Por lo tanto las hipótesis quedan descritas como: H0:  ≤ 25 vs Ha:  > 25 Note que en esta prueba, ya no se utiliza el parámetro µ, sino ahora el parámetro  (sigma). 2) Nivel de significancia: Como el nivel de confianza es del 95%, entonces α = 5%. 3) Regla de decisión: En este caso la regla de decisión cambia, ya que la tabla estadística que se utilizará ahora será la tabla de X2 (Chi cuadrada). Y para establecer dicha regla se procede de la siguiente forma:

30


Este valor se resta al valor bajo la curva (1-0.05) quedando como 0.95 el cual se contrasta con los grados de libertad (n-1) que es igual a 9, dando un valor de tabla de 16.92. Posteriormente se busca el valor correspondiente a 0.05 y se obtiene 3.33.

31


Por lo tanto: Se rechaza H0 si X2 ≤ 3.33 ó si X2 ≥ 16.92 No se rechaza H0 si 3.33 ≤ X2 ≤ 16.92

Observe que a diferencia de las pruebas estadística Z y t, la prueba de X2 no requiere su contraparte negativa, ya que todos los valores determinados deben ser positivos. 4) Cálculo del estadístico: De acuerdo con el estadístico, se requiere calcular la varianza de la muestra. Por lo tanto:

5) Conclusión: Dada la regla de decisión y el valor calculado del estadístico, no se rechaza H0, es decir, el medicamento de la compañía farmacéutica es igual al resto de los medicamentos para la tos.

32


Comentario final: Este breve resumen te permitirá conocer tres pruebas estadísticas importantes de la estadística paramétrica, y sus respectivas variantes. Más adelante, te enviaremos ejercicios para que los realices, tomando en cuenta este resumen y los envíes a través de la plataforma EMINUS para su evaluación. Recuerda que seguimos en contingencia y que no son vacaciones, por lo tanto, tenemos que seguir avanzando en el proceso de enseñanza-aprendizaje. Y por favor, ¡QUÉDATE EN CASA!

33


BIBLIOGRAFÍA 1. Ellenberg JH. Selection bias in observational and experimental studies. Stat Med 1994;13:557-67. 2. Sackett DL, Richardson WS, Rosenberg W, Haynes RB. Medicina basada en la evidencia. Cómo ejercer y enseñar la MBE. Madrid: Churchill Livingstone España, 1997. 3. Abraira V. Estadística inferencial. Disponible en: http://www.hrc.es/bioest/Introducion.html [consultado: 11/07/2001]. 4. Bolliger CT, Zellweger JP, Danielsson T, van Biljon X, Robidou A, Westin A, et al. Smoking reduction with oral nicotine inhalers: double blind, randomised clinical trial of efficacy and safety. BMJ 2000;321:329-33. 5. Abraira V. Medidas del efecto de un tratamiento (I): reducción absoluta del riesgo, reducción relativa del riesgo y riesgo relativo. SEMERGEN 2000;26:535-6. 6. Abraira V. Medidas del efecto de un tratamiento (II): odds ratio y número necesario para tratar. SEMERGEN 2001;27:418-20. 7. Tomás SJ. Fundamentos de bioestadística y análisis de datos para enfermería. 1ra Ed. Barecelona, España: Servei de Publicacions; 2009. 8. Rosner B. Fundamentals of Bioestatistics. 7a Ed. Brooks/Cole, Cengage Learning, Canadá; 2011. 9. Moncho VJ. Estadística aplicada a las ciencias de la salud. 1a Ed. Elsevier. Barcelona, España; 2015. 10. Dawson GF. Interpretación fácil de la bioestadística. La conexión entre la evidencia y las decisiones médicas. 1a Ed. Elsevier Saunders. 11. Triola MF. Estadística. 12a Ed. Pearson Educación de México. México; 2018. 12. De la Puente VC. Estadística descriptiva e inferencial y una introducción al método científico. 1a Ed. Edit. Complutense. Madrid; 2009.

34


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.