GUIA DE SEMINARIO BIOESTADISTICA
1
Guía De Seminarios de Bioestadística
SEMINARIO Nº 1 Un médico está interesado en realizar un estudio de pacientes con malaria que se atendieron en el Hospital Regional de Loreto durante el año del 2012, para ello se revisaron historias clínicas. Se pide responder las preguntas 1 y 2: 1.- Cuál es la unidad de análisis del estudio? a. Un paciente con malaria b. Una historia clínica del paciente con malaria. c. Una historia clínica del paciente con malaria que se atendió en el Hospital Regional de Loreto – 2012. d. Un paciente con malaria que se atendió en el Hospital Regional de Loreto – 2012. e. Una historia clínica del paciente que se atendió en el Hospital Regional de Loreto – 2012. 2.- Cuál es la población que es objeto de estudio: a. Los pacientes con malaria que se atendieron en el Hospital Regional de Loreto – 2012. b. Las historias clínicas de los pacientes que se atendieron en el Hospital Regional de Loreto – 2012. c. Las historias clínicas de pacientes con malaria. d. Las historias clínicas de pacientes con malaria que se atendieron en el Hospital Regional de Loreto – 2012. e. Los pacientes con malaria Un especialista en Salud Pública realiza una encuesta para medir conocimientos sobre ETS en los alumnos de la Facultad de Medicina. Para medir conocimientos se elabora un cuestionario. Contestar preguntas 3 y 4. 3. A las puntuaciones obtenidas sobre sus conocimientos de ETS, que tipo de variable le corresponde: a. Cuantitativa contínua. b. Cualitativa discreta c. Cualitativa d. Cuantitativa discreta. e. Ordinal. 4. La escala de medición que le corresponde a la variable es: a. Nominal b. Numérica c. Intervalo d. Ordinal e. Razón Un investigador está interesado en comparar la eficacia de dos tipos de medicamentos en la reducción de la frecuencia cardiaca en pacientes con enfermedades al miocardio de ambos sexos de 30 a 40 años de edad. Se pide contestar las preguntas 5 y 6: 5. ¿Cuál es la variable independiente? a. Reducción de la frecuencia cardiaca b. Edad c. Sexo d. Tipo de medicamento e. Cualquiera podría ser 6. ¿Cuál es la variable dependiente? a. Reducción de la frecuencia cardiaca b. Edad c. Sexo d. Tipo de medicamento e. Todas las anteriores Un investigador realizará una encuesta para medir la depresión y la proporción de obesos en los profesores de la Universidad de Nacional de Ingeniería en el mes de Noviembre del año 2012. Para medir la depresión aplica una escala psicológica y medir obesidad considera el índice de masa corporal. El 2
Guía De Seminarios de Bioestadística
estudio se realiza mediante una muestra 100 de profesores. Contestar preguntas 7 al 9. 7. El índice de masa corporal se mide considerando el peso entre la estatura en metros elevado al cuadrado, por consiguiente, tipo de variable y escala de medición que le corresponde es: a. Discreta e intervalo. b. Continua e intervalo c. Discreta y razón d. Continua y razón e. Ordinal y razón 8. Cuales son los parámetros que le corresponde al estudio, a. Puntuación media de depresión y Proporción de Obesos en los profesores de la UNI – Nov. 2012. b. Puntuación media de depresión y puntuación media de índice de masa corporal en los profesores de la UNI – Nov. 2012. c. Proporción de obesos en los profesores de la UNI – Nov. 2012. d. Puntuación media de depresión en los profesores de la UNI – Nov. 2012. e. Puntuación media del índice de masa corporal en los profesores de la UNI – Nov. 2012. 9. Cuáles son los estadísticos que le corresponden al estudio. a. Puntuación media de depresión y Proporción de Obesos en los profesores de la UNI – Nov. 2012. b. Puntuación media muestral de la depresión y puntuación media muestral del índice de masa corporal en los profesores de la UNI – Nov. 2012. c. Proporción muestral de obesos en los profesores de la UNI – Nov. 2012. d. Puntuación media de depresión en los profesores de la UNI – Nov. 2012. e. Puntuación media muestral de la depresión y Proporción muestral de Obesos en los profesores de la UNI – Nov. 2012. 10. Clasifique las variables de los siguientes enunciados: a) El número de micros que pasan por la calle Indaburo. b) El número de estudiantes de la Carrera de Medicina c) Gasto que realiza un estudiante en un día en la Universidad. d) Llamadas que llegan a la central telefónica de una empresa durante un día. e) Estatura de los estudiantes que pertenecen al equipo de basketball. f ) Nivel de Instrucción de personas de una Población del Altiplano. g) Tipo de escuela. h) Peso de los hombres de 20 años. i ) Mes de nacimiento. j ) Edad al primer matrimonio k) Raza. l ) Salarios que perciben un grupo de trabajadores. m) El número de hijos en un hogar. n) Preferencia religiosa de una persona. n) La velocidad de un automóvil. o) El porcentaje de personas que apoyan la gestión de gobierno. p) El peso contenido en los envases de helados Panda. q) El número de muertes por accidentes de tránsito en la ciudad de Lima
3
Guía De Seminarios de Bioestadística
SEMINARIO Nº 2: Clasificación y Presentación de datos 1-En una investigación se registró en número de horas que 35 pacientes de un hospital durmieron después que se les aplicó una cierta forma de anestesia. Los resultados obtenidos fueron: 3.1 0.9 17.0 10.3 7.6 11.0 7.1 6.6 4.0 5.4 3.1 1.4 5.2 3.7 13.0 7.6 7.0 4.5 2.3 13.2 7.7 11.8 11.9 3.0 6.6 2.9 9.7 7.8 3.5 8.3 4.6 7.2 1.1 3.5 3.9 a- Construir una tabla de frecuencias b- Elabore la gráfica del histograma y polígono de frecuencias. Interpretar resultados 2-En un estudio del nivel del colesterol total (mg /100 ml) en hombres adultos que consumen irregularmente embutidos en su alimentación se realizaron observaciones en 40 de tales personas. Los valores obtenidos fueron: 230 271 268 271 261 213 264 229 208 252 241 255 233 238 240 251 206 211 268 217 223 253 262 209 225 258 267 266 200 260 244 265 237 226 242 258 256 271 232 219 a- Construir una tabla de frecuencias b-Construir un diagrama de tallos y hojas c- Elabore la gráfica del histograma y polígono de frecuencias. Interpretar 3- Se presenta la información obtenida en el Hospital María Auxiliadora en el año 2012, en pacientes con cáncer ovárico. SEVERIDAD GRADO STRESS ENFERMEDAD II I III Leve 362 60 317 Moderado 29 5 21 Severo 19 5 20 Total 410 70 358 Fuente: Dpto. Estadística... 3.1 Para Ud. ¿Cuál sería el mejor título? 3.2 La escala de medición apropiada para medir grado de stress y severidad de enfermedad es: 3.3 Elabore la gráfica que corresponde a la información. 4- Se tiene la siguiente información de un estudio realizado en el Hospital Manuel Barreto-San Juan de Miraflores en el año 2012. DIAGNOSTICO NUTRICIONAL NUMERO DE NIÑOS Normal 60 Malnutrido 40 Total 100 4.1-¿Cuál sería el título apropiado para presentar la información? 4.2-La variable utilizada se mide por la escala: 4.3- Elabore la gráfica que corresponde a la información. 5. En la edición de uno de los diarios regionales, se publicó los siguientes valores para el número de lentes de contacto usados por personas en edad escolar. Tipo de lentes de contacto
Número de personas (millones)
Blandos, uso diario Rígidos, gas permeable Blandos, uso permanente Duros
11.5 4.0 3.5 1.5
Total
20.5
4
Guía De Seminarios de Bioestadística
Comente y construya un diagrama de barras de frecuencias relativas. 6. Se realizó una encuesta de 52 hogares en la Población de Querocotillo, preguntando el número de hijos por hogar, los resultados son los siguientes: 2643104431552 2643553532253 3315265445453 2413552300454 Para los datos: a) Indique, ¿qué tipo de variable es?. b) Construya una tabla de distribución de frecuencia. c) Interpretar todas las frecuencias absolutas (ni). d) Interpretar todas las frecuencias relativas (fi). 7. El siguiente conjunto de datos es de una muestra aleatoria de 50 datos; en este caso, los números representan la raza de los individuos, de donde: 1 =hispano, 2 =asiático, 3 =negro, 4 =blanco. 4144114442 4424443444 1444144344 4314441344 4334433444 a) Construya una tabla de distribución de frecuencias, con los datos anteriores. b) Construya una columna de porcentajes para esos datos. c) Construya y comente el diagrama de barras y el diagrama circular.
5
Guía De Seminarios de Bioestadística
SEMINARIO Nº 3 1.
A continuación se presentan una serie de proposiciones de las cuales tiene que identificar si es Verdadero (V) ó Falso (F). Si la proposición es falsa justificar su respuesta. ( ) Si la variable es cuantitativa continua los gráficos que le corresponde es: histograma, polígono de frecuencias y ojiva. ( ) La desviación estándar cuantifica la variabilidad de las observaciones de los datos con respecto a la mediana. ( ) En un conjunto de observaciones siempre la moda, la mediana y la media aritmética son iguales. ( ) La mediana de una distribución no se puede calcular si la amplitud de las clases no es constante. ( ) Si los valores están afectados por valores extremos, la medida que representa el conjunto de datos es la mediana y la variabilidad de estos valores lo mide la desviación estándar. ( ) La moda se utiliza si la variable está medida por lo menos a escala nominal. ( ) Los cuartíles son cuatro valores que dividen a la distribución ordenada en cuatro grupos. ( ) Si X es negativa, la desviación estándar vale cero. ( ) Si el valor del percentil 10 es P10=25, nos indica que el 10% de las observaciones están por encima de 25 y que el 90% restante de las observaciones están por debajo de 25. ( ) Si CV = 15% y S =3, entonces, X = 21. ( ) El valor de la mediana es sensible a los valores extremos de la distribución de los datos. ( ) La desviación cuartil es una medida de variabilidad con respecto a la media aritmética ( ) La tasa es una razón es un cociente entre dos cantidades de la misma naturaleza. ( ) La proporción es un cociente entre dos cantidades de distinta naturaleza, de tal manera de que el numerador no es parte del denominador. ( ) Si se tiene la siguiente serie de datos: 2, 4, 8, 16, 32, por consiguiente la media aritmética como valor representativo de estos valores es 12.4 ( ) La media aritmética del peso de las señoritas de la especialidad de estadística en investigación es de 50 kilos, son un peso mediano de 47 kilos y un peso modal de 44 kilos, por consiguiente, la distribución de los pesos tiene una asimetría negativa. ( ) En los alumnos de la especialidad de estadística en investigación, se tiene con respecto al colesterol entre hombres y mujeres se tiene lo sigte: Hombres Mujeres 1=180 2= 160 1= 60 2= 59 Por consiguiente, la variabilidad del colesterol es menor en las mujeres en relación al de los hombres.
2-En la comunidad "X" se realizó un censo y con respecto a ciertas características se obtuvo la siguiente información : Población 20,000 Nº de varones 10,500 Nº de habitaciones 11,000 Nº de defunciones 200 Nº de personas fallecidas por cáncer de pulmón 10 Nº de nacimientos 800 Nº de abogados 50 Nº de viviendas 3000 Nº de personas que hacen cáncer de estomago 8 Se pide el cálculo e interpretación tres proporciones y tres razones. 3. En la población de varones mayores de 18 años de la comunidad “Solidaridad”, estamos interesados en evaluar las características: Peso, Colesterol y Frecuencia Cardíaca, en base a los siguientes valores: Peso Colesterol Frecuencia Cardiaca _ _ _ x = 68 Kg x = 220 x = 90 p/m Me = 72 Kg Me = 210 Me = 100 p/m Mo = 75 kg Mo = 200 Mo = 110 p/m S = 12 Kg S = 20 S = 20 p/m
6
Guía De Seminarios de Bioestadística
Se pide: a. En cual de las características hay mayor variabilidad. b. Todas la característica son simétricas. De ser asimétricas, que tipo de asimetría tienen. c. De acuerdo a lo obtenido en (b), cuál es la medida de tendencia central y dispersión mas apropiada en cada una de las características que se están estudiando. d. Interprete y comente los resultados obtenidos en cada característica. 4. Se ha evaluado la eficacia del producto antitaquicárdico mediante la utilización del diseño antes – después (es decir, antes y después de aplicar el producto a cada paciente se le determina su frecuencia cardíaca): Posteriormente de cada paciente se obtienen los siguientes valores como consecuencia de la diferencia después – antes: 25, 15, 40, 0, 10, -20, 35, 45, -15, 30. Se pide: Calcular e interpretar las medidas de tendencia central y dispersión. De acuerdo a la naturaleza de la distribución, ¿cuál es la medida de tendencia central y dispersión mas apropiada? 5. Con respecto al Gráfico de Cajas responda las siguientes preguntas:
¿Qué grupo tiene mayor valor promedio? ¿Qué grupo presenta mayor dispersión? ¿Qué grupo es más simétrico? ¿Qué grupo presenta valores discordantes? La siguiente tabla muestra el tiempo (en minutos) que demora 60 médicos de consulta externa en un centro hospitalario de Talara (Piura). Tiempo (minutos)
8- 13
14- 17
18- 21
22– 25
Numero de médicos
10
30
12
8
6. ¿Qué medida de localización se utilizará para determinar que un medico se ubique en el 25% de los mas rápidos? a. Calcular la media. b. Calcular la mediana. c. Determinar el cuartil 3. d. Determinar el cuartil 1. e. Faltan datos.
7
Guía De Seminarios de Bioestadística
7. ¿Cuál es el tiempo más frecuente entre el número de consultas? a.10.5 b.15.5 c.19.5 d.23.5 e.25.5
Dada la siguiente tabla de distribución de frecuencias con intervalo de clase (C) constante igual a 5. Complete el cuadro y responda las preguntas 8 al 11:
Xi
fi
Fi
X i fi
1°
2
2°
21
3°
8
4° 5°
48
2 - 24
6°
3
14
8.¿En que clase se ubica el cuartil 3? a.1° clase b.2° clase c.3° clase d.4° clase e.5° clase 9.Determine el valor de F3 a.1 b.4 c.8 d.10 e.11 10.¿Cual será el mejor grafico para representar la información? a. Barras simples. b. Pictograma. c. Ojiva. d. Histograma. e. c y d. 11. Si realizamos la representación grafica de las frecuencias acumuladas se construye: a. Histograma. b. Ojiva. c. Polígono frecuencias. d. Barras e. N. A En la población de docentes de la Universidad Nacional de Piura se evaluó la característica Peso y se determino los siguientes valores. Conteste las preguntas 12 y 13: _ X = 85 Kg. M e = 90 M o = 95 8
Guía De Seminarios de Bioestadística
12. ¿Determine usted si existe Simetría o Asimetría? Marque la respuesta correcta. a. Simetría. b. Simetría hacia la izquierda. c. Asimetría. d. Asimetría Negativa. e. Asimetría Positiva. 13. ¿Qué medida de tendencia central y dispersión se calcularía? a. Media – desviación cuartilica b. Media – desviación estándar. c. Moda - desviación cuartilica d. Mediana – desviación cuartilica. e. Mediana – desviación estándar. 14.Se han medido los pesos y tallas de seis alumnos obteniéndose la siguiente información. Peso: Talla:
65 1.70
60 1.50
65 1.68
63 1.70
68 1.75
68 1.80
¿Qué variable presenta mayor dispersión? a. a.Talla. b. b.Peso. c. c.Faltan datos. d. d.No es posible calcular la dispersión e. e.N. A A continuación se presenta información sobre número de hijos de cien familias, responder las preguntas 15 y 16: N°hijos fi 0 1 2 3 4 5
Fi 14 10 15 26 20 15
14 24 39 65 85 100
15.Calcular M 0 a. Familia con 4 hijos b. M 0 = 85 c. M 0 = 26 d. Familia con tres hijos. e. Amodal. 16.Calcular la media a. a.No se puede calcular porque la variable N° de hijos se comporta como cualitativa. b. b.7.5 c. c.Faltan datos. d. d.16.5 e. e.No existe media.
9
Guía De Seminarios de Bioestadística
SEMINARIO Nº 4 1.
Coloque V ó F dentro de cada paréntesis, según considere que el enunciado respectivo es verdadero o falso. Justificar la respuesta que usted considere que es falsa ( ) P(A/B) = P(AB), P(B) > 0 P(A) ( ) Se tiene que P(A/B) = 0.2, P(AB) = 0.2, entonces, _ P(B) = 0.1 Y P(A/B) = 0.08. ( ) En un lote 100 vacunas se detecta que 10 son defectuosas. De este lote, se eligen dos vacunas al azar sin reposición y la probabilidad de que ambas resulten de buena calidad es de 0.81. ( ) La probabilidad de ocurrencia de un evento imposible puede ser de 0.0000000001 ( ) Un centro de salud recibe un lote de 100 medicamentos de los cuales: 30 es de marca A, 45 de marca B y 25 de marca C. Si de dicho lote se elige un medicamento al azar, la probabilidad de que no sea de la marca A ó B es de 0.75 ( ) La tasa de incidencia de cáncer de cervix en las mujeres es de 45/100,000, es decir, la probabilidad de que una mujer se enferme de cáncer es de 0.00045 Dos mujeres asisten a su control un consultorio de un médico especialista en oncología, la probabilidad de que ambas mujeres tengan cáncer de cervix es de 0.000002025. ( ) En un determinado país, la tasa de incidencia de cáncer de pulmón es 74/100,000 en el 2011. Esta tasa expresada en tanto por unos nos indica la probabilidad de hacer cáncer de pulmón en una persona elegida al azar es de 0.000074, ( ) Si A y B son dos eventos cualesquiera, entonces P(AUB)=P(A)+P(B)-P(B)P(B/A)
2.
Doscientos pacientes dados de alta del servicio de cirugía de un determinado Hospital, fueron clasificados según género y opinión acerca del trato recibido durante su hospitalización. Los resultados fueron: Género
Opinión
Total
Positiva
Negativa
Masculino Femenino
100 10
20 70
120 80
Total
110
90
200
Si se elige un paciente al azar, ¿cuál es la probabilidad de que: 2.1 Sea varón o su opinión sea positiva? 2.2 Su opinión sea positiva, dado que resultó ser varón. 2.3 La opinión del paciente sobre la atención en el servicio de cirugía es independiente del genero que le corresponde? En una clínica se ha determinado de que el 40% de los trabajadores fuman cigarrillos, el 55% son mujeres y el 75% son mujeres o fuman cigarrillos. Se elige un trabajador al azar, 3. ¿cuál es la probabilidad de que fume cigarrillos y sea varón? a. 0.25 b. 0.20 c. 0.75 d. 1.1 e. Ninguno de los anteriores 4. ¿ Cuál es la probabilidad de que fume cigarrillos dado que es varón? a. 0.4444 b. 1.6667 c. 0.3636 d. 0.04444 e. Ninguno de los anteriores
10
Guía De Seminarios de Bioestadística
5. Este problema se refiere a la miopía entre hermanos en familias con dos hijos. Sea S 1 el evento de que el hermano mayor sea miope, y S2 representa el evento de que el hermano menor sea miope. Si se sabe que P(S1) = 0.4, P(S2) = 0.2 y P(S1S2) = 0.1 a. Calcular P(S1 U S2). b. Describa en palabras lo que significa el evento S1 U S2 c. ¿Cuál es la probabilidad de que ninguno de los hermanos sea miope? d. Calcular P(S1|S2) y P(S2|S1) e. ¿Son S1 y S2 independientes?. Explicar por qué 6. Se realizó un estudio para examinar si las personas con un IQ alto tienden a casarse entre ellos, y si esto está relacionado también con el sexo; para lo cual se obtuvieron datos de 1000 parejas. Sea M el evento que denota que el miembro masculino de la pareja tiene un IQ alto y F el evento que denota el hecho de que el miembro femenino de la pareja tenga un IQ alto. Los resultados obtenidos fueron los siguiente: P(FM) = 0.05 P(M) = 0.20 P(F) = 0.10 a. ¿Cuál es la probabilidad de que la esposa tenga un IQ alto, dado que su esposo también lo tenga? b. ¿Cuál es la probabilidad de que el esposo tenga un IQ alto, si se conoce que su pareja lo también lo tiene? c. ¿Cuál es la probabilidad de que al menos uno de los miembros de la pareja tenga un IQ alto? d. Si al menos uno de los miembros de la pareja tiene un IQ alto. ¿Cuál es la probabilidad de que la esposa lo tenga? e. ¿Cuál es la probabilidad de que solamente la esposa tenga un IQ alto? 7. Esta pregunta trata sobre la relación entre el sobrepeso y la presión sanguínea (BP) en los hombres. La siguiente tabla muestra las probabilidades correspondientes a las diferentes combinaciones de estas variables. BP Normal BP Alta Peso Normal 0.6 0.1 Sobrepeso 0.2 0.1 a. ¿Cuál es la probabilidad de que un individuo seleccionado tenga sobrepeso? ¿Cuál es la probabilidad de que un individuo seleccionado tenga presión alta? b. ¿Cuál es la probabilidad de que un individuo seleccionado al azar tenga sobrepeso o presión alta? c. Calcular la probabilidad condicional de que un individuo tenga presión sanguínea alta dado que se sabe que tiene sobrepesod. ¿El peso es independiente de la presión sanguínea? Un médico está interesado en investigar diabetes y obesidad en los trabajadores de la municipalidad de lima. Se sabe de que un trabajador que es obeso la probabilidad de que sea diabético es de 0.15; la probabilidad de que solamente sea diabético es de 0.03; de que tenga solamente una de las dos enfermedades es de 0.10, de que sea diabético es de 0.12. Se pide: (Responder 8 al 10) 8. ¿Cuál es la probabilidad de que el trabajador sea solamente Obeso? a. 0.16 b. 0.15 c. 0.10 d. 0.07 e. 0.03 9. ¿Cuál es la probabilidad de que sea obeso dado que el trabajador es diabético? a. 0.12 b. 0.15 c. 0.03 d. 0.65 e. 0.75 10. ¿Cuál es la probabilidad de que un trabajador tenga por lo menos uno de las dos enfermedades? a. 0.12 b. 0.16 c. 0.10 d. 0.28 e. 0.19 La probabilidad de que un estudiante de la facultad de medicina tenga depresión es de 0.01. Si de dicha población seleccionamos dos estudiantes, se pide: (Responder 11 y 12) 11. ¿Cuál es la probabilidad de que uno de los dos tenga depresión? a. 0.01 b. 0.0001 c. 0.009 d. 0.018 e. 0.000081 12. ¿Cuál es la probabilidad de que al menos uno de ellos no tenga depresión? a. 0.0199 b. 0.99 c. 0.9999 d. 0.999 e. 0.0001
11
Guía De Seminarios de Bioestadística
SEMINARIO Nº 5 1.
Coloque V ó F dentro de cada paréntesis, según considere que el enunciado respectivo es verdadero o falso. Justificar la respuesta que usted considere que es falsa. ( )
El odds en favor del evento A es una _razón de probabilidades definida como P(A)/P(A).
( )
La sensibilidad de una prueba de diagnóstico se define como la probabilidad de tener la enfermedad dado que resultó positiva a la prueba.
( )
El valor predictivo negativo de una prueba de diagnóstico se define como la probabilidad de que no tenga la enfermedad dado que resultó negativa a la prueba.
( )
Si la evaluación de una prueba de diagnóstico se realiza mediante un estudio comparativo tipo caso- control, entonces, de dicha tabla podemos obtener directamente la proporción real de la prevalencia de la enfermedad y la probabilidad de que una persona resulte con prueba positiva.
( )
Odds ratio (OR) se aproxima al riesgo relativo (RR) si la tasa de incidencia de la enfermedad se aproxima a cero.
( )
Si la proporción de falsos positivos es de 0.1, entonces, la probabilidad de que resulte negativo a la prueba dado que no tiene la enfermedad es de 0.9.
2. Una enfermedad puede estar producida por uno de los dos virus A, y B. En el laboratorio hay 5 tubos de ensayo con el virus A, 3 tubos con el virus B. La probabilidad de que el virus A produzca la enfermedad es de 1/3, que la produzca B es de 1/7. Se inocula un virus a un animal y contrae la enfermedad. ¿Cuál es la probabilidad de que el virus que se inocule sea el A? 3. La proporción de alcohólicos que existe en la población de Málaga es, aproximadamente, un 10%; no obstante, en las bajas que dan los médicos de la Seguridad Social difícilmente se encuentra el diagnóstico de alcoholismo. Aparecen sin embargo diagnosticados de hepatopatías, lumbalgias, etc., que pueden hacer sospechar alcoholismo subyacente. Se realizó un estudio que puso de manifiesto que el 85% de los individuos alcohólicos y el 7% de los no alcohólicos sufrían tales patologías. Se desea saber cuál es la probabilidad de que un individuo con esas patologías sea realmente alcohólico. 4. Estamos interesados en saber cuál de dos análisis A y B es mejor para el diagnóstico de una determinada enfermedad, de la cual sabemos que la presentan un 10% de individuos de la población. El porcentaje de resultados falsos positivos del análisis A es del 15% y el de B es del 22%. El porcentaje de falsos negativos de A es del 7% y de B es del 3%. ¿Cuál es la probabilidad de acertar en el diagnóstico con cada método? 5. Con objeto de diagnosticar la colelitiasis se usan los ultrasonidos. Tal técnica tiene una sensibilidad del 91% y una especificidad del 98%. En la población que nos ocupa la probabilidad de colelitiasis es del 20%. a. Si a un individuo de tal población se le aplican los ultrasonidos y dan positivos, ¿cuál es la probabilidad de que sufra la colelitiasis? b. Si el resultado fuese negativo, ¿cuál es la probabilidad de que no tenga la enfermedad?. 6. Los estudios epidemiológicos indican que el 20% de los ancianos sufren un deterioro neuropsicológico. Sabemos que la tomografía axial computerizada (TAC) es capaz de detectar este trastorno en el 80% de los que lo sufren, pero que también da un 3% de falsos positivos entre personas sanas. Si tomamos un anciano al azar y da positivo en el TAC, ¿cuál es la probabilidad de que esté realmente enfermo? 7. Se tiene interés en evaluar si el uso de anticonceptivos orales es un factor de riesgo del infarto miocárdico en mujeres casadas menores de 45 años de edad. Para tal efecto se realiza un estudio comparativo tipo caso control y se obtienen los siguientes resultados:
12
Guía De Seminarios de Bioestadística
Uso de anticonceptivos orales
Pacientes con infarto Miocárdico (Casos)
Sin infarto Miocárdico (Controles)
Si Nunca
23 35
34 132
Total
58
166
Se pide calcular e interpretar el odds ratio (OR) 8. Evaluar si niveles altos de colesterol sérico (>250) se considera factor de riesgo de un infarto del miocárdio. Por consiguiente se realiza un estudio comparativo de cohortes y se obtiene los siguientes resultados: Niveles de colesterol
Desarrolla IM Sérico (mg%)
>250 250
10 21
No desarrolló IM
125 449
Total
135 470
Se pide calcular e interpretar el riesgo relativo 9. Se desea evaluar si el consumo del tabaco es un factor de riesgo del cáncer de pulmón. Para tal efecto se registraron 550 fumadores de los 649 casos con cáncer de pulmón, comparados con los 300 no fumadores de los 640 controles a. Mostrar una tabla 2x2 con los datos obtenidos. b. Calcular e interpretar el odds ratio asociado con el consumo de tabaco. 10. Se realizó un estudio caso- control para encontrar si la vasectomía es un factor de riesgo del cáncer de próstata. Los datos obtenidos se muestran en la tabla cruzada de abajo. VASECTOMIA Casos Controles
TOTAL
Si No TOTAL
154 279 433
70 105 175
80 178 258
Calcular el odss ratio. Interpretar los resultados 11. Se estudió la asociación entre el uso de drogas intravenosas (IVDU) y la presencia de sida (VIH) en mujeres reclusas en un penal. Se obtuvieron los siguientes resultados: IVDU
HIV+ HIV- Total
+
61
75
136
-
27
312
339
387
475
Total
88
Calcular e interpretar el riesgo relativo.
13
Guía De Seminarios de Bioestadística
12. Una investigación del riesgo asociado con un agente quimioterápico (Cytarabine) fue realizado por Jolson y sus colaboradores (1992). Los pacientes recibieron una formulación de la droga (grupo expuesto) o la formulación original (grupo no expuesto). El resultado era si el paciente desarrolló toxicidad cerebelosa mientras se encontraba en terapia. Los resultados obtenidos fueron los siguientes: Enfermedad Si Exposición Si No TOTAL
Total
No 11
14
25
3
31
34
14
45
59
Calcular e interpretar el riesgo relativo
14
Guía De Seminarios de Bioestadística
SEMINARIO Nº 6 : Distribución de Probabilidades Binomial y Normal BINOMIAL 1.- Supóngase que en una cierta población el 51% de todos los nacimientos registrados son varones. Si, de esta población se selecciona aleatoriamente cinco registros de nacimientos. ¿Cuál es la probabilidad de que : a.- Ninguno de los registros sea varón? b.- Exactamente dos de los registros sean varones? 2.- La proporción de fumadores en una ciudad es de 4 de cada 10 personas. Si de esta ciudad se selecciona aleatoriamente 10 personas, se pide: a.- Cuál es la probabilidad de que tres o menos personas sean fumadores? b.- Determinar el número esperado de personas que fuman? 3.- La proporción de mortalidad para cierta enfermedad es del 0.15 y suponga que la contraen 10 personas de la comunidad. ¿Cuál es la probabilidad de que: a.- Ninguna sobreviva? b.- Al menos tres mueran? c.- Calcular la media y desviación estándar de la distribución.
NORMAL 1.- De la población de valores de Z seleccionamos uno al azar, se pide: I. Determine las siguientes probabilidades: a. P(Z>1.37) b. P(Z<-0.84) c. P(Z>1.15) d. P(1.64<Z<1.96) e. P(-0.84<Z<0.84) f. P(-1<Z<2) II.
Calcular el valor de zo en las siguientes expresiones: a. P(Z> zo)= 0.025 b. P(Z< zo)= 0.15 c. P(-zo<Z< zo) 0.8
2.- Supóngase que se sabe que los pesos de 300 individuos están distribuidos en forma normal con media de 68 Kg. y una desviación estándar de 11.5 Kg. a.- Cuál es la probabilidad de que una persona seleccionada al azar pese 70 Kg. O menos? b.- Cuántas personas se espera encontrar que pesen 70 Kg. o menos? 3.- Las notas de un examen del curso de bioestadística se distribuye normalmente con una media de 13.5 y una desviación estándar de 4.3 a.- Cuál es el porcentaje de estudiantes cuyas notas están entre 11 y 15? b.- Cuál es la probabilidad de que un alumno elegido al azar no tenga una nota mayor de 10? c.- Determinar el valor de la nota debajo el cual se ubica el 15% inferior de los alumnos. 4- Supóngase que se sabe que los niveles de glucosa en sangre extraída a 150 niños en ayunas están distribuidos normalmente con una media de 66 y una desviación estándar de 42. a.- Cuál es la probabilidad de un niño seleccionado al azar presente un nivel de glucosa en sangre mayor o igual a 71? b.- Cuántos niños presentan un nivel de glucosa en sangre menor o igual a 61? c.- Determinar la mediana y la moda de la distribución. 5.- Los puntajes del Coeficientes de Inteligencia tomados a un grupo de personas adultas, en un proceso de selección de personal están distribuidos normalmente con una media de 105 y una desviación estándar de 12. a.- Si el puntaje mínimo para aprobar es 90, ¿Cuál es el porcentaje de no aprobados? b.- Si han aprobado el 75% de las personas, ¿ Cuál es el puntaje mínimo aprobatorio? 15
Guía De Seminarios de Bioestadística
6.- Supóngase que la distancia promedio de internación en un hospital es de 5.5 días, con una desviación estándar de 1.8 días. Si se supone que la duración de la internación se distribuye normalmente, encuentre la probabilidad de que un paciente seleccionado al azar de dicho grupo tenga una duración de internación: a.- De más de 6 días b.- Entre 4 y 7 días. c.- De menos de 3 días. 7. El nivel de colesterol en los trabajadores administrativos tiene distribución normal. Por otro lado se sabe que el 5% superior de los trabajadores su colesterol está por encima de 280 y que el 10% inferior de los trabajadores su colesterol está por debajo de 170. Se pide determinar los valores de la media y varianza de la distribución normal. Si de esta población seleccionamos un trabajador al azar, cuál es la probabilidad de que su colesterol sea mayor a 250.
16
Guía De Seminarios de Bioestadística
SEMINARIO Nº 7 1. Coloque V ó F dentro de cada paréntesis, según considere que el enunciado respectivo es verdadero o falso. Justificar la respuesta que usted considere que es falsa. ( ) El error estándar permite cuantificar tanto errores muestrales como los no muestrales. ( ) El marco de muestreo permite identificar los elementos o unidades de análisis de la población que es objeto de estudio. ( ) Una muestra es representativa si posee todas las características que le corresponden a la población que es objeto de estudio. ( ) La precisión de la estimación de una muestra sistemática será parecida al de una muestra aleatoria simple si la población está ordenada en forma aleatoria. ( ) La premisa fundamental de un muestreo aleatorio simple es que la probabilidad de selección que tiene cada elemento de la población es la misma para integrar la muestra.y esta probabilidad es N/n. ( ) A veces con una muestra no probabilística podemos calcular el error estándar que permita hacer las inferencias respectivas. ( ) La exactitud de una medición es buena si tiene una buena precisión y ausencia de sesgo. ( ) El interés de un investigador es de determinar la prevalencia de desnutrición en edad escolar de la comunidad "Canto Grande" durante el Mes de Julio de 2008. Por motivo de limitación de presupuesto se recurre a una muestra. Para ejecutar el estudio, se decide considerar como muestra representativa a escolares elegidos de los colegios de dicha comunidad. ( ) El tamaño de muestra n tiene una relación directa con el error absoluto de la estimación y una relación inversa con la variabilidad interna de la población. ( ) Error relativo del estimador de la proporción de la población es Er = P/E*100 (E indica el error absoluto) ( ) Se tiene que en una población de 900 habitantes se tiene interés en conocer la hemoglobina promedio. El estudio se quiere realizar mediante una muestra y se determina que el tamaño es de 88, si se tiene una varianza de 25; promedio de 13; grado de confianza del 95% y un error relativo del 8%. 2. Si la población de estudio es grande y está compuesta por elementos heterogéneos, usted: a. ( ) No tomaría muestra. b. ( ) Tomaría una muestra sistemática. c. ( ) Agruparía los elementos parecidos y de cada grupo seleccionaría una muestra. d. ( ) Tomaría una muestra aleatoria simple. e. ( ) Ninguna de las anteriores 3. En la comunidad “PROGRESO”, la población de señoritas de 20 a 40 años de edad es de 6000 y se tiene interés en conocer el nivel de colesterol promedio y la proporción de señoritas que están obesas. Para tal efecto, se realiza un estudio preliminar y se encuentra los siguientes resultados: _ Colesterol: x= 100 y s= 25 Obesidad : p=0.11. Con estos resultados preliminares se pide: a. Calcular el tamaño de muestra para estimar el nivel de colesterol promedio considerando un grado de confianza del 95% y un error relativo del 8%. b. Calcular el tamaño de muestra para estimar la proporción de señoritas que son obesas teniendo en cuenta un grado de confianza del 95% y un error absoluto del 5%.
17
Guía De Seminarios de Bioestadística
4. La enfermera delegada está interesada en realizar un estudio sobre el estado de la nutrición en niños de 5 años de edad de la comunidad San Pedro. La población está constituida por 900 niños de 5 años de edad. La delegada está interesada en particular en conocer la proporción de niños de 5 años que están desnutridos y la estatura promedio. Para tal efecto, realiza un estudio piloto y obtiene que : -
El 35% están desnutridos; y Además se ha determinado con respecto a la estatura: _ x = 120 cm s = 20 cm Se pide: a. Calcular el tamaño de muestra para estimar la proporción de niños de 5 años de edad que están desnutridos, considerando un grado de confianza del 95% y un error absoluto de E=0.05. Además con el tamaño determinado, seleccione una muestra sistemática de las 10 primeras unidades. b. Calcular un tamaño de muestra para estimar la talla promedio de los niños de 5 años de edad, considerando un grado de confianza del 95% y un error relativo del 8%. Seleccione una muestra aleatoria del tamaño calculado considerando F=6 y C=21.
5. Un Médico con especialidad en epidemiología está interesado en conocer la proporción de escolares que tienen parásitos en el colegio "Guadalupe" que está constituido por 3000 estudiantes. Dicho estudio quiere realizarlo mediante una muestra. Se pide calcular el tamaño de muestra considerando: nivel de confianza del 95%, error absoluto del 5% y de acuerdo a un estudio preliminar se determinó de que la proporción de escolares con parásitos es de 0.35 6. Se desea estimar el tiempo medio de sangría en fumadores de más de 20 cigarrillos diarios, con edades comprendidas entre 35 y 40 años, con una precisión de 5 segundos. Ante la ausencia de cualquier información acerca de la variabilidad del tiempo de sangría es este tipo de individuos, se tomó una muestra preliminar de 5 individuos, en los que se obtuvieron los siguientes tiempos (en segundos): 97, 80, 67, 91, 73. Determinar el tamaño mínimo de muestra, al 95%, para cumplir el objetivo anterior 7. Un investigador está interesado en estimar la proporción de muertes debidas a cáncer de estómago en relación con el número de defunciones por cualquier tipo de neoplasia. Su experiencia le indica que sería sorprendente que tal proporción supere el valor de 1/3. ¿Qué tamaño de muestra debe tomar para estimar la anterior proporción, con una confianza del 95%, para que el valor estimado no difiera del valor real en más de 0,03?
18
Guía De Seminarios de Bioestadística
SEMINARIO Nº 8 1. A continuación se da una serie de proposiciones para que determine si es verdadera lo denota por V y si es falsa se denota por F y en caso de ser falsa la proposición justificar su respuesta. ( )
La Inferencia Estadística permite describir los resultados obtenidos en una muestra.
( )
Por lo general, el investigador no tiene control sobre el nivel de significación o probabilidad de cometer el error tipo I ().
( )
Si incrementamos el tamaño de muestra, automáticamente disminuyen las probabilidades de cometer el error tipo I y tipo II.
( )
Un investigador pretende estudiar que la eficacia de la droga B es mejor que la droga A, por consiguiente, las hipótesis estadísticas que corresponden a la prueba de hipótesis es: Ho : A-B0 Ha : A-B >0
( )
( )
El intervalo de confianza del 95% que le corresponde a la media u de una población, teniendo en cuenta los resultados de: _ X = 60, S=6 y n=36, es [57, 63] Dos grupos de estudio son comparables si los tamaños de grupos son iguales.
( )
De una hipótesis estadística podemos deducir una hipótesis científica.
( ) ( )
=4ß Si la probabilidad de cometer el error tipo I es p=0.005, entonces la decisión será no rechazar Ho .
2. En los trabajadores administrativos de la Universidad Particular San Martín de Porras estamos interesados en conocer el colesterol promedio y la proporción de obesos. Para tal efecto, se recurre a una muestra de 81 trabajadores y se obtienen los siguientes resultados: _ X=250 , s=30 y a=10 obesos. Se pide estimar por intervalo con un grado de confianza del 95% el colesterol promedio y la proporción de obesos en los trabajadores administrativos de la UPCH. 3. Una encuesta efectuada a una muestra aleatoria de 150 familias en cierta comunidad urbana revelo que, en el 87 por ciento de los casos, por lo menos uno de los miembros de la familia tenía alguna forma de seguro relacionado con la salud. Construir los intervalos de confianza del 99 por ciento para P, la proporción real de familias en la comunidad con las características de interés. 4. Una muestra de 100 hombres adultos aparentemente sanos,de 25 años de edad, muestra una presión sistólica sanguínea media de 125. Si se supone que la desviación estándar de la población es de 15, calcular el intervalo de confianza del 90 por ciento para . 5. En una determinada región se tomó una muestra aleatoria de 125 individuos, de los cuales 12 padecían afecciones pulmonares. a. Estímese la proporción de afecciones pulmonares en dicha región. b. Si queremos estimar dicha proporción con un error máximo del 4%, para una confianza del 95%, ¿qué tamaño de muestra debemos tomar?
19
Guía De Seminarios de Bioestadística
6. La cantidad mínima requerida para que un anestésico surta efecto en una intervención quirúrgica fue por término medio de 50 mg, con una desviación típica de 10,2 mg, en una muestra de 60 pacientes. Obtener un intervalo de confianza para la media al 95%, suponiendo que la muestra fue extraída mediante muestreo aleatorio simple sobre una población normal.
20
Guía De Seminarios de Bioestadística
SEMINARIO Nº 9 1. ¿Es posible concluir que los niños crónicamente enfermos tienden, en promedio a tener menos confianza en sí mismos que los niños sanos? Se aplicó una prueba diseñada parta estimar la confianza en sí mismos a 13niños crónicamente enfermos y a 21 niños sanos. Las calificaciones medias y desviaciones estándar fueron los siguientes: _ x s Niños enfermos 22.5 4.1 Niños Sanos 26.9 3.2 Sea =0.05 2. Para probar el efecto del alcohol en aumentar el tiempo de reacción para responder a un estimulo dado, se midieron los tiempos de reacción de siete personas. Después de consumir tres onzas de alcohol de 40º, se midió nuevamente el tiempo de reacción para cada una de las sietes personas. ¿Indican los siguientes datos que el tiempo medio de reacción después de consumir el alcohol fue mayor que el tiempo medio de reacción antes de consumir el alcohol? =0.05 Antes Persona (Tiempo en seg.) 1 4 2 5 3 5 4 4 5 3 6 6 7 2
Después (Tiempo en seg.) 7 8 3 5 4 5 5
3. Una enfermera está interesada en comparar dos dietas en el incremento del peso en un grupo 16 pacientes de una determinada patología. Estos pacientes son divididos es dos grupos y a cada uno se le asigna al azar a una determinada dieta. Se obtienen los siguientes resultados: _ Dietas X s² n Dieta A 5 4 8 Dieta B 3 2.25 8 ¿La diferencia observada entre los incrementos promedio de peso bajo cada una de las dietas es estadísticamente significativa? 4. En un pequeño ensayo clínico para valorar un nuevo tranquilizante en pacientes psico- neuróticos se administró a cada paciente un tratamiento con este fármaco durante una semana y un tratamiento con placebo durante otra semana. El orden en que se administraron ambos tratamientos se determinó al azar. Al final de cada semana, cada paciente llevó un cuestionario, en base al cual se asignó al paciente una " puntuación de ansiedad" ( que comprendía valores entre 0 y 30), cuyos valores elevados correspondían a estados de ansiedad. Los resultados se muestran en la siguiente tabla: Escala de ansiedad Paciente Fármaco Placebo 1. 19 22 2. 11 18 3. 14 17 4. 17 19 5. 23 22 6. 11 12 7. 15 14 8. 19 11 9. 11 19 10. 8 7 ¿ En base a esta información, se podría concluir que el nuevo tranquilizante reduce el estado de ansiedad a pacientes psico- neuróticos?
21
Guía De Seminarios de Bioestadística
5. Se ensayaron dos tratamientos antirreumáticos administrados al azar, sobre dos grupos de 10 pacientes, con referencia a una escala convencional (a mayor puntuación, mayor eficacia), valorada después del tratamiento. Los resultados fueron: Nivel de eficacia del tratamiento Tratamiento primero
12 15 21 17 38 42 10 23 35 28
Tratamiento segundo 21 18 25 14 52 65 40 43 35 42 Decidir si existe diferencia entre los tratamientos. 6. Una profesional de salud está interesado en implementar un programa educativo para incrementar conocimientos en las madres sobre los cuidados del niño cuando se presenta una crisis asmática. Para tal efecto, se selecciona una muestra de 10 madres de familia y son evaluadas antes y después de haber aplicado el programa educativo. Los resultados se presentan a continuación: Madre Antes Después 1. 11 15 2. 08 14 3. 13 16 4. 07 17 5. 15 15 6. 09 13 7. 11 14 8. 13 12 9. 12 16 10. 11 18 Con los resultados obtenidos se podría concluir sobre la efectividad del programa que se ha implementado.
22
Guía De Seminarios de Bioestadística
SEMINARIO Nº 10 1.
Un profesional de salud pública está interesada en comparar la proporción de niños desnutridos en dos comunidades urbano marginales, de los cuales una de ellas cuenta con servicios básicos de agua y desague. Para tal efecto, realiza un estudio y se obtienen los siguientes resultados:
Proporción de desnutridos
Comunidad A
Comunidad B
(Cuenta con servicios de Agua y desague)
(No cuenta con servicios básicos)
n1= 51
n2=51
p1 = 0.30
p2= 0.55
En base a esta información obtenida, se podría concluir que: ¿ la diferencia observada entre la proporciones de desnutridos de ambas comunidades es estadísticamente significativa ? En el transcurso de un ensayo clínico, 184 personas recibieron el medicamento usual y 103 personas recibieron un nuevo medicamento. Con el medicamento usual se observaron 129 curaciones y con el nuevo medicamento 80. ¿Existe diferencia significativa entre las proporciones de las poblaciones, a un nivel de significación del 5% ? Responder las preguntas del 2 al 5 : 2- La hipótesis alterna apropiada es : a- H1 : P1 P2 b- H1 : 1 2 c- H1 : P1 > P2 d- H1 : p1 < p2 e- N.A 3-Mencionar el valor de z tabular: a- 2.57 b- 1.64 c- 1.96 d- 1.67 e- N.A 4-Si Zc = 2.35, la decisión estadística es: a- Rechazar Ho, la diferencia observada es estadísticamente significativa, p<0.05 b- No rechazar Ho, la diferencia observada no es estadísticamente significativa, p>0.05 c- No rechazar H1, la diferencia observada es estadísticamente significativa, p<0.05 d- Rechazar H1, la diferencia observada es estadísticamente significativa, p<0.05 e- Faltan datos 5. En estudio para comparar un nuevo tratamiento para la migraña con el tratamiento habitual, 39 de los 50 individuos que recibieron el tratamiento habitual respondieron favorablemente. De los 50 individuos que recibieron el nuevo tratamiento, 45 respondieron satisfactoriamente. ¿ Proporcionan estos datos evidencia suficiente para afirmar que el nuevo tratamiento es más efectivo que el habitual? 6. Se tiene interés en comparar la efectividad en la cura de una ETS de un nuevo medicamento (A) con respecto al tradicional (B). Para tal efecto se realiza un ensayo clínico y se obtiene los siguientes resultados:
23
Guía De Seminarios de Bioestadística
Medicamento A (Nuevo)
B (Tradicional)
Tamaño de muestra
n1= 81
n2=81
Proporción de cura De la ETS
p1=0.87
p2=0.70
Con la información que se dispone se podría concluir con respecto a la cura ETS que el medicamento A es mejor que el B
24
Guía De Seminarios de Bioestadística
SEMINARIO Nº 11: Independencia de criterios y homogeneidad de poblaciones PRUEBA DE INDEPENDENCIA 1. Quinientos empleados de una empresa que fabrica cierto producto, sospechoso de estar asociado con alteraciones respiratorias, se clasificaron en forma cruzada con base de grado de exposición al producto y si tenían o no los síntomas de tales alteraciones respiratorias. Los resultados se muestran en la siguiente tabla Nivel de Exposición Síntomas presentes Alto Limitado Sin exposición conocida Total Si 185 33 17 235 No 120 73 72 265 Total 305 106 89 500 ¿Proporcionan estos datos la evidencia suficiente para indicar que, en un nivel de significación de 0.05, existe una relación entre el grado de exposición y la presencia de los síntomas de las alteraciones respiratorias? 2. A un grupo de 350 adultos que participaron en una encuesta de salud, se les preguntó si llevaban a no una dieta. Las respuestas (por sexos) son las siguientes Sexo Masculino Femenino Total A dieta 14 25 39 Sin dieta 159 152 311 Total 173 177 350 ¿Sugieren estos datos que al estar a dieta depende del sexo? Sea = 0.05.
3. Una muestra de 500 estudiantes de bachillerato participó en un estudio diseñado con el fin de evaluar el nivel de sus conocimientos respecto a un cierto grupo de enfermedades comunes. La tabla siguiente presenta la clasificación de los estudiantes de acuerdo con su principal campo de estudio y el nivel de conocimientos sobre el grupo de enfermedades Conocimiento de las enfermedades Área de estudio Bueno Malo Total Medicina 31 91 122 Otra 19 359 378 Total 50 450 500 ¿Sugieren estos datos que existe una relación entre el conocimiento del grupo de enfermedades y el principal campo de estudio de los estudiantes de bachillerato de los cuales se extrajo la muestra 4. En una encuesta, los niños menores de 15 años de edad que viven en la zona central de una gran ciudad fueron clasificados de acuerdo con el grupo étnico al que pertenecen y su novel de hemoglobina. Los resultados fueron los siguientes: Concentración de hemoglobina (g/100ml) Grupo étnico 10.0 o mayor 9.0-9.9 < 9.0 Total A 80 100 20 200 B 99 190 96 385 C 70 30 10 110 Total 249 320 126 695 Con un nivel de significación de 0.05, ¿ proporcionan estos datos la evidencia suficiente para concluir que las dos variables están relacionadas?
25
Guía De Seminarios de Bioestadística
5. El interés es evaluar la asociación entre el diagnóstico nutricional y el sexo en niños de 12 meses de edad o más. DIAGNOSTICO SEXO NUTRICIONAL MASCULINO FEMENINO TOTAL -----------------------------------------------------------------------------------------------NORMAL 21 42 63 MALNUTRIDO 57 55 112 -----------------------------------------------------------------------------------------------TOTAL 78 97 175 ¿Existe relación entre ambas variables? PRUEBA DE HOMOGENEIDAD 1. En un estudio acerca de la contaminación atmosférica a realizado en dos comunidades, se seleccionó una muestra aleatoria de 200 familias de cada una de dichas comunidades. Se le preguntó a uno de los miembros de cada familia si algún miembro de la misma se sentía afectado por la contaminación atmosférica. Las respuestas son las siguientes: ¿ Algún miembro de la familia ha sido afectado por la contaminación? Si No Total I 43 157 200 II 81 119 200 Total 124 276 400 ¿Pueden concluir los investigadores que las dos comunidades difieren con respecto a la variable de interés? Sea = 0.05 Comunidad
2. En una muestra aleatoria simple de 250 trabajadores industriales con cáncer, losa investigadores encontraron que 102 de ellos habían trabajado en puestos clasificados como “altamente expuestos” a agentes causantes de cáncer,. Del resto, 84 habían trabajado en puestos “de mediana exposición” y 64 no habían experimentado exposición en sus trabajos. En una muestra aleatoria simple independiente de 250 trabajadores industriales de la misma área que no tenían un diagnóstico de cáncer, 31 trabajaban en puestos “altamente expuestos”, 60 en puestos “medianamente expuestos” y 159 trabajaban en puestos que no involucraban exposición conocida a agentes causantes de cáncer. ¿ es posible deducir a partir de estos datos que las personas que trabajaban en puestos que los exponen a agentes causantes de cáncer poseen un mayor riesgo de contraer dicha enfermedad? Sea = 0.05 3. A cada uno de los varones de una muestra de tamaño 250, extraída de una población que se sospechaba sufría de alguna enfermedad de las articulaciones se les preguntó cuál de tres síntomas lo molestaba mayormente. La misma pregunta se le hizo a una muestra de 300 mujeres que se sospechaba padecían la misma enfermedad. Los resultados fueron los siguientes: ------------------------------------------------------------------------------------Síntoma más molesto Hombres Mujeres -----------------------------------------------------------------------------------Rigidez matutina 111 102 Dolor por la noche 59 73 Hinchazón de las articulaciones 80 125 ------------------------------------------------------------------------------------TOTAL 250 300 -------------------------------------------------------------------------------------Proporcionan estos datos la suficiente evidencia para indicar que las dos poblaciones no son homogéneas con respecto a los síntomas principales?. Sea = 0.05 ¿Cuál es el valor de p para esta prueba?
26
Guía De Seminarios de Bioestadística
SEMINARIO Nº 12: ANÁLISIS DE VARIANZA 1. A continuación se presentan una serie de proposiciones de las cuales tiene que identificar si es Verdadero (V) ó Falso (F). Si la proposición es falsa justificar su respuesta. 1.1 ( ) El símbolo µi representa la media de la población i. 1.2 ( ) En un ANOVA donde se comparan 4 tratamientos compuestos cada uno de 8 observaciones, se tiene 3 grados de libertad entre grupos. 1.3 ( ) En un ANOVA donde se comparan 4 tratamientos compuestos cada uno de 8 observaciones, se tiene 32 grados de libertad dentro de grupos. 1.4 ( ) Queremos comparar niveles de glucosa en la sangre (mmol/L) en hombres y mujeres taxistas. La variable dependiente en el análisis es el sexo del taxista. 1.5 ( ) Queremos comparar niveles de glucosa en la sangre (mmol/L) en hombres y mujeres taxistas. La variable independiente en el análisis es el nivel de glucosa. 1.6 ( ) La hipótesis alterna en un ANOVA es H1: Las medias aritméticas son diferentes 2. Completar la siguiente tabla ANOVA y establecer qué diseño se empleó. Fuente SC g.l CM R.V. Tratamientos 154.9199 4 .Error Total 200.4773 39
P
3. Considerar la siguiente tabla ANOVA Fuente Tratamientos Error
SC 5,05835 65,42090
g.l. 2 27
CM 2.52917 2.4230
R.V. 1.0438
a)¿ Qué diseño utilizó? b)¿ Cuántos tratamientos se compararon? c)¿ Cuantas observaciones se analizaron? d)¿ Con un nivel de significación de 0.05.¿ es posible concluir que existe diferencia entre tratamientos? ¿Porqué? 4. Los efectos de tres drogas con respecto al tiempo de reacción a cierto estímulo fueron estudiados en 4 grupos de animales experimentales. El grupo IV sirvió de grupo control, mientras que a los grupos I, II y III les fueron aplicadas las drogas A, B y C respectivamente, con anterioridad a la aplicación del estímulo:
A
B
C
Control
17
8
3
2
20
7
5
5
40
9
2
4
31
8
9
3
35
¿Puede afirmarse que los tres grupos difieren en cuanto al tiempo de reacción?
27
Guía De Seminarios de Bioestadística
5. Considerando el siguiente cuadro de ANOVA Fuente
g.l
SC
CM
F
Tratamientos
4
131.19
32.80
2.56
Error
708
9060.48
12.80
a)
¿Cuántos tratamientos se compararon?
b)
¿Cuántas observaciones se analizaron?
c)
¿Es posible concluir que existe diferencia entre los tratamientos? ¿Por qué?
28
Guía De Seminarios de Bioestadística
SEMINARIO Nº 13: ANÁLISIS DE REGRESIÓN Y CORRELACION
1.-El editor en jefe de un importante periódico metropolitano ha intentado convencer al dueño del periódico para que mejore las condiciones de trabajo en el taller de prensas. Está convencido de que, cuando trabajan las prensas, el grado de ruido crea niveles no saludables de tensión y ansiedad. Recientemente hizo que un psicólogo realizara una prueba durante la cual los prensistas se situaron en cuartos con niveles variables de ruido y luego se le hizo otra prueba para medir niveles de humor y ansiedad. La siguiente tabla muestra el índice de su grado de ansiedad o nerviosismo y el nivel de ruido al que se vieron expuestos. (1,0 es bajo y 10,0 es alto). Nivel de ruido Grado de ansiedad
4 39
3 38
1 16
2 18
6 41
7 45
2 25
3 38
a) Represente gráficamente estos datos. b) Desarrolle una ecuación de estimación que describa los datos. c) Pronostique el grado de ansiedad que podríamos esperar cuando el nivel de ruido es 5. d) Calcule e interprete el coeficiente de correlación e) Calcule e interprete el coeficiente de determinación f) Calcule el error estándar de la estimación 2.-
El Gerente de una Clínica dispone de la siguiente información: Año Cirugías
2001 120
2002 143
2003 150
2004 170
2005 162
2006 158
a) Grafique y determine la ecuación de la tendencia. b) Proyecte las cirugías al corazón para el año 2007 3.- Se ha medido la variación de creatinina en pacientes tratados con Captopril (droga antihipertensión) tras la suspensión del tratamiento con diálisis, resultando la siguiente tabla: Días tras la diálisis: X 1 Creatinina (mg/dl): Y
5
10
15
20
25 35
5.7 5.2 4.8 4.5 4.2 4
3.8
a.- Calcule el modelo de regresión lineal b.- Interprete la variación de creatinina, en función de los días transcurridos tras la diálisis. c.- Si un individuo presenta 8 días tras la suspensión del tratamiento con diálisis, que sucede con la creatinina (mg/dl).
29
Guía De Seminarios de Bioestadística
4.- Se efectúa un experimento médico para determinar el efecto de la droga efedrina en las pulsaciones del corazón. Un paciente recibe diversas dosis diarias de la droga d urante seis días. La tabla que sigue resume los resultados del experimento. Dosis diaria total de efedrina (granos) 3 2 1 3 5 4
Nº de pulsaciones por minuto 70 60 50 80 100 90
Nota. 1 grano = 0.06 gramos a. Grafique un diagrama de dispersión b. Determine la ecuación de regresión lineal. Interprete los coeficientes de regresión lineal. Grafique sobre el diagrama de dispersión, la línea de regresión. c. Estímese el número de pulsaciones para una dosis diaria de 4 granos de efedrina. d. Calcule el error estándar de la estimación del modelo e. Calcule e interprete el coeficiente de correlación. f. Calcule e interprete el coeficiente de determinación 12.- La siguiente tabla ilustra los valores del consumo de metil mercurio y la cantidad total de mercurio en la sangre de 12 individuos expuestos a la primera sustancia por haber consumido peces contaminados. Consumo de metil mercurio (µgHg/día) 180 200 230 410 600 550 275 580 105 250 460 650
Mercurio en la sangre ( ng/g ) 90 120 125 290 310 290 170 375 70 105 205 480
a) Calcule el coeficiente de correlación lineal. b) Estimar la ecuación regresión lineal de la cantidad de mercurio en la sangre sobre el consumo de metil mercurio
30
Guía De Seminarios de Bioestadística
SEMINARIO Nº 14: PRUEBAS NO PARAMETRICAS WILCOXON 1.- A un grupo de 20 pacientes que asistían a una clínica fisioterapia se les sometió a una determinada prueba, diseñada para medir su nivel de motivación, antes de que participaran en un programa experimental de remotivación. Al término del programa, los pacientes fueron sometidos a una prueba. Las calificaciones antes y después son las siguientes: CALIFICACIÓN CALIFICACION Paciente Antes Después Paciente Antes Después -------------------------------------------------------------------------------------1 10 15 11 16 21 2 8 10 12 10 23 3 5 10 13 15 25 4 14 14 14 5 15 5 15 25 15 24 20 6 22 20 16 20 25 7 17 20 17 14 24 8 10 22 18 10 23 9 8 16 19 15 25 10 20 18 20 14 25 -----------------------------------------------------------------------------------Una calificación alta indica un nivel alto de motivación. ¿Qué se puede concluir de estos datos? Sea = 0.05. Determinar el valor P 2.- Una muestra de 15 pacientes que padece de asma participó en un experimento para estudiar los efectos de un nuevo tratamiento sobre la función pulmonar. Una de las mediciones que se registraron fue la de volumen espiratorio forzado (litros) en 1 segundo(VEF) antes y después de la aplicación del tratamiento. Los resultados son los siguientes: INDIVIDUO ANTES DESPUÉS INDIVIDUO ANTES DESPUÉS -----------------------------------------------------------------------------------------------------------1 1.69 1.69 9 2.58 2.44 2 2.77 2.22 10 1.84 4.17 3 1.00 3.07 11 1.89 2.42 4 1.66 3.35 12 1.91 2.94 5 3.00 3.00 13 1.75 3.04 6 0.85 2.74 14 2.46 4.62 7 1.42 3.61 15 2.35 4.42 8 2.82 5.14 ------------------------------------------------------------------------------------------------------¿Es posible concluir, con base en estos datos, que el tratamiento incrementa de manera efectiva el nivel del VEF?. Sea = 0.05. Determinar el valor P
3. A 11 ratas tratadas crónicamente con alcohol se les midió la presión sanguínea sistólica antes y después de 30 minutos de administrarles a todas ellas una cantidad fija de etanol, obteniéndose los datos siguientes:
Antes Después
Presión sanguínea sistólica 126 120 124 122 130 129 114 116 119 112 118 119 116 117 122 127 122 110 120 112 110 111
¿Hay un descenso significativo de la presión sanguínea sistólica tras la ingestión de etanol?
31
Guía De Seminarios de Bioestadística
U DE MANN WITHNEY 1.- En un experimento diseñado para estimar los efectos de la inhalación prolongada de óxido de cadmio, 15 animales similares sirvieron de sujetos para el experimento, mientras que 19 animales similares sirvieron de controles. La variable de interés fue la concentración de hemoglobina después del experimento. Los resultados se muestran en la tabla. Se desea saber si es posible concluir que la inhalación prolongada de óxido de cadmio disminuye el nivel de hemoglobina. Sea = 0.05. Determinar el valor P Concentraciones de hemoglobina (gramos) de 25 animales de laboratorio Animales expuestos ( X ) Animales no expuestos ( Y ) ---------------------------------------------------------------------------------------------14.4 17.4 14.2 16.2 13.8 17.1 16.5 17.5 14.1 15.0 16.6 16.0 15.9 16.9 15.6 15.0 14.1 16.3 15.3 16.8 15.7 16.7 13.7 15.3 14.0 -------------------------------------------------------------------------------------------2.- Los siguientes son los valores de respuesta del sistema de inmunización de personas que recibieron una dosis de refuerzo de uno de dos tipo de vacunas contra la rabia. TIPO 1 (X) 1.25 5.30 1.70 1.00 8.50 3.75 8.10 2.25 5.60 7.85 TIPO2 (Y) 0.57 3.90 8.20 1.20 1.70 1.00 4.55 5.20 2.16 1.90 ¿ Es posible concluir, con base en estos datos, que los dos tipos de vacuna difieren en cuanto a sus efectos?. Sea = 0.05.
3.- Los siguientes valores son los tiempos (en minutos) de permanencia en la sala de operaciones de 20 personas sometidas al mismo procedimiento quirúrgico. Once de las personas fueron pacientes del hospital A y nueve lo fueron del hospital B: Hospital A: 35 30 Hospital B: 45 38
33 42
39 50
41 48
29 51
30 32
36 37
45 46
40
31
Con base en estos datos. ¿Es posible concluir que, para el mismo procedimiento quirúrgico, los pacientes del hospital B tienden a permanecer más tiempo en la sala de operaciones que los pacientes del hospital A?. Sea = 0.05. 4. Se ensayaron dos tratamientos antirreumáticos administrados al azar, sobre dos grupos de 10 pacientes, con referencia a una escala convencional (a mayor puntuación, mayor eficacia), valorada después del tratamiento. Los resultados fueron: Tratamiento primero Tratamiento segundo
Nivel de eficacia del tratamiento 12 15 21 17 38 42 10 23 35 28 21 18 25 14 52 65 40 43 35 42
Decidir si existe diferencia entre los tratamientos.
32
Guía De Seminarios de Bioestadística