Estadística y conocimiento
El proyecto emprendido por Fundación Polar “Gestión de la información en salud para atención infantil” tuvo como meta contribuir a desarrollar en los centros públicos venezolanos de salud las metodologías que permitirán la recolección, análisis e interpretación de la información epidemiológica. Posteriormente, se prevé diseñar e instrumentar un programa de capacitación para alumnos de las escuelas de medicina nacionales en estrategia de Atención Integrada a las Enfermedades Prevalentes de la Infancia -AIEPI-. Fotografía: Carlos Rivodó
Estos fascículos están disponibles en línea, visitando la página web: http://www.fpolar.org.ve/matematica2
Estadística y conocimiento lniciamos este fascículo con una opinion del estadístico venezolano Pedro Manuel Ruiz (1868-1921), en la que se afirma que la estadística es una forma de obtener conocimiento y cualquier análisis actual del sorprendente desarrollo científico logrado en el siglo XX podría demostrar lo acertado de tal afirmación. La estadística se ha convertido en una disciplina formidable que ha colaborado con la mayor parte de las ciencias, las tecnologías y las humanidades en la produccion de nuevo conocimiento sobre el mundo en que vivimos. Con el concurso de la estadística se ha logrado: Analizar la conducta de consumidores y productores en los diferentes mercados.
Diseñar sistemas eficientes de distribución y de inventarios de empresas y comercios.
Comprender los procesos de enseñanza y aprendizaje.
Diseñar sistemas eficientes de seguridad social.
Establecer causas de enfermedades y el descubrimiento de la mejor forma de tratarlas y prevenirlas.
Analizar sistemas sociales y formular políticas de asistencia social.
Este recuento de algunos aportes al conocimiento de nuestro mundo social, biológico, político, económico y cultural, logrado con la ayuda de la estadística, es reconocido en afirmaciones coincidentes con la de Pedro Manuel Ruiz.
Mejorar la calidad de gestión de las organizaciones productoras de bienes y servicios.
Pedro Manuel Ruiz fue un organizador de las estadísticas en Venezuela. Nombrado por el presidente Cipriano Castro director de Estadística en el Despacho de Fomento (11/11/1904), se encargó de renovar y perfeccionar el cuerpo documental de la estadística venezolana. Puso al día el Servicio Demográfico Nacional, restableció la publicación del Anuario Estadístico (1905-1912), dirigió la publicación del Boletín de Estadística (mensual), así como la de un trabajo sobre pesos y medidas utilizados en el país y editó el primer estudio de Demografía Venezolana en 1907. Fuente: Diccionario de Historia de Venezuela. Fundación Polar, 1998.
146
Fundación Polar • Últimas Noticias • El mundo de la matemática • Estadística • 19
Pedro Manuel Ruiz Fuente: El Cojo Ilustrado Nº 519 01/08/1913.
La estadística se ocupa de la caracterización y aplicación de técnicas para:
Diseñar una investigación, bien sea un experimento comparativo, una encuesta por muestreo, un estudio observacional, o de construcción de un modelo estadístico.
Resumir los datos de la investigación.
Inferir sobre la población bajo estudio, a partir de los datos de la investigación.
A
¿Qué es un experimento comparativo? Es una investigación cuya finalidad es comparar los efectos de dos o más estímulos (tratamientos A y B) aplicados a ciertos entes (unidades de experimentación e1, e2, e3 y e4). Para ello se efectúan mediciones sobre los efectos de ambos tratamientos obteniéndose los resultados (Y1A, Y2B,Y3B y Y4A).
e1
e2
e3
Y2B
Y3B
e1
Y4A
e5
e2 e4 e1
e6
e3 e4
Muestra
Medición Y1 Condición A
e1 Es una investigación comparativa sin la asignación aleatoria que se hace en los experimentos (o investigación de muestreo no probabilístico), cuya finalidad es también comparar los efectos que dos o más condiciones (A y B) tienen sobre los entes observados (e1, e2, e3 y e4). Esto se lleva a cabo con extremado cuidado y control.
e4
Población
¿Qué es una encuesta por muestro?
¿Qué es un estudio observacional?
B
Medición Y1A
Es una investigación que tiene por objetivo la descripción de ciertas características (e1, e2, e3,...,e6) de una población, mediante el examen de una parte de ella (muestra e1, e4). La medición de una característica en los elementos de la muestra produce resultados (Y1 y Y4). Si el muestreo es probabilístico, todos los elementos de la población tienen una probabilidad no nula de formar parte de la muestra.
Tratamiento
e2
Y4 Condición B
e3
e2
e4 Medición
Y2A
¿Qué es un estudio de construcción de un modelo estadístico?
e4
Y4B
Observación de una variable aleatoria
Es una investigación para identificar un modelo que represente un aspecto de la realidad, estimar sus parámetros y validar su ajuste a la realidad. Construcción de un modelo que puede conducir a la determinación de una función real y = f(x1,...,xn)+e
Fundación Polar • Últimas Noticias • El mundo de la matemática • Estadística • 19
147
Experimentos comparativos En 1954 se llevó a cabo en los Estados Unidos de América el experimento médico más grande y quizás más costoso de la ciencia moderna. Participaron más de un millón de niños a un costo de más de 5 millones de dólares de la época. El experimento se realizó para establecer la efectividad de la vacuna Salk contra la poliomielitis. La investigación dividió aleatoriamente en dos al grupo de sujetos participantes en el experimento, uno denominado grupo control que fue inoculado con una solución salina inocua (placebo) y otro, denominado grupo experimental, que recibió la vacuna Salk. El estudio fue doble ciego en el sentido que ni los sujetos de experimentación sabían si estaban recibiendo la vacuna activa o el placebo, ni tampoco los médicos sabían si estaban aplicando uno u otro tratamiento. Como resultado de este gran experimento, se logró demostrar que la tasa de casos de poliomielitis por cada 100 000 personas vacunadas fue la mitad de la tasa registrada para los que recibieron el placebo. Tal diferencia resultó estadística y médicamente significativa y, en consecuencia, se adoptó como una medida de salud pública la vacunación regular y masiva de la población infantil contra la poliomielitis.
Interesante: La vacuna oral contra la polio se administra, en la mayoría de los países, mediante una dosis de dos gotas. Durante la campaña de erradicación de la polio, llevada a cabo por la Organización Mundial de la Salud (OMS) con el apoyo de instituciones públicas y privadas, se aprovechó para administrar también vitamina A en 42 países. Según un estudio la medida ha evitado 1 238 000 muertes desde 1998.
Encuestas por muestreo Desde el año de 1967 hasta el presente, la oficina de estadística del estado venezolano, que hoy en día se denomina Instituto Nacional de Estadística, viene llevando a cabo semestralmente una encuesta por muestreo que estudia el mercado laboral venezolano. Esta investigación se conoce por el nombre de Encuesta de Hogares por Muestreo. El diseño de la encuesta considera tres etapas de selección. Cabe destacar que esta muestra permite no sólo obtener estimaciones anuales de tasas y porcentajes de la fuerza de trabajo y su composición al nivel nacional, sino también estimaciones mensuales, trimestrales y semestrales al nivel estadal, con precisión adecuada.
Fuente: Instituto Nacional de Estadística. Así va el Censo (2001). www.ine.gov.ve
148
Fundación Polar • Últimas Noticias • El mundo de la matemática • Estadística • 19
Jonas Salk médico norteamericano (1914 - 1995)
Fumador http://www.fluxfactory.org/otr/images/big/smoker.jpg
Estudios observacionales La estadística y los estadísticos jugaron un papel muy importante en el descubrimiento de la relación existente entre el hábito de fumar y la aparición de ciertos tipos de cáncer y de serias enfermedades cardiovasculares. Aunque muchos médicos sospechaban de esta conexión, su confirmación definitiva tuvo que esperar por la aparición de numerosos estudios retrospectivos y prospectivos sobre el particular, que se llevaron a cabo a partir de 1939. En un estudio retrospectivo para establecer una relación entre el hábito de fumar y el cáncer pulmonar, las personas con este padecimiento se investigan en relación a sus hábitos de fumar y paralelamente se estudia otro grupo con personas sin la enfermedad, de la misma edad, sexo y otras características para las que también se comprueban sus hábitos de fumar. Si los fumadores son más numerosos entre los enfermos de cáncer pulmonar que entre los que no padecen la enfermedad, habría razones para creer que los hábitos de fumar estarían asociados con la aparición de la enfermedad. Esta evidencia fue la que se obtuvo una y otra vez de dichos estudios, pero por razones que no viene al caso detallar, se requerían evidencias que controlaran sesgos que los estudios retrospectivos no podían dominar. Las investigaciones que proporcionaron estas evidencias más sólidas fueron los estudios prospectivos. En este tipo de investigación se elige un grupo de fumadores y un grupo de no fumadores de características también semejantes en relación, por ejemplo al sexo, la edad y otras características de interés, y ambos grupos se siguen durante un período de años determinado registrando la aparición de la enfermedad en caso de que esto ocurra. Las investigaciones prospectivas, que se llevaron a cabo desde los años cincuenta del siglo pasado, establecieron consistentemente que la tasa de mortalidad por cáncer al pulmón entre los fumadores era aproximadamente 24 veces mayor que la tasa de mortalidad por la misma causa entre los no fumadores. No solamente eso, también se pudo determinar que entre los fumadores la tasa de mortalidad por problemas de corazón y del sistema circulatorio era aproximadamente 1,5 veces mayor que la tasa de mortalidad entre los no fumadores.
Construcción de modelos estadísticos Muchas especies animales se han extinguido en años recientes y muchas otras enfrentan ese peligro hoy en día. Tal era el caso de la ballenas azules que habitan los mares circundantes de la Antártica. La Comisión Internacional de Pesca de Ballenas, un organismo con autoridad para regular la pesca y aún suspenderla si fuera necesario, patrocinó una investigación estadística que pudiera establecer el tamaño de la población de ballenas azules que se alimentaban en los mares de la Antártica, así como sus tasas de natalidad y de mortalidad para predecir la evolución de esa población. Tal estudio requirió de la elaboración de un modelo probabilístico basado en los datos proporcionados por un muestreo de captura y recaptura de especímenes. Una forma de estimar los individuos de una población animal en libertad, consiste en capturar, marcar y luego soltar a algunos miembros de la población bajo estudio, que eventualmente podrían ser recapturados y contados en oportunidades posteriores. El estudio concluyó que el tamaño de la población de ballenas azules que se alimentaba en los mares de la Antártica era, muy probablemente, de unos pocos miles de ejemplares y que aún podría estar por debajo del millar. Tal alarmante noticia produjo una suspensión inmediata de la pesca de ballenas azules en los océanos y mares por debajo de la línea ecuatorial. Fundación Polar • Últimas Noticias • El mundo de la matemática • Estadística • 19
149
Medición Luego de diseñar una investigación se pasa a la realización de mediciones cuyos resultados serán los datos, los que posteriormente serán resumidos y servirán de base para hacer inferencias. En el cuadro siguiente se presentan resultados de mediciones. Se trata de cuentas de números de nacimientos clasificados por edad de la madre y por el peso del niño al nacer. Nacimientos vivos registrados en Venezuela en 1999, distribuidos por grupos de edad de la madre y peso del niño al nacer (Fuente: Instituto Nacional de Estadística)
Grupo de edad de la madre < 15 años 4 946 15 - 19 110 028 20 - 24 155 032 25 - 29 119 661 30 - 34 78 919 35 - 39 39 991 40 - 44 11 199 45 - 49 1 728 50 y más 462 Ignorado 5 922 Total 527 888
Peso del niño al nacer (kg) ≤ 1,500 3 458 1,501 - 2,500 48 998 2,501 - 4,000 457 521 > 4,000 17 911 527 888
¿Se observa en estos ejemplos algún rasgo común en vista del cual se pueda formular una definición de medición? "...Ia medición es la asignación de números a objetos o sucesos según reglas". En textos de metodología de investigación se pueden encontrar otras definiciones. EI término medición será usado en estos fascículos con el significado que Ie asigna la definición de Stephen Stevens, teniendo en cuenta la advertencia de que: "Ia medición corresponde a las propiedades de los objetos y no a los objetos mismos..." (W. S. Torgerson, Theory and Method of Scaling, J. Wiley, N. York, 1958) Se han ideado muchas modalidades de medición incluyendo la formulación de preguntas o la observación del comportamiento en determinadas situaciones. Por ejemplo, se han planteado preguntas como las siguientes: ¿Cuánta es su afición a ver telenovelas? Poca 1
Mucha 2
3
4
5
EI orden creciente de los dígitos, del 1 al 5, corresponde a la cuantía creciente de "poca" a "mucha". La persona interrogada ha de responder marcando la cuadrícula del dígito que, según su apreciación, expresa la cuantía de su afición a ver telenovelas.
La telenovela brasilera “Roque Santeiro” de 1985, escrita por Dias Gomes y Aguinaldo Silva, y protagonizada por José Wilker y Lima Duarte, ha sido la de mayor audiencia en toda latinoamérica. Solamente en Brasil el 75% de las personas que veían televisión a esa hora tenían sintonizada esta novela.
150
Fundación Polar • Últimas Noticias • El mundo de la matemática • Estadística • 19
La medición puede consistir en un procedimiento complejo, como el que permite obtener la distribución de frecuencias relativas mostradas en el gráfico siguiente:
Distribución de frecuencias de la dirección del viento 35%
Norte
30 25
315º
45º
20 15 10 5
Oeste
Este
O
P 225º
135º Sur 0
5
10 15 20 25 30 35%
A un observatorio meteorológico el viento Ie lIega por múltiples direcciones, que pueden cambiar de unas a otras rápidamente; no obstante, es posible distinguir entre ellas por su duración y, mediante una simplificacion razonable, señalar unas pocas en las que se distribuye la totalidad del tiempo en que lIega viento. Los vértices de la línea poligonal del gráfico corresponden a la llegada del viento en distintas direcciones y sus distancias al origen O corresponden a la duración (en %) de los mismos. Por ejemplo, el punto P del gráfico corresponde a los vientos que llegan con una dirección de 165º y una duración de 20%; los vientos que llegan del Sur tienen una duración del 30% del tiempo durante el cual ha llegado viento al observatorio.
Interesante: Puedes simular la estimación del tamaño de una población animal en libertad empleando metras de un solo color o, en su defecto, granos de alguna leguminosa que tengas en tu casa. Las metras o los granos simulan ejemplares de la población cuyo tamaño quieres estimar. Introduce un número desconocido de metras o de granos en un recipiente que puedas cerrar, por ejemplo, una caja vacía de zapatos, y extraer una muestra de n1 metras o granos, marcarlos y regresarlos a la caja. Extrae luego una segunda muestra de tamaño n2 y cuenta en ella el número de objetos marcados anteriormente. Bajo el supuesto que en la segunda muestra la proporción de los objetos marcados x a los no marcados (n2-x) es la misma que en la población, el tamaño de la población se puede estimar mediante la fórmula:
N=
n1 · n2 x
Fundación Polar • Últimas Noticias • El mundo de la matemática • Estadística • 19
151
Tipos de medición
Male Female Leonard Whitfield Artista norteamericano.
La definición antes presentada es usualmente ampliada, entendiendo que medir es asignar símbolos (que pueden ser palabras) a objetos o sucesos siguiendo reglas establecidas. Es por esto, por ejemplo, que son tratados como datos algunos registros que se hacen en historias médicas. En el cuadro siguiente se anotan unos pocos de éstos y se indican los tipos de medición a los que corresponden. Registro (datos)
Tipo de medición
Nacionalidad, sexo, ocupación y estado civil
Nominal
Nivel de educación
Ordinal
Temperatura
De intervalo
Edad, peso, talla y tensión arterial
De razón Los tipos de medición antes indicados se distinguen por el modo de medir y por los usos admisibles de los datos resultantes. Información al respecto se da en el cuadro siguiente:
Weight of world Robert Ryan Artista norteamericano.
Tipo de medición
Modo de medir
Usos admisibles
Nominal
Asignación de símbolos
Clasificar
Ordinal
Asignación de símbolos
Clasificar Ordenar
De intervalo
Asignación de símbolos numéricos mediante la comparación con una unidad de medición (se fija el cero inicial)
Clasificar Ordenar Obtener diferencias de mediciones
De razón
Asignación de símbolos númericos mediante la comparación con una unidad de medición (se fija el cero inicial)
Clasificar Ordenar Obtener diferencias de mediciones y razones de mediciones
ºC
Antes se indicó que la medición de una temperatura correspondía al tipo de medición de intervalo. El gráfico y el cuadro siguiente permiten apreciar cómo es dicho tipo de medición (con cero convencional, no único) y por qué se distingue del tipo de medición de razón. Se trata de la medición de temperatura de dos objetos A y B, a los que corresponden respectivamente los pares de puntos (C, F) y (C’, F’).
100
212
C’
F’
C
F
Temperatura
Termómetro Objeto A
Objeto B
Centígrado
Longitud segmento (a)
Longitud segmento (b)
Fahrenheit
Longitud segmento (c)
Longitud segmento (d)
(b)
(d) (a) 0 -17,78
Longitud segmento (a) Longitud segmento (b)
≠
Longitud segmento (c) Longitud segmento (d)
Por ejemplo: si en ºC la temperatura de un objeto B (20 ºC) es el doble de la temperatura de A (10 ºC) esta relación no es cierta si se toma 68ºF y 10 ºC 50 ºF). temperaturas en escala ºF (20 ºC
152
ºF
Fundación Polar • Últimas Noticias • El mundo de la matemática • Estadística • 19
(c) 32 0