5 minute read
Diseño y análisis en investigación
ejemplo: 1 de enero de 1900). Los distintos programas almacenan ese tiempo con unidades distintas (días, segundos), lo que es importante conocer cuando vayamos a realizar cálculos de tiempo. Otra cuestión práctica es recordar la importancia de introducir los años con los cuatro dígitos, para evitar que el programa asigne automáticamente el siglo (no es lo mismo 1916 que 2016).
Exportación e importación de datos entre programas
La gestión y análisis de BD requiere a menudo de la utilización de diferentes programas. Si queremos aprovechar los mejores recursos de cada uno de ellos tendremos que recurrir a la importación o exportación de datos.
El proceso más habitual es el diseño e introducción de datos en un gestor de BD y la exportación posterior a un paquete estadístico para su análisis. En ocasiones necesitamos incorporar información que obtenemos de otras fuentes, como códigos diagnósticos, escalas de gravedad, resultados de pruebas complementarias, que se pueden incorporar a nuestra BD por procedimientos de importación.
Cuando elijamos un programa para manejar nuestros datos, tenemos que asegurarnos de que tenga la capacidad para importar y exportar datos. Existen distintos formatos de fichero que son empleados y son aceptados como vehículo de transferencia de información. Los más usados son el formato Excel, los formatos delimitados (CSV) y los ficheros DBF (procedente del programa DBase). Tendremos que exportar nuestros datos con este formato para que otros programas los puedan importar. Algunas versiones de SPSS permiten leer directamente datos de Access.
No pretendemos que la información aquí recogida sea suficiente para aprender a diseñar y depurar BD, ese conocimiento solo podrá ser adquirido con la práctica. Hemos querido recopilar los pasos y factores a tener en cuenta.
Respuestas y comentarios a las preguntas
Comentario a la pregunta 4.1
La respuesta más correcta es la “a”, Nominal dicotómica.
Aunque la presencia/ausencia de leucocituria corresponde a una escala nominal (valores mutuamente excluyentes), podría ser medida también en una escala ordinal (por ejemplo: número de cruces de leucocituria en la tira urinaria) e incluso en una escala continua de razones e intervalos (por ejemplo: recuento medio de leucocitos por campo). A la hora de elegir la forma de recoger la variable, tenemos que juzgar criterios de factibilidad y eficiencia. Cuando la recogida de la opción más precisa sea factible, será la elección preferida. Si el estudio se centra en la determinación de la leucocituria, el esfuerzo de una recogida más precisa merecerá la pena. Si es una variable secundaria, bastaría con una recogida menos precisa.
Comentario a la pregunta 4.2
La respuesta más correcta es la “a”, Nominal dicotómica.
Aunque la presencia/ausencia de hepatomegalia corresponde a una escala nominal (valores mutuamente excluyentes), podría ser medida también en una escala ordinal (por ejemplo: número de traveses de dedo bajo reborde costal) e incluso en una escala continua de razones e intervalos (por ejemplo: dimensiones del hígado medidas mediante ecografía). A la hora de elegir la forma de recoger la variable, tenemos que juzgar criterios de factibilidad y eficiencia. Cuando la recogida de la opción más precisa sea factible, será la elección preferida. Si el estudio se centra en la presencia de hepatomegalia, el esfuerzo de una recogida más precisa merecerá la pena. Si es una variable secundaria, bastaría con la recogida menos precisa.
Comentario a la pregunta 4.3
La respuesta más correcta es la “d”, De intervalos o razones (continua).
Aunque estamos acostumbrados a recoger la edad gestacional con valores enteros de semanas y fracciones de semanas desde la fecundación estimada por la fecha de la última regla, la edad gestacional adopta valores teóricamente infinitos si la midiéramos en unidades de tiempo pequeñas (minutos, horas, etc.). Por ello, al igual que otras variables de tiempo, siguen escalas continuas de intervalos o razones. No obstante, podría optarse por categorizar la variable simplificándola como variable ordinal (por ejemplo: menos de 32 semanas, 33-34 semanas, 35-36 semanas, mayor o igual a 37 semanas) o incluso nominal (a término y pretérmino).
Comentario a la pregunta 4.4
La respuesta más correcta es la “c”, Ordinal.
El número de crisis asmáticas en 1 año no tiene valores posibles infinitos y la magnitud de cada crisis puede ser diferente en duración e intensidad (unidad no constante), pero sí que están ordenados entre sí (cuatro crisis son más que tres), por ello la variable es ordinal. Podríamos simplificar la variable estableciendo un punto de corte. Por ejemplo, considerar crisis frecuentes a aquellos con más de dos crisis, convirtiéndose la variable en nominal.
Bibliograf A Recomendada
• Altman DG. Practical statistics for medical research. London: Chapman & Hall; 1991.
• Milton JS. Estadística para biología y ciencias de la Salud. México: McGraw-Hill; 2001.
• Norman GR, Streiner DL. Bioestadística. México: Mosby/Doyma Libros; 1996.
• Woodwark M. Epidemiology study design and data analyisis. London: Chapman & Hall/CRC; 1999.
Estadística descriptiva
Medidas de frecuencia, riesgo e impacto en epidemiología
Objetivos docentes:
• Conocer los fundamentos de la estadística descriptiva e inferencial.
• Conocer las principales medidas de centralización y dispersión.
• Entender la utilidad de la mediana y los rangos intercuartílicos.
• Conocer los principales métodos de representación gráfica.
• Conocer las principales medidas de frecuencia, riesgo e impacto en epidemiología.
• Saber elegir la medida epidemiológica más apropiada a cada tipo de estudio.
• Saber interpretar las estimaciones de riesgo y las diferencias de porcentajes o medias.
Estadística descriptiva e inferencia estadística
Podemos definir la estadística como el conjunto de métodos científicos ligados con la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis. Una definición más clarificadora sería: “El arte de tomar decisiones en presencia de incertidumbre”.
Dentro de la estadística podemos diferenciar dos tipos: la estadística descriptiva y la inferencial. La estadística descriptiva se limita a describir y analizar un conjunto de datos, limitándose a los mismos, mientras que la estadística inferencial (o inductiva) trata de sacar conclusiones sobre una “población” a partir del análisis de los datos extraídos de un subconjunto de la misma (“muestra”). La inferencia estadística es el objetivo principal de la estadística, ya que es la que nos permite cuantificar nuestra incertidumbre y tomar decisiones cuando la probabilidad de error es mínima. Dentro de la inferencia estadística, podemos diferenciar a su vez dos tipos de estrategias: la estimación de intervalos de confianza de nuestras estimaciones y el contraste de hipótesis en el que confrontamos dos o más alternativas, cuantificando la probabilidad de que las diferencias entre ellas se deban al azar.
Veamos un ejemplo para ilustrar las distintas funciones de la estadística: imaginemos que en una muestra de 63 niños con jaquecas recurrentes probamos en episodios sucesivos dos analgésicos distintos (A y B). De ellos, 31 manifestaron preferencia por el tratamiento A, 15 por el B y 17 no mostraron preferencia entre ellos. La estadística descriptiva nos permite estimar que un 49,2 % prefirió el tratamiento A, un 23,8 % el B, con una diferencia entre ambos del 25,4 % a favor del tratamiento A.
La inferencia estadística, mediante estimación de intervalos, nos permite avanzar hasta estimar que, con un 95 % de confianza (5 % de error), la diferencia observada se situaría en un intervalo entre el 3,6 y el 47,2 % a favor del tratamiento A.
Por último, el contraste de hipótesis nos permite calcular (test McNemar) que la probabilidad de que las diferencias encontradas sean debidas al azar es 0,018 (1,8 %), por lo que asumimos que el tratamiento A parece mejor que el B.
Los fundamentos y procedimientos seguidos para realizar estos cálculos se verán en capítulos sucesivos de este libro.
Medidas descriptivas
Como hemos visto al inicio de este capítulo, el primer paso del análisis estadístico es el cálculo de medidas descriptivas de la muestra de estudio. Podemos diferenciar varios grupos de medidas: de masa, de tendencia (o centralización) y de dispersión.
Medidas de masa
Son medidas de masa el tamaño muestral (n), el sumatorio y las frecuencias absoluta y relativa.
• Tamaño muestral: el recuento del número de casos.
• Sumatorio (∑Xi ): suma aritmética del valor de una variable de todos los casos.
• Frecuencia absoluta: recuento del número de ocurrencias de cada valor de una variable.
• Frecuencia relativa: proporción respecto al total.
En la tabla 5.1 se puede ver la tabla de frecuencias de la variable “número de hijos” de 20 parejas, tal y como lo ofrecen la mayoría de los paquetes estadísticos.