PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA
PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA
SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA AGUSTINOS SOCIEMA MISIÓN La Sociedad Científica de Estudiantes de Medicina Agustinos – SOCIEMA tiene como fin generar y difundir conocimientos científicos relacionados al proceso salud-enfermedad promoviendo soluciones a los diversos problemas de salud de la región y del país, a través de la investigación desde pregrado; así como educación médica continua permanente de nuestros miembros contribuyendo al desarrollo institucional universitario y social.
VISIÓN Ser un centro de investigación de referencia en el ámbito científico y académico de la salud que aporta sustantivamente al desarrollo de la medicina y en la formulación de políticas de salud óptimas a nivel regional y nacional. «La publicación, principal indicador de la actividad científica; constituye el objetivo final de la investigación, razón de ser de las sociedades científicas.»
RECOPILADO POR: Cender Udai Quispe Juli Freddy Ivan Grande Quispe
SOCIEMA INDICE Introducción…………………………………………………………..…..…………….....…..I Razones para investigar en Atención Primaria…………………………..…………….…….1 Capítulo 1: Formulación de la pregunta de investigación……………………………......….3 Capítulo 2: La búsqueda bibliográfica y su aplicación en PubMed-MEDLINE……..….…. 8 Capítulo 3: La investigación a partir de la observación. Estudios descriptivos. Estudios analíticos………………………………………………………………………..….....….... 16 Capítulo 4: El ensayo clínico. Metodología de calidad y bioética…………………….....…22 Capítulo 5: Selección de la muestra: técnicas de muestreo y tamaño muestral…………….31 Capítulo 6: Diseño de cuestionarios…………………………………….…………….....….37 Capítulo 7: Estadística: Estadística Descriptiva y Estadística Inferencial……………....….42 Capítulo 8: Pruebas diagnósticas.Concordancia…………………………..…………....…..48 Capítulo 9: Investigación secundaria: la revisión sistemática y el metaanálisis………..…..59 Capítulo 10: La investigación cualitativa en la investigación en salud. Fundamentos y rigor científico………………………………………………………..………….…………....…..65 Anexo 1: La importancia de la investigación en el pregrado de Medicina……….......….....70
Anexo 2: Guía para escribir un protocolo: Una propuesta de investigación recomendaciones de la organización panamericana de la salud…...............................................................…..77
SOCIEMA INTRODUCCION
En el Perú la inversión y desarrollo de la investigación científica no ha sido una prioridad y se ha postergado por diversos gobiernos. A pesar que nuestro país, experimentó un importante desarrollo económico en los últimos años caracterizado por ser una economía de subsistencia, muy dependiente de la exportación de materias primas; la inversión en salud, educación y ciencia han sido mínimas por lo que todavía persisten brechas en distintos sectores de la sociedad que generan injusticias e inequidades. Los países desarrollados poseen un alto nivel de actividad científica y tecnológica, así como logros consolidados en el bienestar de sus poblaciones, y continúan invirtiendo fuertemente en investigación. La primera potencia del mundo, Estados Unidos invierte 2,7 % de su Producto Bruto Interno (PBI), Japón destina 3,4% del PBI, Alemania 2,6%, Francia 2,1% y Reino Unido 1,8%, otros como Israel, que es el país que más invierte en el mundo, el 4.6% del PBI, Suecia invierte 2,7%%, Finlandia 3,5%, Corea del Sur 3,5% Taiwán 2,7% y Singapur 2,6%, En América Latina, Brasil es el que más invierte, el 1% de su PBI, Chile con O,7%, y el Perú solo invierte el 0,15% de su PBI, uno de los indicadores más bajos de América y del mundo. Situación que debería tomarse en cuenta seriamente ya que ningún país ha salido del subdesarrollo sin inversión en investigación científica y tecnológica.
Todo esto influye en una severa crisis universitaria, que conlleva al obsoleto equipamiento de laboratorios para investigación, insuficiente política de transferencia tecnológica, la limitada existencia de convenios interinstitucionales, la carencia de recursos humanos calificados, poca tradición y motivación para publicar. Haciendo que la investigación sea nula o escasa en la gran mayoría de las Universidades e Institutos dedicados a ella. A pesar de este contexto desfavorable o tal vez motivados por el mismo, en las últimas décadas ha surgido en diferentes partes de Latinoamérica un interés creciente en estudiantes de medicina por realizar investigación; probablemente el reconocimiento de las múltiples limitaciones haya fomentado la creación de redes de colaboración entre los mismos y consecuente creación de sociedades o asociaciones científicas de estudiantes de medicina (SOCEM o ACEM), fenómeno del cual no fue excepción el Perú. La SOCIEDAD CIENTÍFICA DE ESTUDIANTES DE MEDICINA AGUSTINOS-SOCIEMA con
I
otras más de 30 sociedades conforman la SOCIEDAD CIENTÍFICA MEDICO ESTUDIANTIL PERUANASOCIMEP, que tiene como principal objetivo promover el desarrollo de la investigación científica en el pregrado de las facultades de medicina.
La investigación es uno de los ejes de la formación médica, porque además de estar estrechamente ligada al avance de la ciencia médica, como tal, refuerza el conocimiento del método científico el cual es esencial para la evolución del conocimiento médico. Ya que siempre ante un paciente se recoge información válida para formar un marco teórico y planteamiento del problema (historia clínica), se identifican las variables, se organiza dicha información y formulan una o varias hipótesis (impresión diagnóstica). Luego se realiza el estudio adecuado y obtienen datos que acepta o rechaza la hipótesis (diagnostico) que permite una adecuada intervención (aplicación terapéutica) y seguimiento del paciente. Finalmente se realiza el análisis estadístico y la discusión (análisis de resultados clínicos), y se elabora un informe final (epicrisis). Así la investigación y la práctica médica, son dos caras de la misma moneda; para que se pueda alcanzar todo su potencial es indispensable tener un continuo conocimiento una de la otra. Por ello la investigación precisa ser algo más que un simple curso curricular o extracurricular para el estudiante de medicina. Debe ser el punto de partida, camino y modus vivendi de la carrera médica. Más que una obligación, debe sentirse como necesidad y aún más, como una pasión, pues siempre hay algo que aprender, algo que descubrir, algo por conocer: Algo que investigar.
Por último, vale la pena destacar que la intención de este pequeño manual no es competir con los excelentes libros que existen sobre metodología de la investigación clínica y medicina basada en evidencias, entre otros. Lo que pretende es transmitir, un conocimiento de los fundamentos en investigación clínica y dar una perspectiva al estudiante, o al médico recién egresado sobre algunos recursos útiles que le permitan enfrentar los desafíos en los inicios de su labor de investigación clínica, así como generar la suficiente motivación para que desarrolle apropiada y sostenidamente su formación.
Atentamente
Cender Udai, Quispe Juli Presidente de SOCIEMA 2014-2015
II
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
01 Edit (111-112).qxp
15/3/07
09:48
Página 111
Razones para investigar en Atención Primaria P. Vich Pérez Médico de Atención Primaria y miembro del Comité Editorial de SEMERGEN. Centro de Salud Monovar. Área 4 de Atención Primaria. Madrid.
Al leer el título de este editorial, algunos se preguntarán: ¿otra vez buscando razones? ¿Ya estamos de nuevo hablando sobre investigación en Atención Primaria? ¿Todavía no nos hemos dado cuenta de que se trata de una quimera? ¿Cuántos años llevamos intentando que despegue definitivamente nuestra nave de la investigación? ¿Y por qué nos cuesta tanto conseguirlo? Revisando editoriales y artículos previos sobre el tema, todos aportan mayoritariamente datos de los que voy a transcribir algunos: “A principios de la década de los ochenta la investigación en este ámbito era totalmente anecdótica”1; “La producción científica es baja y existe poca con factor de impacto. En un análisis bibliométrico realizado por Marset Campos et al […] si bien se aprecia un ascenso del número de artículos a partir de 1984 […] éste se estanca desde entonces en un 4%”1,2; “En el mapa bibliométrico del Fondo de Investigaciones Sanitarias sobre la investigación realizada en España durante el período 1994-2000, la práctica totalidad de producción [...] proviene de la firma de centros hospitalarios” 1,2. Son datos que se repiten, que se analizan y de los que se intentan extraer reflexiones en cuanto a las dificultades: falta de reconocimiento, tiempo, motivación, recursos, falta de formación específica, ausencia de cultura investigadora, escasas estructuras de apoyo a la investigación en Atención Primaria, etc1,3-6. También tratan de encontrar argumentos sobre la importancia de nuestra labor como investigadores en este nivel asistencial: los resultados de los estudios en especializada no son extrapolables a primaria, se atienden estadios más precoces de la enfermedad, se manejan patologías de mayor prevalencia, se tiene un mayor acceso y continuidad de la población, existe inquietud e incertidumbre entre los profesionales y algunos más1,3,4. Existen en el momento actual, numerosas fuentes de información de calidad para que el médico de Atención Primaria, si quiere, pueda formarse e iniciarse en metodología para la investigación: guías clínicas, recursos en la web, cursos de formación impartidos por organismos públicos y sociedades científicas, facilidades para la elaboración de proyectos con el apoyo de unidades específicas en las diCorrespondencia: P. Vich Pérez Centro de Salud Monovar. Área 4 de Atención Primaria. Madrid. Correo electrónico: mpvich@terra.es
ferentes áreas sanitarias... ¿Por qué contando con los medios necesarios no logramos despegar? ¿Por qué la investigación no forma parte aún de nuestra “esencia” como médicos de la que nos sentimos tan orgullosos? Creo que la respuesta podría acercarse y tiene bastante que ver con la elaboración de decisiones que se toman “desde dentro”, porque nos convencen desde lo más profundo y las hacemos nuestras. Cuando una persona deja de fumar o elige un determinado modo de vida, todo su ser está convencido de esa decisión que no es impuesta y que nace de algo más hondo y complejo que la simple reflexión, el diálogo o la necesidad. Las grandes decisiones de nuestra vida parten de un convencimiento hecho propio, de una motivación intrínseca, de una fuerza capaz de mover montañas que parecían imposibles. La historia de la humanidad, la historia de la medicina y la pequeña historia de cada ser humano tienen algo en común: el progreso, el crecimiento en conocimiento que genera más conocimiento. Los niños crecen, aprenden de los demás, de los libros, de su propia experiencia, preguntando a otros... y cuando no encuentran respuestas, algunos se conforman y otros siguen buscando de forma natural y espontánea, como parte de esa curiosidad que caracteriza al ser humano y le permite seguir adelante. Investigamos cuando las respuestas que encontramos no nos convencen. En medicina, contribuimos a la investigación y al conocimiento científico cuando notificamos una posible reacción adversa a un fármaco o revisamos las curiosidades de un determinado caso clínico y lo enviamos para considerar su publicación. Investigamos cuando nos hacemos preguntas, las compartimos y buscamos la mejor de las repuestas y en el caso de no encontrarlas, diseñamos estudios destinados a ese fin. Investigamos para crecer apoyándonos en el conocimiento generado anteriormente, en el trabajo de otros que aportaron su granito de arena para que el saber de hoy sea mayor que el de ayer. Si no investigamos, muchas preguntas quedarán sin respuesta y seguiremos actuando de forma automatizada o empírica sin llegar a saber nunca si lo que hacemos es lo mejor. Nosotros somos los responsables del mañana. Las huellas que dejemos, las bases que consolidemos, las estruc1
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
01 Edit (111-112).qxp
15/3/07
09:48
Página 112
Vich Pérez P. Razones para investigar en Atención Primaria
turas que aseguremos servirán para que otros a su vez sigan construyendo, creando, avanzando.
¿POR QUÉ DEBEMOS INVESTIGAR EN ATENCIÓN PRIMARIA? 1. Porque somos médicos con todo lo que ello implica, debemos dedicación y entrega a nuestro trabajo, a nuestros pacientes y parte de ello supone el buscar soluciones cuando todavía no las hay, considerando que a veces no basta con “la mejor de las respuestas”. 2. Porque la Atención Primaria constituye en volumen la mayor asistencia médica de nuestro país, donde se generan preguntas que en numerosas ocasiones quedan sin resolver en función del conocimiento científico previo. Si hacemos memoria tras pasar consulta un día cualquiera, ¿quién de nosotros no se ha quedado con dudas?: “¿he ofrecido a este paciente la mejor de las soluciones?”, “¿es necesario realizar analítica anual a todos los hipertensos?”, “¿se debe hacer cribaje de vitamina B 12 a todos los ancianos y sujetos que toman determinada medicación de forma crónica?”, “¿es posible contribuir al cambio del estilo de vida actual que tantos problemas de salud mental desencadena?”, “¿qué hago con esta hipercalcemia aislada?”, “¿hemos de tratar todos los factores de riesgo cardiovascular en el anciano?”, “¿qué información debo darle a un paciente de 75 años que solicita la determinación del antígeno prostático específico?”, “¿qué información manejamos para la toma de decisiones en medicina?”, “¿por qué existe tanta variabilidad en la misma?” Son algunos ejemplos de preguntas no premeditadas que podrían multiplicarse por mil con un poco más de tiempo y reflexión. Las preguntas surgidas en Atención Primaria deben responderse desde Atención Primaria, adecuándolas a un contexto más universal, más integral e integrador, a una población real, amplia y no sesgada. Para ello, no obstante, podrá utilizarse toda la información de interés al respecto generada en cualquier nivel asistencial. 3. Porque el tiempo que nunca tenemos para dedicar a la investigación es virtual. Tampoco encontramos el momento para cosas tan importantes como tener hijos, aprender a manejar el ordenador, pasear, hacer deporte, aprender idiomas o leer un libro. La vida es corta, el tiempo breve y es cierto que todo no cabe. Es cuestión de prioridades. Si estamos convencidos de la importancia de investigar en Atención Primaria, investigaremos, de eso no hay duda. 4. Porque somos parte de la estructura sobre la que se asentará el conocimiento médico del mañana. Debemos introducir en nuestra cultura, en nuestra formación básica las herramientas que nos permitan realizar una labor investigadora. El legado que dejemos a futuras generaciones es hoy nuestra responsabilidad. 5. Porque si no tenemos formación en investigación no podremos ser críticos con estudios realizados por otros. Tan peligroso puede ser el aceptar sistemáticamente los resultados de estudios realizados por prestigiosas empresas e investigadores como por el contrario, desconfiar de todo y no cambiar nuestra práctica clínica porque “no nos fiamos
de nadie”. Tenemos que saber leer literatura científica con conocimiento y espíritu crítico. 6. Porque si nosotros estamos convencidos de la necesidad de investigar, sabremos transmitirlo a nuestro entorno: equipo de Atención Primaria, compañeros, residentes, estudiantes y responsables, quienes a su vez y progresivamente, irán incrementando los espacios y los recursos prácticos necesarios para este fin. 7. Porque, nos guste o no, hemos elegido una profesión comprometida con la sociedad y con las personas y a ellas les debemos nuestro esfuerzo. 8. Porque como dice el viejo refrán: “El que la sigue, la consigue”, y desde nuestra pequeña vida profesional tenemos mucho que aportar. 9. Porque aunque no todos los profesionales que trabajamos en Atención Primaria nos dediquemos a la investigación, sí debemos al menos ser conscientes de la importancia de la misma, estar abiertos a la formación continuada al respecto, a colaborar en proyectos y a transmitir la cultura de la investigación en nuestro medio. Por todo ello y conscientes de que la verdadera motivación de las personas parte de una decisión propia y de una convicción profunda, el comité editorial de esta revista desea contribuir a la misma en lo referente a la investigación de calidad en el primer nivel asistencial. Gracias a la colaboración de compañeros comprometidos y expertos en el tema, como el Dr. José Luis Rodríguez Martín, jefe del Área de Investigación Clínica de la Fundación para la Investigación Sanitaria en Castilla la Mancha (FISCAM) y diversos autores del mismo departamento, así como del Instituto Carlos III, de la Agencia Laín Entralgo y médicos del Área de Investigación de SEMERGEN, coordinados por el Dr. Francisco Javier Alonso Moreno, responsable del Área de Investigación de SEMERGEN, nuestra revista pretende ofrecer las herramientas que todo médico de Atención Primaria debe conocer y manejar para navegar con comodidad en el océano de la investigación. Se trata de una actividad formativa que aparecerá mensualmente en nuestra revista durante los meses sucesivos y que junto a otras publicaciones estará acreditada a través de la web para aquéllos que lo deseen. Ojalá que el objetivo de este editorial y de las páginas que a partir de ahora dediquemos a fomentar la investigación en Atención Primaria pueda ser satisfecho en el futuro.
BIBLIOGRAFÍA 1. Fernández I. ¿Investigación en Atención Primaria? Aten Primaria. 2003;31:281-4. 2. Camí J, Suñen E, Carbó JM, Coma L. Producción Científica Española en Biomedicina y Ciencias de la Salud (1994-2000). Informe del Instituto de Salud Carlos III-Fondo de Investigación Sanitaria. Disponible en: http://www.isciii.es/sgis/mapa. 3. Lavalle R. Reflexiones sobre el papel de la investigación en Atención Primaria. Rev Esp Mat Inf Ramón Sardá. 1997;2:50-1. 4. Pita S, Pértega S. Dificultades de la investigación en Atención Primaria. 2005. Disponible en: http://fisterra.com 5. Vega E, García JA, García P, Carvajal A. La investigación en Atención Primaria debe ser potenciada. Aten Primaria. 2002;30:97. 6. Jowett SM, Macleod J, Wilson S, Hobbs FD. Research in Primary Care: exent of involvement and perceived determinants among practitioners from one English region. Br J Gen Pract. 2000;50:387-9.
2
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 Formacion 1102 (149-153).qxp
15/3/07
10:01
Página 149
R. Martín JL et al. Capítulo 1: Formulación de la pregunta de investigación
formación SOCIEMA PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA
Capítulo 1: Formulación de la pregunta de investigación J.L. R. Martína,b, T. Seoanea, E. Martín-Sáncheza, F.J. Alonso Morenoc,d y M. Sainz-Pardoa aÁrea de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla-La bUnidad de Investigación Aplicada. Hospital Nacional de Parapléjicos. Toledo. España. cCentro de Salud Sillería. Toledo. España. dResponsable de Investigación de SEMERGEN.
La investigación clínica o aplicada, es un proceso cuyo objetivo es resolver cuestiones planteadas en cada una de las etapas del proceso asistencial para poder mejorar tanto la práctica clínica diaria, como la calidad de la atención prestada a los pacientes. El punto de partida de todo proceso de investigación es el planteamiento de una incertidumbre, que toma forma mediante la formulación de una pregunta de investigación. Ésta permitirá el desarrollo de una estrategia científica y un protocolo de trabajo que nos conducirán a resolver nuestra incertidumbre inicial. Las cuestiones suelen surgir en tres escenarios principales: para sustituir o mejorar actuaciones o intervenciones de la práctica asistencial diaria, ante la existencia de lagunas de conocimiento, o en el campo de la docencia. Para formular una pregunta correctamente es necesario que reúna una serie de características en cuanto a estructura y a contenido; debe estar correctamente operativizada, de tal modo que en su estructura ha de contener la información necesaria que permita definir y diferenciar el tipo de pacientes y/ o patología a estudiar, la intervención que vamos a realizar, si se trata de un estudio de intervención y las medidas de resultado que deseamos conocer. Para la obtención de resultados útiles es deseable, además, reunir las características de factibilidad, interés, novedad y relevancia.
Serie monográfica de 10 capítulos en Investigación Clínica para la revista SEMERGEN Dirección: Dr. J.L. R. Martín. Coordinación: Dr. F.J. Alonso. Correspondencia: J.L. R. Martín. Jefe del Área de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla la Mancha (FISCAM). Edificio Bulevar. C/ Berna, nº 2, local 0-2. 45003 Toledo. Correo electrónico: jlrmartin@jccm.es
Mancha (FISCAM). Toledo. España.
Una pregunta bien formulada ayudará al desarrollo de otras etapas del proceso de investigación, y además, facilitará la obtención de resultados ajustados a nuestra cuestión inicial y el posterior manejo de éstos, tanto para la realización de investigaciones secundarias, como para satisfacer adecuadamente las necesidades individuales de conocimiento. Palabras clave: pregunta de investigación, Atención Primaria, estudios experimentales y transversales.
Clinical or applied research is a procedure whose objective is to resolve questions established on each one of the stages of the care procedure to be able to improve both the daily clinical practice and quality of care given to the patients. The starting point of all research procedures is the statement of an uncertainty that is formed by formulating a research question. This allows for the development of a scientific strategy and work protocol that will lead us to solve our initial uncertainty. The questions generally arise on three main scenarios: to substitute or improve actions or interventions of the daily care practice when there are knowledge gaps or in the teaching field. To formulate a question correctly, a series of characteristics on structure and content must be gathered. The question should be correctly made operative so that its structure should contain the information necessary to make it possible to define and differentiate the type of patients and/or disease to be studied, the intervention that we are going to conduct if this is an intervention study and the measurements of the outcome that we want to know. To obtain useful results it is also desirable to gather the characteristics of feasibility, interest, novelty and relevance. A well-formulated question will help to develop other research procedure stages and will also facilitate the obtaining of results adapted to our initial question and the subsequent
3
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 Formacion 1102 (149-153).qxp
15/3/07
10:01
Página 150
R. Martín JL et al. Capítulo 1: Formulación de la pregunta de investigación
management of these results for both the conduction of secondary investigations and to adequately satisfy the individuals needs of knowledge. Key words: research question, primary care, experimental and cross-sectional studies.
INTRODUCCIÓN. LA INVESTIGACIÓN CLÍNICA: DE LA DUDA, A LA REALIDAD Definición del proceso de investigación clínica La investigación aplicada, o clínica en el contexto sanitario, tiene como objetivo determinar la verdad de una incertidumbre planteada en forma de cuestión: ¿es la hipertensión un factor de riesgo cardiovascular?,1 ¿y el colesterol? Estas preguntas clínicas planteadas hace ya bastante tiempo buscaban encontrar esa verdad: sí/ no. Este tipo de investigación, como hemos visto, puede evaluar riesgos para la salud, probar nuevas estrategias de diagnóstico, tratamiento y prevención de enfermedades, es decir, constituye la herramienta de trabajo que proporciona las pruebas necesarias tanto para desempeñar la práctica clínica diaria, como para mejorar la calidad de la atención prestada a los pacientes2. Por supuesto, esto permite una importante mejora en la gestión de los sistemas de cuidados médicos, con una clara influencia sobre aspectos tan variados como la reducción de tratamientos obsoletos y redundantes, la realización de un reparto más eficaz de los recursos disponibles o el conocimiento de nuevos hábitos o componentes de la vida diaria que constituyen un riesgo para la salud. El proceso de investigación clínica pasa por varias fases hasta obtener resultados útiles para la mejora tanto de la práctica asistencial como de la calidad de vida del paciente. Así, los aspectos en los que se debe centrar la atención son los siguientes (fig. 1)3: – Adecuada formulación de la pregunta de investigación. – Búsqueda bibliográfica y estudio de los conocimientos existentes sobre el tema. – Elección del diseño de investigación más idóneo. – Selección de la población de estudio: elección de una muestra con las características y el tamaño adecuado. – Planteamiento de estrategias de análisis. – Medición de variables con precisión y exactitud. – Interpretación de los resultados de forma objetiva. – Publicación de los resultados encontrados. La pregunta de investigación como punto de partida del proceso de investigación Las fases iniciales de un proceso de investigación son de vital importancia para el buen desarrollo de éste. La investigación clínica debe llevar a cabo una metodología organizada con la finalidad de responder a un objetivo. Es necesario el seguimiento de una estrategia, el desarrollo de un protocolo de trabajo que se crea a partir de un primer interrogante y que queda preestablecido a priori para todo el proceso de investigación4. Todos los miembros del equipo investigador han de seguir la misma metodología de
Escenario clínico Adecuada formulación de la pregunta de investigación Búsqueda bibliográfica y estudio de los +conocimientos existentes sobre el tema Elección del diseño más idóneo Selección de la población de estudio: elección de muestra Medición de variables: precisión y exactitud Planteamiento de estrategias de análisis Interpretación objetiva de resultados Difusión
Figura 1. Etapas del proceso de investigación.
trabajo y aplicar idénticos criterios de una forma objetiva, sin impresiones o suposiciones previas.
ESCENARIOS EN LOS QUE SURGEN PREGUNTAS DE INVESTIGACIÓN El profesional sanitario se encuentra cada día con situaciones que no puede resolver únicamente con los conocimientos acumulados de forma personal a través de su experiencia con los pacientes, sino que se hace necesario complementar esos conocimientos mediante la consulta de la literatura científica, o actualizarlos mediante, por ejemplo, la asistencia a congresos o reuniones científicas3. Sólo en el marco de un buen conocimiento sobre un tema pueden surgir buenas cuestiones de investigación que conduzcan a resultados interesantes. Estas cuestiones se originan en cualquiera de las etapas del proceso asistencial5: – Hallazgos clínicos. – Etiología. – Manifestaciones clínicas de la enfermedad. – Diagnóstico diferencial. – Exploraciones diagnósticas. – Pronóstico. – Tratamiento. – Prevención. – Experiencia y significado. – Automejoría. Existen tres escenarios principales en los que surgen cuestiones científicas de carácter médico: a) cuando actuaciones o intervenciones llevadas a cabo de forma habitual en la práctica asistencial diaria podrían ser complementa4
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 Formacion 1102 (149-153).qxp
15/3/07
10:01
Página 151
R. Martín JL et al. Martín R. JL et al. Capítulo 1: Formulación de la pregunta de investigación
das, mejoradas o sustituidas por otro tipo de actuaciones o intervenciones, con resultados empíricos positivos, pero para las que aún no existe evidencia sólida sobre su eficacia y/ o seguridad; b) cuando un adecuado estudio sobre un tema pone de manifiesto la existencia de lagunas de conocimiento o interrogantes para los que no existe aún información ni evidencia disponible que conduzca a su respuesta y c) en el campo de la docencia: este marco el constante estudio de todas las materias que abarca el conocimiento científico en el campo de la medicina, tanto en sus aspectos más tradicionales como en las cuestiones más novedosas fruto de investigaciones recientes, constituye una puerta abierta a la búsqueda de nuevas alternativas y al planteamiento permanente de nuevos interrogantes científicos. Además, la investigación clínica constituye un valor añadido para los profesionales, ya que supone no sólo el prestigio profesional, sino un importante estímulo intelectual.
CARACTERÍSTICAS DE LA PREGUNTA Estructura de la pregunta6-8 La investigación clínica es principalmente medición, y por lo tanto nuestra pregunta deberá cuidarse de poder medir todos sus componentes durante el proceso de estudio: – Pacientes/ patología: debemos tener presente si podemos medir el tipo de pacientes o la patología de la que surge el estudio que se vaya a realizar. Si hablamos de depresión podremos medirla a través de escalas específicas (Hamilton Depression Rating Scale)9 o criterios diagnósticos validados (DSM-IV)10. Sin embargo, si quisiéramos medir globalmente la relación paciente-médico para determinar el grado de cumplimiento terapéutico, esta medición sería muy difícil de plasmar a nivel teórico (y, por lo tanto, de llevarla a cabo en el trabajo de campo de la investigación planteada). En los estudios observacionales, especialmente en los de casos y controles, es esencial definir adecuadamente qué se considera “caso”. – Intervención: algo parecido ocurre con las intervenciones a realizar (si es que vamos a llevarlas a cabo en nuestra investigación). En este caso debemos tener presente si nuestra intervención se puede medir adecuadamente o no. Por ejemplo, en algunos casos el concepto “deporte” no es fácil de definir, y por lo tanto de ser medido adecuadamente. Si planteamos un estudio para determinar si el ejercicio físico previene una patología o mejora la calidad de vida de un tipo de pacientes, es necesario definir muy bien tanto el significado del concepto “ejercicio físico” como de sus grados: baja, media o alta intensidad, antes de realizar la investigación11. En otros temas, la intervención, aunque definible, es prácticamente inmedible. Por ejemplo, si queremos plantear una investigación sobre la relación entre la fe religiosa de los pacientes y su recuperación (aparte de los tratamientos médicos recibidos), nos sería prácticamente imposible medir científicamente el concepto de “fe religiosa”. – Medidas de resultado (eventos/ no eventos): dentro de nuestra pregunta debemos tener en cuenta qué resultados
vamos a considerar. Esto se denomina “medida de resultado” y por lógica, es fundamental poder medirla adecuadamente. Si hablamos de factores de riesgo como, por ejemplo el tabaco, es necesario determinar a quién se considerará fumador y a quién no (¿un cigarrillo al día? ¿5 cigarrillos sólo los fines de semana? ¿varios cigarrillos esporádicamente cada mes?, etc.). Si nuestra investigación se basa en intervenciones (que realizaremos sobre los pacientes) es primordial que la medición de nuestra variable dependiente sea lo más exacta posible. La mortalidad (o supervivencia) de un paciente es fácil de medir, pero sin embargo, este tema se complica para eventos tan claros a priori como: infartos, fracturas, osteoporosis y ni qué decir para variables como las caídas en personas mayores o la automedicación. A partir de los puntos anteriores podemos ya formular preguntas de investigación. Un ejemplo podría ser ésta: “determinar si la vitamina D tiene relación con las caídas en personas mayores”. Así, a simple vista podría parecer bastante válida (seguro que algún lector de este capítulo puede estar pensando en investigarlo), sin embargo, esta pregunta carece de cierta estructura que podría complicar o añadir mucho tiempo y esfuerzo a la futura investigación. Si replanteamos la pregunta en estos términos: “¿la ingesta suplementaria de vitamina D disminuye la incidencia de caídas en personas mayores con osteoporosis?” ya habremos solventado un gran número de problemas que podrían surgir posteriormente. Una recomendación es escribir sobre un papel la pregunta de investigación y discutirla con el resto del equipo, añadiendo o eliminando conceptos hasta tener una versión definitiva. A partir de aquí, toda la investigación se debe centrar específicamente en contestar esa pregunta (y no otra).
CARACTERÍSTICAS3,7 Después de haber “operativizado” correctamente nuestra pregunta de investigación, es decir, una vez que hemos hecho “medibles” todos sus componentes, como vimos en el punto anterior, debemos determinar ciertas características esenciales antes de pasar al proceso de investigación propiamente dicho. Factibilidad A la hora de formular nuestra pregunta debe considerarse la viabilidad del proyecto de investigación, es decir, valorar los costes, en tiempo y recursos, que implicará el proyecto objeto de estudio. En una investigación siempre se subestiman estos dos hechos. Es conveniente contar con un equipo especializado en el tema objeto de estudio, ya que esta especialización podría determinar tanto la eficacia en la consecución de los objetivos planteados, como la eficiencia a nivel práctico. Además se debe contar con los recursos materiales necesarios para la investigación. Otro punto importante es la población de estudio. Durante la investigación se necesitará un número mínimo de sujetos (la determinación de este número será estudiado en otro artículo de esta serie de in5
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 Formacion 1102 (149-153).qxp
15/3/07
10:01
Página 152
R. Martín JL et al. Capítulo 1: Formulación de la pregunta de investigación
vestigación). Esto es fundamental por varios motivos: en primer lugar para no caer en el denominado error tipo II, o dicho de una forma más pragmática, para evitar que existiendo el efecto que vamos buscando, no seamos capaces de encontrarlo (aceptar la hipótesis nula cuando, sin embargo, es falsa). En segundo lugar, porque durante nuestra investigación seguro que un porcentaje de nuestros sujetos se perderán (no sabremos lo que ha pasado con ellos), por lo que debemos aumentar nuestra muestra inicial en un porcentaje similar al que presuponemos que se perderá durante el proceso. Otras veces, aunque contemos con un número suficiente de sujetos, algunos de ellos no estarán interesados en participar en nuestro estudio, por lo que nuestra muestra se podría reducir considerablemente. Interés Este apartado hace referencia al interés que la investigación tendrá para el investigador. En muchas ocasiones una investigación no comienza por el puro hecho de crear conocimiento aplicable, mucho más allá, una investigación puede empezar por un interés económico o de promoción personal. En estos casos, las complicaciones propias de un proceso de investigación harán prácticamente imposible un resultado óptimo al final del proceso. Un investigador debe empezar el proceso de estudio e investigación con una sola premisa: determinar la verdad de la incertidumbre que está estudiando. Únicamente a partir de esta motivación por descubrir la cuestión planteada previamente será posible que el investigador pueda hacer frente a todos los problemas y frustraciones que surgirán durante todo el proceso. Hay que tener claro que una investigación no se termina hasta que no se han publicado los resultados. Por lo tanto, desde que surge la idea hasta que los resultados se plasman en un manuscrito para su publicación, van a surgir infinidad de problemas que tendremos que solucionar a partir, principalmente, de nuestro nivel de motivación hacia el proyecto. Novedad La buena investigación contribuye con nueva información de utilidad. Cuando nos planteamos una pregunta de investigación debemos estar seguros de que no ha sido ya contestada o, al menos, que todavía hay margen para aportar nuevo conocimiento al tema de estudio. Determinar los factores clásicos de riesgo cardiovascular o la fiabilidad y validez de pruebas diagnósticas muy establecidas, nos podría llevar mucho trabajo y escaso conocimiento nuevo o, lo que es lo mismo, dificultad para publicar resultados. Sin embargo, si nos interesa determinar los factores de riesgo de una población en concreto (y compararla con otras ya establecidas) o estudiar la dualidad que existe entre poblaciones con factores de riesgo alto, pero menos patología cardiovascular (por ejemplo en el mediterráneo) y poblaciones con factores de riesgo menores, pero más eventos cardiovasculares, entonces tal vez podríamos aportar nuevo conocimiento al tema y obtener una buena difusión de nues-
Tabla 1. Características de la pregunta Factibilidad
Interés Novedad Relevancia
Viabilidad del proyecto de investigación Eficacia Eficiencia Número necesario de sujetos Determina la verdad de la incertidumbre Amplía conocimiento científico Proporciona nuevos resultados Conocimiento científico adquirido Factor de impacto
tros resultados. El sol, el estrés o incluso la siesta, podrían ser factores que se relacionasen con eventos cardiovasculares (de riesgo o protección). Por otro lado, tampoco es conveniente que nuestra pregunta sea “demasiado” novedosa. El problema será intentar convencer a los financiadores de la potencialidad de nuestra pregunta, y no solamente a éstos, sino también a los referees de las revistas científicas. Por lo tanto, debemos buscar un equilibrio al determinar la novedad de nuestra pregunta, esto es, intentar aportar un escalón más de conocimiento. El problema surgirá si queremos crear nosotros solos la escalera o si, por el contrario, nos dedicamos a clonar escaleras ya existentes. Relevancia La relevancia es la característica más importante de una pregunta de investigación clínica. Esto hace referencia al conocimiento que se adquirirá al contestar correctamente nuestra pregunta, conocimiento que servirá tanto para la práctica clínica como para dirigir futuras investigaciones en el tema. Este apartado estará estrechamente relacionado con la posterior diseminación de los resultados encontrados al contestar la pregunta. El grado de relevancia de nuestra pregunta, junto con los resultados alcanzados, determinará su factor de impacto. Es importante mencionar que, en algunos casos, unos resultados de investigación negativos pueden ser más relevantes que los positivos. Podemos imaginar la relevancia producida si, al testar una intervención que se realiza como práctica habitual, con mucha frecuencia y con altos costes, nuestros resultados fuesen negativos (tabla 1).
¿CÓMO INFLUYE UNA PREGUNTA BIEN FORMULADA EN EL RESTO DEL PROCESO DE INVESTIGACIÓN? El buen planteamiento o formulación de una pregunta de investigación, como punto de partida del proceso de investigación clínica, puede contribuir a facilitar otras etapas de este proceso, o ayudar a que los resultados finales obtenidos sean útiles y accesibles, tanto para el profesional sanitario como para la realización de futuras investigaciones relacionadas con el tema. – En el proceso de la búsqueda bibliográfica, una pregunta bien formulada permite sugerir estrategias de búsqueda de alto rendimiento, delimitando los términos principales, las fuentes de información más adecuadas donde 6
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 Formacion 1102 (149-153).qxp
15/3/07
10:01
Página 153
R. Martín JL et al. Martín R. JL et al. Capítulo 1: Formulación de la pregunta de investigación
dirigirse o la exclusión de información que aparentemente está relacionada con nuestro tema, pero no es nuestro objetivo6. – En cuanto al diseño del estudio, de la estructura y el contenido de una pregunta se puede sugerir el tipo de diseño más adecuado para resolverla o excluir tipos de estudios que directamente no son factibles o no son adecuados para resolver nuestro interrogante6. – A nivel metodológico una pregunta bien delimitada ayuda a la elección de una adecuada metodología de trabajo para resolverla. Por ejemplo, si se trata de la aplicación de test psicométricos o cuestionarios, sabremos cómo seleccionarlos o adaptarlos a nuestra población de estudio si ésta está bien clarificada en la pregunta; si hay que realizar intervenciones sobre grupos de población, también sabremos a qué grupos dirigirnos. La pregunta nos da información sobre la factibilidad o no de ciertas metodologías de trabajo en cada caso. – En el desarrollo de investigaciones secundarias7, donde es fundamental que exista un adecuado equilibrio entre la avalancha de conocimientos nuevos que surgen cada día y las habilidades necesarias para manejar tal cantidad de información, preguntas bien formuladas simplifican y facilitan el trabajo. – En la obtención de resultados, una pregunta clara y bien delimitada obtendrá más fácilmente resultados claros y delimitados que respondan específicamente a la cuestión planteada, sin derivarse en cuestiones paralelas. – A la hora de consultar la literatura científica existente, preguntas bien formuladas consiguen captar la atención porque rápidamente indican si los conocimientos que aportan son relevantes para las necesidades clínicas de los pacientes o para las nuestras respecto de conocimientos
concretos, facilitando y abreviando el tiempo necesario para nuestro aprendizaje.
BIBLIOGRAFÍA 1. Pringle E, Phillips C, Thijs L, Davidson C, Staessen JA, de Leeuw PW, et al. Systolic blood pressure variability as a risk factor for stroke and cardiovascular mortality in the elderly hypertensive population. J Hypertens. 2003;21(12):2251-7. 2. Rebagliato M, Ruiz I, Arranz M. Metodología de investigación en epidemiología. Madrid: Díaz de Santos; 1996. 3. Argimon JM, Jiménez J. Objetivo del estudio. En: Edide SL, editor. Métodos de Investigación Clínica y Epidemiológica. 3th ed. Madrid: Elsevier. p. 125-31. 4. Martín JLR, Tobias A, Seoane T, editores. Revisiones sistemáticas en las ciencias de la vida: el concepto salud a través de la síntesis de la evidencia vientífica. 1st ed. Toledo: Fundación para la Investigación Sanitaria en Castilla-La Mancha (FISCAM); 2006 5. Sackett DL, Straus SE, Richardson WS, Rosenberg W, Haynes RB. Formulando preguntas clínicas contestables. En: Medicina Basada en la Evidencia: cómo practicar y enseñar la Medicina Basada en la Evidencia. Versión en español de la segunda ed. de la obra original en inglés Evidence-Based Medicine. Barcelona: Elsevier Science; 2002. p.11-24. 6. Clarke M, Oxman AD, editores. Formulating de problem. Manual del Revisor Cochrane 4.1.6. [actualización enero 2003]. Section 4. En: The Cochrane Library, Número 1, 2003. Oxford: Update Software. Actualizado trimestralmente. 7. Cummings SR, Browner WS, Hulley SB. Conceiving the research question. En: Hulley SB, Cummings SR, Browner WS, Grady D, Hearst N, Newman RB, editores. Designing Clinical Research: An Epidemiologic Approach. 2nd ed. Philadelphia: Lippincott Williams & Wilkins; 2001. p. 17-24. 8. University of Minnesota. Evidence-based health care proyect. Formulating the question. [Acceso 18/12/2006]. Disponible en: http://evidence.ahc.umn.edu/FormulatingQ.htm 9. Hamilton M. A rating scale for depression. J Neurol Neurosurg Psychiatry. 1960;23:56-62. 10. American Psychiatric Association. Diagnostic and Statistical Manual of Mental Disorders. 4th ed. (DSM-IV). Washington, DC: APA. 11. Acree LS, Longfors J, Fjeldstad AS, Fjeldstad C, Schank B, Nickel KJ, et al. Physical activity is related to quality of life in older adults. Health Qual Life Outcomes. 2006;4:37.
7
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 *Formación 1108 (193-9).qxp
11/4/07
12:08
Página 193
Estrada JM. Capítulo 2: La búsqueda bibliográfica y su aplicación en PubMed-MEDLINE
formación SOCIEMA PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA
Capítulo 2: La búsqueda bibliográfica y su aplicación en PubMed-MEDLINE J. M. Estrada Biblioteca. Agencia Laín Entralgo (Madrid)
Otros términos
Disfunción ventricular sistólica Disfunción ventricular diastólica Obstrucción mecánica Miocardio aturdido Miocardio hibernado
Una búsqueda bibliográfica puede facilitar al profesional sanitario la información necesaria para la actualización de los conocimientos, la publicación de un trabajo o la presentación de un proyecto de investigación. Las nuevas tecnologías y el desarrollo de las bases de datos han puesto a su alcance infinitas posibilidades para la localización y recuperación de esa información relevante. Una buena búsqueda bibliográfica debe cumplir tres requisitos: identificar con claridad la pregunta, buscar apropiadamente en los recursos adecuados y formular de forma adecuada la pregunta según la base de datos. Para ello es necesario desarrollar correctamente la estrategia de búsqueda, saber utilizar los operadores booleanos y conocer cuán diferente es realizar una búsqueda en lenguaje libre o en lenguaje controlado. Para realizar una búsqueda bibliográfica en PubMed-MEDLINE -la más amplia, internacional y actualizada base de datos en ciencias de la salud- es conveniente conocer el manejo de los términos MesH (Medical Subjects Headings), lo que permitirá ejecutar una búsqueda con mayor precisión y eficacia. En este trabajo se explican brevemente los principios de una búsqueda bibliográfica, los pasos a seguir para el diseño y desarrollo de las fases de una estrategia de búsqueda bibliográfica, y las principales funcionalidades de MEDLINE para que cualquier profesional biomédico pueda iniciar y desarrollar una búsqueda bibliográfica con cierta eficacia. Palabras-clave: búsquedas bibliográficas, bases de datos, PubMed.
Serie monográfica de 10 capítulos en Investigación Clínica para la revista SEMERGEN Dirección: Dr. J. L. R. Martín. Coordinación: Dr. F. J. Alonso Moreno. Correspondencia: J.M. Estrada. C/ Real, 45. 28792 Miraflores de la Sierra. Madrid. Correo electrónico: josemanuel.estrada@salud.madrid.org
A bibliographic search may provide the health care professional with the information necessary to up-date knowledge, publication of a work or presentation of the research project. The new technologies and development of databases have made unlimited possibilities to locate and recover this relevant information available. A good bioliographic search should comply with three requirements: clearly identify the question, appropriately search in the adequate resources and adequately formulate the question according to the database. For this, the search strategy must be correctly developed; one must know how to use the Boolean operators and know how different it is to make a search in free language or in controlled language. In order to make a bibliographic search in PubMed-MEDLINE -the most extensive, international and up-dated database in sciences of health - one must know how to handle the MesH (Medical Subjects Headings) terms. This makes it possible to perform a search with greater accuracy and efficacy. In this work, the principles of a bibliographic search, the steps that must be followed for the design and development of the phases of a strategy of bibliographic search, and the main functionalities of MEDLINE needed for any biomedical professional to initiate and develop a bibliographic search with certain efficacy are briefly explained.
Key words: bibliographic search, databases, PubMed
Cualquier profesional sanitario necesita actualizar sus conocimientos para desarrollar con mayor eficacia sus labores asistenciales, conocer el estado actual de los avances científico-médicos para realizar un proyecto de investigación, o revisar los mejores trabajos de la literatura biomédica para redactar un trabajo científico, sea un artículo o una tesis doctoral. En todos estos casos, dado el volumen de información que la comunidad científica genera anualmente, el profesional sanitario tan sólo es capaz, por sí 8
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 *Formación 1108 (193-9).qxp
11/4/07
12:08
Página 194
Estrada JM. Capítulo 2: La búsqueda bibliográfica y su aplicación en PubMed-MEDLINE
mismo, de recuperar una infinitésima parte de la información que le puede interesar1. Si quiere ser eficaz en la adquisición y actualización de sus conocimientos, y gracias al constante avance de las tecnologías de la información, tiene la posibilidad de consultar fuentes especializadas en ciencias de la salud como pueden ser los catálogos de las bibliotecas o las bases de datos bibliográficas. Así, estará iniciando la “aventura” de una búsqueda bibliográfica, que le llevará a descubrir documentos desconocidos, leer artículos originales históricos, obtener datos de máxima actualidad y revisar la evolución de la ciencia médica en los últimos años. Dada la amigabilidad y facilidad de acceso de la mayoría de los recursos de información, puede uno iniciarse solo en este “viaje”, pero es más conveniente iniciarlo con el acompañamiento, en la “maleta” de unas pautas y trucos básicos para resultar más eficaces. Éste es el propósito de este artículo, ofrecer las nociones elementales para el desarrollo de una búsqueda bibliográfica y su aplicación práctica en la base de datos PubMed-MEDLINE, a día de hoy, la más completa y actualizada base de datos bibliográfica internacional especializada en ciencias de la salud.
¿QUÉ ES Y PARA QUÉ PUEDE SERVIR UNA BÚSQUEDA BIBLIOGRÁFICA? La búsqueda bibliográfica es un proceso de localización y recuperación de documentos a partir de sus referencias bibliográficas, incluidas en una variada gama de fuentes de información, principalmente catálogos y bases de datos2,3. Una buena búsqueda bibliográfica resulta de utilidad cuando se conjugan ambas fases del proceso, pues la mera localización de la información no es suficiente 2. De poco le puede servir a un profesional sanitario conocer que existen 40 artículos sobre el “estado de salud de la población rural española en distintas comunidades” si no puede recuperar con cierta inmediatez el texto completo de esos trabajos para proseguir su investigación. Así mismo, es de perogrullo que uno no puede recuperar de forma sistemática una información que previamente no ha sido localizada. Pero una búsqueda bibliográfica sirve, además de para localizar y recuperar una información de interés, para actualizar con rapidez los conocimientos, para seleccionar con facilidad una información (dada la automatización de las fuentes de información es relativamente sencillo obtener de una base de datos con millones de referencias, tan sólo una docena de ellas que pueden ser de máxima utilidad) y para identificar el nivel de conocimientos sobre un tema (descubriendo lagunas y aspectos apenas tratados, que pueden ofrecer pistas al investigador para iniciar nuevas líneas de trabajo). Cuando inicia un proceso de búsqueda bibliográfica de la información, el profesional no está sino intentando encontrar e identificar aquella literatura biomédica que considera pueda dar una mejor respuesta a su necesidad4. Cuanto más sistemática, organizada y planificada sea una búsqueda, sin duda serán mejores sus resultados. Por ello, puede ser oportuno seguir estas recomendaciones:
1) Identificar con claridad la necesidad de la información. Cuanto más clara y concisa sea la pregunta más posibilidades hay de obtener unos resultados satisfactorios. Ejemplos: - “Prevención de la gripe en el medio rural” (incorrecta por demasiado genérica, sería conveniente especificar los sujetos de estudio). - “Prevención de la gripe en ancianos de más de 80 años en Colmenar Viejo” (incorrecta por demasiado específica). - “Prevención de la gripe en ancianos que padezcan asma o neumonía, y tratamiento consecuente según hayan padecido o no algún trastorno cardiovascular” (incorrecta por demasiado compleja). Si la pregunta anterior se descompone en otras dos preguntas es posible que se obtengan mejores resultados: Pregunta 1. “Prevención de la gripe en ancianos con asma o neumonía” (se elimina toda alusión al tratamiento y a las complicaciones cardiovasculares). Pregunta 2. “Tratamiento de la gripe en ancianos con asma o neumonía que hayan padecido trastornos cardiovasculares” (se elimina toda alusión a la prevención para centrarse en los problemas del tratamiento, dados los antecedentes recientes de los pacientes). 2) Buscar apropiadamente. Las bases de datos suelen tener distintas coberturas temáticas (MEDLINE es genérica, pero CINAHL es específica para la enfermería), cronológicas (MEDLINE recoge información desde 1950 pero el Índice Médico Español desde 1972) o geográficas (MEDLINE, LILACS o EMBASE recogen literatura internacional pero el Índice Médico Español sólo literatura nacional). Por ello, el conocimiento de las especificidades y cobertura de cada base de datos permite buscar con mayor conocimiento y obtener los mejores resultados de cada una de ellas. 3) Formular correctamente la pregunta. También cada base de datos posee unos mecanismos y términos de interrogación distintos y lo que puede servir para consultar en una base de datos es ineficaz en otra; así, por ejemplo, en MEDLINE resulta inútil buscar por términos en castellano debiendo realizarse correctamente la búsqueda con términos en inglés. Por ejemplo, en MEDLINE habría que utilizar los términos “prevention” o “influenza” y no “prevención” o “gripe”.
¿CÓMO UTILIZAR LOS OPERADORES BOOLEANOS? La sola enumeración de los términos “prevención”, “gripe”, “anciano”, “asma” o “neumonía” tampoco garantiza el éxito de una búsqueda. Estos términos deben reagruparse de acuerdo a un orden lógico mediante la utilización de unos operadores que hagan comprensible y coherente la formulación de la pregunta tanto para el que la formula como para la base de datos. Los operadores booleanos principales son éstos: 9
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 *Formación 1108 (193-9).qxp
11/4/07
12:08
Página 195
Estrada JM. Capítulo 2: La búsqueda bibliográfica y su aplicación en PubMed-MEDLINE
Operador “Y” (AND), para la intersección de dos términos
#5
#3 Y #4
(= prevención de la gripe en ancianos que padecen asma o neumonía, o ambas enfermedades)
Ejemplo: Prevención Y Gripe
¿LENGUAJE LIBRE O LENGUAJE CONTROLADO? Gripe
Prevención Y
Con el operador “Y” se obtendrían sólo las referencias que contienen ambos términos (subconjunto central), pero no las referencias que contienen sólo uno de los términos: “prevención” (conjunto de la izquierda) o “gripe” (conjunto de la derecha). Operador “O” (OR), para la suma de dos términos Ejemplo: Asma O Neumonía
Neumonía
Asma O
Con el operador “O” se obtendrían las referencias que contienen uno de los términos, “asma” (conjunto de la izquierda); o el otro, “neumonía” (conjunto de la derecha); o ambos (subconjunto central). Operador NO (NOT), para la exclusión de un término Ejemplo: Gripe NO Niño
Niño
Gripe NO
Con el operador “NO” se obtendrían todas las referencias relativas a “gripe” (conjunto de la izquierda) en grupos de edad como “adultos” o “ancianos”, excepto en “niños”, al haberse excluido expresamente ese término (conjunto de la derecha). Por ejemplo, al cambinar los términos con criterios de orden lógico si queremos responder a la primera de las preguntas planteadas, “Prevención de la gripe en ancianos con problemas de asma o neumonía”, la estrategia de búsqueda resultante podría ser la siguiente: #1 #2 #3
Prevención Y Gripe Anciano #1 Y #2
#4
Asma O Neumonía
(= prevención de la gripe) (= prevención de la gripe en ancianos) (= asma, neumonía, o ambas enfermedades)
Una de las primeras decisiones que hay tomar en el momento de realizar una búsqueda bibliográfica es la elección del lenguaje de interrogación. Si se desea que la búsqueda sea exhaustiva, por ejemplo, con el propósito de realizar una revisión sistemática o una tesis doctoral, es preferible la realización de una búsqueda en lenguaje libre o natural, esto es, en el lenguaje cotidiano, el que los profesionales sanitarios emplean a diario en su entorno profesional. La búsqueda que nos ocupa, en lenguaje natural, podría resultar así: (Gripe Y Prevención) Y Anciano Y (Asma o Neumonía). Aún se puede ser más exhaustivo en lenguaje libre haciendo uso de los denominados caracteres de truncamiento, como puede ser el asterisco (*), que permiten localizar todos los términos que comiencen por una determinada raíz: por ejemplo, “cardio*” para identificar artículos sobre “cardiología” o “enfermedades cardiovasculares”. La búsqueda sobre “gripe”, en lenguaje libre, podría escribirse así tras aplicar los caracteres de truncamiento: (Gripe Y Preven*) Y Anciano* Y (Asma o Neumonía) Si ahora quisiéramos ejecutar esta búsqueda en lenguaje natural en la base de datos MEDLINE-PubMed, habría que traducir en primer lugar todos estos términos al inglés: (Influenza AND Prevent*) AND Old* AND (Asthma OR Pneumonia) MEDLINE-PubMed5-7 es una base de datos bibliográfica elaborada por la Biblioteca Nacional de Ciencias de la Salud de los Estados Unidos, que recoge información bibliográfica desde 1950, que supera actualmente los 16 millones de referencias, y está accesible en Internet a través de la dirección http://www.pubmed.com. En la parte superior de la página principal (fig. 1), se encuentra un rectángulo en blanco disponible para escribir y realizar cualquier consulta bibliográfica. Al escribir en dicho espacio la estrategia que nos ocupa –(Influenza AND Prevent*) AND Old* AND (Asthma OR Neumonia)– no estamos sino realizando en MEDLINE-PubMed una búsqueda en lenguaje libre. Una vez escrita la estrategia, se pulsa a su derecha el botón “Go” y se ejecuta la búsqueda, apareciendo en pantalla un total de 181 referencias (enero 2007). Por el contrario, si lo que se desea no es una búsqueda tan exhaustiva, sino más precisa y concreta, por ejemplo, con la finalidad de preparar una sesión clínica o un artículo científico, es preferible la elección del lenguaje controlado o documental. Éste es el lenguaje que utiliza 10
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 *Formación 1108 (193-9).qxp
11/4/07
12:09
Página 196
Estrada JM. Capítulo 2: La búsqueda bibliográfica y su aplicación en PubMed-MEDLINE
Fig. 1. Búsqueda en PubMed en lenguaje libre.
cada base de datos, aplicando los términos específicos (descriptores, palabras-clave o encabezamientos de materia) que emplea para definir los contenidos de sus artículos. Todos estos descriptores se recogen en una especie de diccionario especializado denominado “tesauro”, que en el caso de MEDLINE-PubMed se denomina MeSH (acrónimo de Medical Subjects Headings) 8, y está disponible en la página principal de PubMed, en una sección denominada PubMed Services. Así, si se desea buscar referencias bibliográficas relativas a “cáncer”, la consulta del término en la función MeSH Database permitirá conocer que el término que utiliza esta base de datos no es precisamente “cancer” sino “neoplasms”. La búsqueda con el tesauro MeSH puede hacerse más compleja en función de las necesidades. Por ejemplo, si se consulta en el MeSH el término “influenza”, PubMed presenta más de 50 términos relacionados con este tema, siendo el primero -“influenza, human”- el que interesa para la búsqueda (fig. 2). Al pulsar sobre el propio término “influenza, human” se desvelan los siguientes elementos: 1) Nombre del término y definición (fig. 3). 2) Relación de subencabezamientos (subheadings) o aspectos que pueden aplicarse para limitar temáticamente la
búsqueda. Así, en el caso de este término pueden aplicarse subencabezamientos como “diagnosis”, “epidemiology”, “etiology” o “prevention and control”, por poner algunos ejemplos, pudiéndose así optar por ejecutar una búsqueda más específica tan sólo en los aspectos elegidos (fig. 4). 3) Buscar como tema principal. Marcando con el ratón la opción “Restrict Search to Mayor Topic” headings only” es posible identificar referencias en las que, por ejemplo, la “gripe” (“influenza, human”) sea tema principal y no secundario, con lo cual también se puede obtener una mayor precisión en los resultados de la búsqueda. Por lo tanto, si lo que se desea es encontrar referencias sobre “prevención de la gripe como tema principal”, no hay más que dejar marcados los botones de “prevention and control” en la relación de subencabezamientos y además la opción “Restrict Search to Mayor Topic (fig. 5). Seguidamente deben seleccionarse los botones “Send to”, “Search box with AND” y “Search PubMed” para que la base de datos ejecute esta búsqueda y se puedan visualizar un total de 3.748 referencias (enero 2007) que responden a la estrategia siguiente: “influenza,human/prevention & control”[MAJR], donde “influenza,human” es el término MeSH propio de “gripe” 11
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 *Formación 1108 (193-9).qxp
11/4/07
12:09
Página 197
Estrada JM. Capítulo 2: La búsqueda bibliográfica y su aplicación en PubMed-MEDLINE
Fig. 2. Búsqueda del término “Influenza” en el tesauro MeSH.
“/” es el símbolo de aplicación de un aspecto o subencabezamiento “prevention & control” es el aspecto aplicado; y ”[MAJR]” es el acrónimo del término MeSH empleado como tema principal. Lógicamente, si se desea emplear el lenguaje controlado en la búsqueda que nos ocupa, habría que identificar uno a uno cada uno de los términos e ir localizando su equivalente en el tesauro MeSH: #1. “influenza,human/prevention & control”[MeSH] #2. “aged”[MeSH] #3. “asthma” [MeSH] #4 “pneumonia” [MeSH] Estas cuatro líneas de la estrategia de búsqueda pueden visualizarse en PubMed mediante la función “History”, situada en la barra de herramientas de la parte superior de la pantalla (fig. 6). Tan sólo queda combinarlas de forma lógica en el rectángulo blanco de consulta
búsqueda en lenguaje controlado puede proporcionar mayor precisión y eficacia. Por último, si se desea acotar la búsqueda por año de publicación (por ejemplo, desde el año 2000), por tipo de publicación (como “review”, “editorial”, “clinical trial”) o por idioma (entre ellos, “english”, “spanish”, “french” o “german”), es necesario seleccionar la función “Limits”, que se encuentra en la parte superior izquierda de la pantalla. Además, pueden gestionarse el conjunto de referencias obtenidas eligiendo en la función “Display” un formato de visualización (por ejemplo, la opción “Abstract” permite ver el resumen); seleccionando “Show” para reagrupar las referencias en el menor número posible de páginas”; o guardándolas en un archivo del ordenador mediante la combinación de las funciones “Send to” y “File”. Una vez finalizada la búsqueda, es el momento de seleccionar las referencias más oportunas y relevantes, y acudir a Internet o a una biblioteca para su localización.
#5 #1 AND #2 AND (#3 OR #4) y activar luego el botón “Go”, obteniéndose un total de 125 referencias (enero 2007), un número menor a las 181 referencias que se lograban en lenguaje libre. Esto es, la
BIBLIOGRAFÍA 1. Arranz Lázaro M. Búsquedas bibliográficas: ¿hacemos lo pertinente al buscar lo relevante? Gac Sanit. 2000;14:254-5.
12
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 *Formación 1108 (193-9).qxp
11/4/07
12:09
Página 198
Estrada JM. Capítulo 2: La búsqueda bibliográfica y su aplicación en PubMed-MEDLINE
Fig. 3. Definición del término “Influenza, Human” en el tesauro MesH.
Fig. 4. Subencabezamientos MeSH del término “Influenza, Human”.
Fig. 5. Buscando “Influenza, Human” como tema principal y sólo en el aspecto de “prevención y control”.
13
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 *Formación 1108 (193-9).qxp
11/4/07
12:09
Página 199
Estrada JM. Capítulo 2: La búsqueda bibliográfica y su aplicación en PubMed-MEDLINE
Fig. 6. Construyendo la estrategia con la función “History”.
2. Urbano C, Gascón J. Búsqueda bibliográfica: introducción y fundamentos teóricos. Aten Primaria. 1999;23:306-9. 3. Corrall CJ, Wyer PC, Zick LS, Bockrath CR. How to find evidence when you need it, part 1: databases, search programass and strategies. Ann Emerg Med. 2002;39:302-6. 4. Barroso Espadero D, Fernández Rodríguez M, Orejón de Luna G. Introducción a MEDLINE y a las búsquedas bibliográficas (I). Fundamentos sobre bibliografía médica y búsquedas. MEDLINE en Internet. PubMed y familia. Rev Pediatr Aten Primaria. 2003;5:603-28. 5. Barroso Espadero D, Orejón de Luna G, Fernández Rodríguez M. Introducción a MEDLINE y a las búsquedas bibliográficas (II).
Guía de uso de PubMed. Rev Pediatr Aten Primaria. 2004;6: 77-112. 6. Guitián González C. Guía de PubMed [consultada 12 de enero de 2007]. Disponible en : http://www.fisterra.com/recursos_web/no_ explor/pubmed/060828_pubmed.pdf 7. National Library of Medicine. PubMed tutorial [consultada 12 de enero de 2007]. Disponible en: http://www.nlm.nih.gov/bsd/pubmed_tutorial/m1001.html 8. Lowe HJ, Barnett GO. Understanding and using the medical subject headings (NeSH) vocabulary to perform literature searches. JAMA. 1994;27: 1103-8.
14
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 Formación 1129 (250-256).qxp
28/5/07
16:20
Página 250
Seoane T et al. Capítulo 3: La investigación a partir de la observación. Estudios descriptivos. Estudios analíticos
formación SOCIEMA
PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA
Capítulo 3: La investigación a partir de la observación. Estudios descriptivos. Estudios analíticos T. Seoanea, E. Martín-Sáncheza, J.L. R. Martína,b, S. Lurueña-Segoviaa,c, F.J. Alonso Morenod,f aÁrea de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla-La bUnidad de Investigación Aplicada. Hospital Nacional de Parapléjicos. Toledo. cFENNSI Group. Fundación Hospital Nacional de Parapléjicos. Toledo. dCentro de Salud Sillería. Toledo. fResponsable de Investigación de Semergen.
Mancha (FISCAM). Toledo.
El diseño de un estudio consiste en un conjunto de procedimientos, métodos y técnicas mediante las cuales el investigador selecciona la variable respuesta, define los criterios de selección de la población en estudio, calcula el número de sujetos necesarios en la(s) muestra(s) y selecciona las variables que deben medirse, con el objetivo de estimar la magnitud del efecto o de la respuesta observada, controlar los factores de confusión e interpretar los resultados. La elección del tipo de diseño dependerá fundamentalmente del objetivo del estudio, de las hipótesis planteadas y de los recursos de los que disponga el grupo de investigación. Los estudios descriptivos permiten analizar cómo son y cómo se manifiestan los fenómenos de salud y permiten al investigador detallar las características más importantes de la enfermedad o del evento en estudio. Por el contrario, los estudios analíticos pretenden encontrar las causas que ocasionan esos fenómenos y estudian la relación entre diferentes variables, generalmente entre una causa y un efecto.
The design of the study consists in a combination of procedures, methods and techniques by which the investigator selects the response variable, defines study population selection criteria, calculates the number of subjects needed in this sample(s) and selects the variables that should be measured in order to estimate the magnitude of the effect or of the response observed, to control confounding factors and interpret the results. The choice of the type of design will basically depend on the study objectives, and the hypotheses proposed and on the resources that the research group has. Descriptive studies make it possible to analyze how the health phenomena are manifested and what they are and make it possible for the investigator to detail the most important characteristics of the disease or event under study. On the contrary, analytic studies aim to find the causes of these phenomena and studied the relationship between different variables, generally between a cause and effect.
Palabras clave: diseños epidemiológicos, estudios descriptivos, estudios analíticos, cohortes, casos y controles.
Key words: epidemiological design, descriptive studies, analytic studies, cohort study, case-control study.
INTRODUCCIÓN
investigación. A partir de aquí, podemos plantearnos la siguiente cuestión: ¿qué tipo de diseño debemos utilizar para contestar de forma eficaz a la pregunta de investigación que hemos planteado? o ¿qué estrategia de las que tenemos a nuestro alcance nos conducirá a resolver nuestro objetivo? El diseño de un estudio es el conjunto de procedimientos, métodos y técnicas mediante las cuales se seleccionan los sujetos, se recoge la información, se analiza y se interpretan los resultados. La mayoría de los estudios tienen como finalidad aportar una información que sirve de apoyo a la toma de decisiones en la planificación o gestión de actividades relacionadas con la salud, aunque habitualmente cobran más interés aquellos que están dirigidos a ampliar el conocimiento científico existente sobre un tema concreto.
El proceso de investigación se genera a partir de una incertidumbre planteada en el investigador, una cuestión a la que podrá dar respuesta mediante el seguimiento de una metodología sistemática y organizada. El punto de partida, por lo tanto, es definir de forma correcta y lo más precisa posible, el objetivo perseguido con nuestra
Correspondencia: J.L. R. Martín. Jefe del Área de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla la Mancha (FISCAM). Edificio Bulevar. C/ Berna, nº 2, local 0-2. 45003 Toledo. Correo electrónico: jlrmartin@jccm.es
15
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 Formación 1129 (250-256).qxp
28/5/07
16:20
Página 251
Seoane T et al. Capítulo 3: La investigación a partir de la observación. Estudios descriptivos. Estudios analíticos
La elección del tipo de diseño ha de realizarse partiendo de un adecuado conocimiento de: – El objetivo que deseamos alcanzar. – Las ventajas y características de los diferentes tipos de estudios, primando siempre el que se adecue más a nuestro objetivo, y nos garantice mayor validez. – Los recursos humanos, económicos y de tiempo al alcance del investigador.
TIPOS DE DISEÑO1-3 Existen diferentes clasificaciones de los tipos de estudios, atendiendo a las cuestiones básicas que el investigador se plantea al definir su objetivo. Cuando el investigador persigue responder a cuestiones sobre ¿cuándo? ¿dónde? ¿quiénes? o ¿cómo?, debe plantearse la realización de un estudio descriptivo. Éstos, utilizan los datos disponibles para definir frecuencias y características de los fenómenos de salud y enfermedad; observan y describen la realidad en función de las variables de tiempo, lugar y persona. Por el contrario, si el investigador desea conocer el porqué de un determinado fenómeno, crear o evaluar hipótesis sobre la posible asociación entre el estado de salud y otras variables, necesita realizar un estudio analítico. Los estudios descriptivos pueden realizarse sobre diferentes unidades de análisis, así, cuando el investigador pretende estudiar un determinado fenómeno que aparece en un grupo de individuos (país, región, ciudad, familia, colegio, etc.), describiendo y comparando características de grupos y no de individuos, y empleando datos agregados, realizará un estudio ecológico. Normalmente, los grupos se realizan en función de criterios geográficos o temporales, permitiendo estudiar patrones de tipo geográfico o patrones estacionales y tendencias (estudios de series temporales). Cuando la unidad de análisis es el individuo, podemos estudiar una o varias variables y describir la relación entre ellas siguiendo dos diseños fundamentales: estudios longitudinales, en los que se describe la evolución temporal de determinadas características observadas en un grupo de sujetos, existiendo una secuencia temporal definida pero no una relación causa-efecto entre las variables (seguimiento de una cohorte), o estudios transversales, en los que no existe un lapso de tiempo entre las diferentes variables descritas, sino que se presentan simultáneamente en el momento de realizar el estudio (serie de casos transversales). Los estudios analíticos estudian la relación entre diferentes variables, generalmente entre una causa (por ejemplo, un determinado factor de riesgo), y un efecto (la enfermedad). La muestra sobre la que vamos a realizar nuestro estudio ha de tener una relación con la causa o factor que deseamos estudiar. De este modo, puede ser el investigador el que decida cuáles y cuántos de los sujetos de su muestra estarán expuestos al factor de estudio, controlando por tanto, la asignación, o puede trabajar con muestras en las que el investigador no ha intervenido ni ha controlado de ningún modo el factor de
exposición. En el primer caso, estaríamos hablando de estudios experimentales o de intervención, los cuales, por razones éticas, sólo nos permiten estudiar factores de exposición o intervenciones de carácter terapéutico, preventivo o rehabilitador. Es el caso de los ensayos clínicos, ensayos de campo y ensayos de intervención comunitaria. Cuando el investigador no controla la asignación, hablamos de estudios observacionales, en los que la exposición puede venir impuesta (sexo, edad), ser escogida por los propios sujetos (consumo de tabaco), o ser decidida por el profesional sanitario como parte del proceso habitual de atención sanitaria, sin finalidad deliberada de investigación (haberse sometido a una resonancia magnética nuclear). Cuando se desea demostrar relaciones de tipo causal, es necesario conocer el orden en el que se producen los acontecimientos en el tiempo, por lo que lo conveniente es emplear estudios longitudinales. Éstos permiten estudiar la asociación entre la causa y el efecto de una manera direccional: hacia delante (desde la causa, al efecto), seleccionando los sujetos en función de la exposición y evaluando la aparición del efecto –estudios de cohortes–, o hacia atrás (desde el efecto a la causa), seleccionando sujetos en función de que presenten o no el efecto, y evaluando a cuál de ellos estuvieron expuestos –estudios de casos y controles–. Los estudios en los que la exposición y el efecto se evalúan simultáneamente, sin direccionalidad, se denominan estudios transversales. Por último, la relación temporal existente entre el momento en el que se produjeron los hechos que vamos a analizar y el momento en el que se realiza el estudio, permiten realizar una clasificación de los diseños en históricos o retrospectivos, si estudian hechos ocurridos antes del inicio del estudio, concurrentes o prospectivos, si sólo estudian eventos producidos después del inicio del estudio, o mixtos o ambispectivos, si estudian ambos. Esta decisión puede influir en la validez de la información recogida, cuando, por ejemplo, los registros de datos existentes para realizar un estudio retrospectivo no son fiables, o en estudios prospectivos, cuando no se dispone de medios suficientes para recoger adecuadamente todos los eventos que se producen a partir del inicio del estudio (fig. 1).
ESTUDIOS DESCRIPTIVOS Se utilizan para describir la frecuencia, distribución y características más importantes de un determinado problema de salud en una población (o en varias). Este tipo de estudios permiten describir la asociación entre dos o más variables sin establecer relación causal entre ellas, por lo que constituyen un punto de partida para generar hipótesis que deberán ser comprobadas posteriormente mediante estudios analíticos, identificando posibles factores de riesgo o de protección para determinadas enfermedades. Por ejemplo, la evidencia sobre las estrategias de prevención y control de las enfermedades cardiovasculares en España procede de estudios sobre las variaciones geográficas de la mortalidad
16
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 Formación 1129 (250-256).qxp
28/5/07
16:20
Página 252
Seoane T et al. Capítulo 3: La investigación a partir de la observación. Estudios descriptivos. Estudios analíticos
OBJETIVO DEL ESTUDIO
¿Quiénes? ¿Dónde? ¿Cuándo? ¿Cómo?
¿Por qué? Confirmación ESTUDIOS ANALÍTICOS HIPÓTESIS
ESTUDIOS DESCRIPTIVOS ¿Controla el investigador la asignación de la exposición en estudio?
Planteamiento ¿Unidad de análisis?
POBLACIÓN
INDIVIDUO
NO
ESTUDIOS ECOLÓGICOS
ESTUDIOS LONGITUDINALES
ESTUDIOS OBSERVACIONALES
PRUEBAS DIAGNÓSTICAS ESTUDIOS DE CONCORDANCIA
ESTUDIOS TRANSVERSALES
Estudios transversales analíticos
SÍ
¿Criterio de formación de grupos?
Exposición
Efecto
COHORTES
CASOS Y CONTROLES
ASOCIACIÓN CRUZADA SERIE DE CASOS TRANSVERSALES
ESTUDIOS EXPERIMENTALES
ENSAYO CLÍNICO ENSAYO COMUNITARIO ENSAYO DE CAMPO
ESTUDIOS HÍBRIDOS
Figura 1. Tipos de estudios.
por esta enfermedad, los cambios experimentados en cada comunidad autónoma a lo largo del tiempo y los estudios descriptivos realizados en emigrantes que ingresan en una comunidad, adoptando sus hábitos de vida y sus tasas de mortalidad cardiovascular. Resultan especialmente útiles cuando se tienen pocos datos del problema de salud que estamos estudiando, y para obtener información que permita dirigir adecuadamente ciertos campos de la investigación y actuación sanitaria. Así, por ejemplo, estudios descriptivos ayudan a identificar grupos de población más vulnerables a una determinada patología, aportando a la administración sanitaria información para distribuir eficazmente los recursos disponibles (distribución gratuita de vacuna contra la gripe entre el personal sanitario y sujetos mayores de 65 años). Los principales tipos de estudios descriptivos, son los siguientes: – Estudios ecológicos: son estudios descriptivos en los que la unidad de análisis es la población, y en los que,
tanto la variable resultado como la exposición son medidas agregadas. Estos estudios no miden niveles de exposición individual o la información sobre la exposición no se vincula con la frecuencia de la enfermedad a nivel individual. Según el criterio de agrupamiento seguido, podemos encontrarnos estudios ecológicos con diseño multi-grupo (comparación de tasas de enfermedad entre muchas regiones en un mismo período, estudios de la asociación entre un nivel de exposición medio y la tasa de una enfermedad entre diversos grupos), estudios ecológicos de tendencias temporales (comparación de tasas en el tiempo de una población definida geográficamente), o diseños mixtos (incluyen tanto el componente espacial, como el temporal). Estos estudios resultan especialmente útiles no sólo por su bajo coste, sino para resolver situaciones en las que, por ejemplo, encontramos limitaciones a la hora de tomar medidas individuales o definir diseños individuales. Generalmente, están dotados de una buena validez externa, permitiendo extrapolar los resultados obtenidos de una población a cada individuo de la misma. Si estos resulta-
17
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 Formación 1129 (250-256).qxp
28/5/07
16:20
Página 253
Seoane T et al. Capítulo 3: La investigación a partir de la observación. Estudios descriptivos. Estudios analíticos
dos no coinciden, estaríamos cometiendo el sesgo o falacia ecológica. – Estudios longitudinales: estudios en los que se describe la evolución temporal de una o más características observadas en un grupo de sujetos. No evalúan relaciones causales, aunque sí existe una relación temporal definida entre las variables estudiadas. Es el caso de la descripción de la historia natural de una enfermedad o el seguimiento de una cohorte. Estos estudios permiten medir la incidencia4. – Estudios transversales: estudian de forma simultánea varias variables (exposición y evento), recogiendo los datos en un momento determinado, como si tomáramos una foto instantánea de un grupo de sujetos mediante los registros de información sobre la enfermedad y la exposición. No permiten conocer una secuencia temporal, y generalmente se realizan para conocer la prevalencia4 o proporción de individuos que presentan una característica concreta –estudios de prevalencia y asociación cruzada–. También se encuadran en este tipo de estudios las series de casos transversales, que describen características de una enfermedad presente en uno o varios pacientes con diagnóstico similar, permitiendo generar nuevas hipótesis o mantener la vigilancia epidemiológica; igualmente, se incluyen otros como los estudios de concordancia y las pruebas diagnósticas. Como ejemplo, la descripción en 1981 en Los Ángeles de cinco casos de neumonía por Pneumocystis carinii en hombres homosexuales previamente sanos constituye una serie de casos que presentaban un síntoma común, y resultaron ser los primeros casos documentados de infección por el virus de la inmunodeficiencia humana (VIH). Un estudio de prevalencia sería determinar los casos de portadores del virus del sida en el año 2006 en España. Si estudiamos durante un período de tiempo determinado el número de casos nuevos de portadores del virus del sida estaríamos realizando un estudio de incidencia. Si describiéramos el porcentaje de mortalidad por el VIH-SIDA en España, estaríamos realizando un estudio ecológico.
ESTUDIOS ANALÍTICOS Hablamos de realización de un estudio analítico cuando evaluamos la posible relación causal existente entre un factor (factores de riesgo, tratamientos preventivos o curativos), y un efecto o una respuesta (enfermedad). Por este motivo, resultan de especial importancia, en este tipo de estudios, las medidas de asociación y la interacción. En la mayoría de los casos, la distribución de la enfermedad está asociada a ciertas variables (en su génesis) pero existe, a su vez, un número de variables que dificultan el análisis de la relación causal. La relación que tienen los sujetos en estudio con el factor que deseamos estudiar permite establecer dos grupos claramente diferenciados en este tipo de estudios; cuando el investigador controla el factor de estudio y decide qué sujetos recibirán la intervención y de qué forma, siguien-
do un protocolo preestablecido, hablaríamos de estudios experimentales, que por definición presentan carácter prospectivo (estos estudios se analizarán en el siguiente capítulo). Si el investigador se limita a observar, medir y analizar ciertas variables de los sujetos, sin controlar de ninguna manera el factor de estudio, se trataría de estudios observacionales. Existen dos tipos principales de estudios analíticos observacionales: – Estudios de cohortes. – Estudios de casos y controles. Estudios de cohortes (o de seguimiento)1,5,6 Una cohorte es un grupo de sujetos que comparten una característica común, y que evolucionan juntos a lo largo del tiempo. En epidemiología, la característica común de los sujetos de una cohorte es la presencia o ausencia de un determinado factor, que es objeto de nuestro estudio (factor de exposición). Esta característica permite clasificar a los sujetos que intervienen en el estudio según el grado de exposición en “no expuestos”, “poco expuestos” y “muy expuestos”. Generalmente el investigador clasifica a los pacientes en dos cohortes: la cohorte de expuestos y no expuestos (fig. 2). El factor de exposición puede definirse de múltiples formas, por ejemplo, pertenecer a un área geográfica determinada (estudio de Framingham)7; una cohorte ocupacional, definida como un conjunto de individuos con cierta ocupación o trabajo que se clasifican según el grado de exposición a un factor de riesgo; o características innatas al sujeto, como una determinada fecha de nacimiento o una alteración genética. Lo más deseable en este tipo de estudios es que las dos cohortes (expuestos y no expuestos) sean lo más similares posible, y la diferencia principal entre ellas radique en la exposición, ya que el investigador no controla ni el factor en estudio ni otros factores o variables que podrían estar asociados a la ocurrencia del evento. Supongamos un estudio sobre intoxicación en una fábrica de pinturas, donde los individuos expuestos tienen edades comprendidas entre 18 y 45 años, si el investigador desea seleccionar el grupo de comparación, es decir la cohorte de no expuestos, entre los trabajadores de las oficinas de dicha fábrica
TIEMPO POBLACIÓN Expuestos
Enfermos No enfermos
MUESTRA No expuestos
Enfermos No enfermos
Figura 2. Esquema estudio de cohortes.
18
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 Formación 1129 (250-256).qxp
28/5/07
16:20
Página 254
Seoane T et al. Capítulo 3: La investigación a partir de la observación. Estudios descriptivos. Estudios analíticos
(que no están en contacto con los productos tóxicos) deberá elegir una cohorte que pertenezca al mismo grupo de edad que los expuestos. Si los individuos de ambos grupos no son comparables, estaríamos cometiendo un sesgo de selección8. La forma de evitarlo es establecer criterios de selección y exclusión estrictos, que aseguren que los sujetos de ambos grupos tengan la misma probabilidad de presentar el evento. Por este motivo, es importante la selección del grupo control (no expuestos). Cuando la población en estudio está constituida por una mezcla de personas expuestas y no expuestas, las comparaciones se realizan dentro de la propia población, estableciendo comparación interna (fumadores frente a no fumadores de la Comunidad de Madrid). Otra posibilidad es definir la cohorte expuesta y que el investigador seleccione una cohorte no expuesta de características similares, estableciendo una comparación externa (técnicos de radiodiagnóstico frente a técnicos de anatomía patológica). Se trata de grupos de sujetos seleccionados de forma independiente que no constituyen una cohorte o población general. Cuando el investigador identifica y sigue a una cohorte expuesta, y compara la frecuencia de aparición de la enfermedad con la observada en la población general, se dice que realizamos estudios de comparación con la población general (fumadores de la Comunidad de Madrid frente al total de la población de esta comunidad). Otra posible causa de sesgo de selección en estos estudios son las pérdidas de pacientes durante el seguimiento. Si los sujetos abandonan el estudio por variables relacionadas con el factor de exposición o con la variable respuesta, los resultados estarían sesgados. Los estudios de cohortes también pueden verse afectados por el sesgo de información, debido a errores en la medida. Se produce cuando la vigilancia para detectar la enfermedad sobre los sujetos expuestos y no expuestos es diferente. Igualmente, el hecho de que el investigador conozca si el individuo está expuesto o no puede influir en el diagnóstico de la enfermedad. Respecto a la relación temporal existente entre el inicio del estudio y el momento en el que se presenta el desenlace de interés (enfermedad, muerte), el investigador se encuentra, principalmente, con dos situaciones:
Tabla 1. Tabla 2 ⴛ 2 en los estudios de cohortes Sanos
a c
b d
tos), y los sigue durante un período de tiempo para evaluar la ocurrencia del evento, determinando la incidencia del desenlace de interés en cada uno de los grupos. Este tipo de diseño se denomina estudio de cohortes prospectivo. 2. Que tanto la exposición, como el evento, ya hayan ocurrido en el momento del inicio del estudio. El seguimiento de los sujetos se reconstruye a través de registros históricos, por lo que se necesitan fuentes de información válidas y fiables para obtener datos tanto sobre la exposición, como sobre el evento. Se denomina estudio de cohortes retrospectivo o cohortes históricas. Los estudios analíticos pretenden medir la relación o fuerza de asociación existente entre el factor de exposición y la causa estudiada, para ello emplean las medidas de asociación. Los estudios de cohortes pueden aportarnos información, por una lado, sobre la incidencia o número de casos nuevos de la enfermedad en el grupo de expuestos y de no expuestos, y por otro lado, nos dan una medida de la magnitud de la asociación entre el factor de exposición y la variable respuesta. Supongamos que la incidencia de determinada enfermedad al finalizar el estudio es mayor en el grupo de expuestos que en el grupo de los no expuestos. Podemos, entonces, concluir que existe asociación estadística entre el factor de exposición y la incidencia de la enfermedad. Esta asociación se cuantifica y se denomina riesgo relativo (RR), que estima el riesgo de los sujetos expuestos a presentar la enfermedad en relación a los no expuestos. Otras medidas de asociación para este tipo de estudios son el riesgo atribuible, que se define como la diferencia entre la incidencia en expuestos y no expuestos, y la fracción de riesgo atribuible o proporción de casos de la enfermedad que son debidos a la exposición, y se calcula como RR-(1/RR)*100 (tabla 1). Riesgo relativo =
1. Que el evento no haya ocurrido en el momento en el que se inicia el estudio. En este caso, el investigador forma dos grupos de sujetos (expuestos y no expues-
Enfermos
Expuestos No expuestos
a/(a + b) Incidencia expuestos = c/(c + d) Incidencia no expuestos
Las principales ventajas y limitaciones que aporta este tipo de estudios, se resumen en la tabla 2.
Tabla 2. Principales ventajas y limitaciones de los estudios de cohortes Ventajas
Diseños útiles para el estudio de exposiciones raras Permiten estudiar varios efectos de una misma exposición Permiten conocer la relación o secuencia temporal entre causa y evento Sirven para medir incidencia
Limitaciones
No sirven para el estudio de enfermedades raras ni con un largo período de latencia El seguimiento de cohortes prospectivas es costoso en tiempo y en dinero En cohortes retrospectivas, la validez está afectada por la fiabilidad de las fuentes disponibles Validez interna limitada por los sesgos de selección e información
19
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 Formación 1129 (250-256).qxp
28/5/07
16:20
Página 255
Seoane T et al. Capítulo 3: La investigación a partir de la observación. Estudios descriptivos. Estudios analíticos
Estudios de casos y controles1,9,10 En este tipo de diseño la selección de la población de estudio se basa en la presencia o ausencia del evento en estudio (enfermedad). El investigador forma dos grupos de individuos: los casos, o conjunto de individuos con la enfermedad o variable de interés y los controles, o conjunto de sujetos libres de dicha enfermedad o variable y, posteriormente, investigará sobre la exposición en ambos grupos. Todos los datos correspondientes a la exposición son recogidos a posteriori, lo que constituye un riesgo de que los sujetos aporten, intencionadamente o no, una información errónea. Éste es el denominado sesgo de memoria (fig. 3). Es especialmente importante el establecimiento de criterios específicos para la definición tanto de los casos como de los controles. Para seleccionar los casos, la enfermedad o evento tiene que estar correctamente definida, valorando todos los posibles criterios de inclusión; además, es conveniente tener en cuenta que este grupo incluya sujetos que potencialmente hayan podido estar expuestos al factor estudiado. El grupo de los controles debe ser comparable al de los casos, es decir, ambos grupos deben ser homogéneos respecto a ciertas características, por ejemplo el sexo, la edad, su lugar de residencia y presentar la misma probabilidad que éstos de haber estado expuestos. Hay que tener en cuenta que el grupo control debe ser representativo de la población de la que proceden los casos, eligiendo un grupo que pertenezca a la misma población de referencia, o a una con características similares. Por ejemplo, si se identifican como casos a los sujetos diagnosticados de cáncer de pulmón en un hospital durante un año, sería conveniente seleccionar el grupo control entre la población atendida en dicho hospital que no fue diagnosticada de dicha enfermedad. Cuando la selección de los dos grupos no es correcta, se produce sesgo de selección8. En los casos en los que la exposición está asociada a una mayor probabilidad de que se detecte la enfermedad, el estudio también podría resultar sesgado (sesgo de detección). Es el caso de tratamientos farmacológicos que requieren un seguimiento médico. Los sujetos sometidos a estos tratamientos estarán sometidos a mayor
Tabla 3. Tabla 2 ⴛ 2 en los estudios de casos y controles
Expuestos No expuestos
Casos
Controles
a c
b d
POBLACIÓN Expuestos No expuestos
Casos TIEMPO
Expuestos
Controles
No expuestos
Figura 3. Esquema estudio de casos y controles.
vigilancia médica, y por tanto, la probabilidad de diagnosticar la enfermedad será mayor en los casos que en los controles. En los estudios casos-control se analiza la relación entre el factor o factores de riesgo y la enfermedad comparando la frecuencia de exposición entre los casos y los controles, permitiendo así investigar asociaciones entre una exposición y una enfermedad. Esta asociación se cuantifica con el cociente de odds o la odds ratio (OR), que compara la odds de una exposición a un factor de riesgo (número de expuestos con respecto al número de no expuestos) entre los casos y los controles. La OR se define como una estimación del riesgo, la razón de odds de desarrollar una enfermedad. Permite comparar el nivel de exposición en los enfermos (casos) con el equivalente en los controles (no enfermos). Si aplicamos formulación matemática, se convierte en razón de productos cruzados (tabla 3). OR =
Oddsexp/casos a/c a×d = = Oddsexp/controles b/d b×c
La OR puede tomar los siguientes valores: – OR superior a 1: la exposición en los casos es más frecuente que en los controles, por lo que el factor de exposición se comporta como un factor de riesgo para la aparición de la enfermedad en estudio. – OR igual a 1: no existe asociación entre el factor y la enfermedad estudiados. – OR inferior a 1: la exposición ha sido más frecuente en el grupo control que no ha enfermado, por lo que el factor en estudio ha actuado como factor de protección. Las principales ventajas y limitaciones de este tipo de estudios, se resumen en la tabla 4.
Tabla 4. Principales ventajas y limitaciones de los estudios de casos y controles Ventajas
Requieren menos recursos económicos y de tiempo para su realización Especialmente útiles en enfermedades raras, o con un largo período de latencia Permiten analizar en un mismo estudio varios factores etiológicos de la enfermedad
Limitaciones
Resultan ineficientes para exposiciones raras No permiten calcular medidas de incidencia de la enfermedad La relación temporal entre la causa y el efecto puede resultar difícil de establecer Suelen estar afectados por los sesgos de selección y memoria
20
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
07 Formación 1129 (250-256).qxp
28/5/07
16:20
Página 256
Seoane T et al. Capítulo 3: La investigación a partir de la observación. Estudios descriptivos. Estudios analíticos
BIBLIOGRAFÍA 1. Argimon JM, Jiménez J. Objetivo del estudio. En: Edide SL, editor. Métodos de investigación clínica y epidemiológica. 3ª ed. Madrid: Elsevier. p. 125-31. 2. Ahlbom A, Norell S. Introduction to modern epidemiology. 2ª ed. Boston: Epidemiology Resources Inc.; 1990. 3. Rothman KJ, Greenland S. Types of epidemiologic studies. En: Rothman KJ, Greenland S, editors. Modern epidemiology. 2ª ed. Philadelphia: Lippincott Raven Publisher; 1998. p. 67-78. 4. Tapia Granados JA. Medidas de prevalencia y relación incidenciaprevalencia. Med Clin (Barc). 1995;105:216-8. 5. Cummings SR, Newman TB, Hulley SB. Designing an observational study: cohort studies. En: Hulley SB, Cummings SR, Browner WS, Grady D, Hearst N, Newman RB, editors. Designing clinical research: An epidemiologic approach. 2ª ed. Philadelphia: Lippincott Williams & Wilkins; 2001. p. 95-105.
6. Organización Internacional del Trabajo. Enciclopedia de salud y seguridad en el trabajo. 3ª ed. Ministerio de Trabajo y Asuntos Sociales; 2001. Disponible en: http://www.mtas.es/insht/EncOIT/Index.htm 7. Dawber TR. The Framingham Study; The epidemiology of atherosclerotic disease. Cambridge: Harvard University Press; 1980. 8. Martín JLR, Tobias A, Seoane T, editores. Revisiones sistemáticas en las ciencias de la vida: el concepto salud a través de la síntesis de la evidencia científica. 1ª ed. Toledo: Fundación para la Investigación Sanitaria en Castilla-La Mancha (FISCAM); 2006. 9. Newman TB, Browner WS, Cummings SR, Hulley SB. Designing an observational study: cross-sectional and case-control studies. En: Hulley SB, Cummings SR, Browner WS, Grady D, Hearst N, Newman RB, editors. Designing clinical research: an epidemiologic approach. 2ª ed. Philadelphia: Lippincott Williams & Wilkins; 2001. p. 95-105. 10. Lasky T, Stolley PD. Selection of cases and controls. Epidemiol Rev. 1994;16:6-17.
21
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 FC (296-304).qxp
6/7/07
09:35
Página 296
Martín-Sánchez E et al. Capítulo 4: El ensayo clínico. Metodología de calidad y bioética
formación SOCIEMA
PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA
Capítulo 4: El ensayo clínico. Metodología de calidad y bioética E. Martín-Sáncheza, J.L. R. Martína,b, T. Seoanea, S. Lurueña-Segoviaa,c y F.J. Alonso Morenod,e aÁrea de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla-La bUnidad de Investigación Aplicada. Hospital Nacional de Parapléjicos. Toledo. España. cFENNSI Group. Fundación Hospital Nacional de Parapléjicos. Toledo. España. dCentro de Salud Sillería. Toledo. España. eResponsable de Investigación de Semergen.
Mancha (FISCAM). Toledo. España.
Los estudios analíticos permiten estudiar y verificar hipótesis causales, y los ensayos clínicos, en particular, aportan el mayor nivel de evidencia en la comprobación de estas hipótesis. Un ensayo clínico aleatorio (ECA) es un experimento planificado en el que, de forma prospectiva, se comparan dos o más intervenciones preventivas, curativas o rehabilitadoras, que son asignadas de forma individualizada y aleatoria a un grupo de pacientes para estudiar el efecto de estas intervenciones en el hombre. Para su realización es necesario tener en cuenta una serie de aspectos metodológicos, como la elección de la muestra de sujetos a partir de unos adecuados criterios de selección, asignación aleatoria de los sujetos a los diferentes grupos de intervención, elección del grupo control, enmascaramiento o cegamiento de algunos o todos los sujetos que intervienen en el estudio, y descripción de pérdidas y abandonos para un correcto análisis de los datos. Las características de este tipo de estudios, realizados sobre humanos, implican la necesidad del cumplimiento de unos requisitos éticos y legales que protejan a los participantes, motivo por el cual es imprescindible la obtención de un consentimiento informado, así como el informe favorable de un Comité Ético de Investigación Clínica para su realización.
Analytic studies make it possible to study and verify causal hypotheses and clinical studies, specifically contribute the greatest level of evidence in the verification of these hypothesis. A randomized clinical trial (RCT) is a planned experiment in which two or more preventive, curative or rehabilitating interventions, assigned in an individualized and random way to a group of patients to study the effect of these interventions in man, are compared. To do so, a series of methodological aspects must be taken into account, such as the choice of the subject sample based on adequate screening criteria, random allotment of the subjects to the different intervention groups, choice of the control group, masking or blinding of some or all the subjects participating in the study and description of losses and dropouts for correct analysis of the data. The characteristics of the type of study, conducted in humans, imply the need for the fulfillment of some ethical and legal requirements that protect the participants, reason why it is essential to obtain an informed consent and favorable report from the Ethics Committee for its conduction.
Palabras clave: estudios experimentales, ensayos clínicos, Atención Primaria.
Key words: experimental studies, clinical trials, Primary Health Care.
INTRODUCCIÓN: IMPORTANCIA DE LOS ESTUDIOS EXPERIMENTALES EN LA INVESTIGACIÓN CLÍNICA Correspondencia: J.L. R. Martín. Área de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla la Mancha (FISCAM). Edificio Bulevar. C/ Berna, n.º 2, local 0-2. 45003 Toledo. Correo electrónico: jlrmartin@jccm.es
El objetivo de toda labor de estudio e investigación, en general, es ampliar los conocimientos existentes sobre un tema y llegar a conclusiones válidas que aporten alternativas, y en el mejor de los casos, mejoras, sobre los conocimientos existentes a priori. La investigación clínica, en particular, pretende resolver cuestiones planteadas en cada una de las etapas del proceso asistencial, con el obje-
22
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 FC (296-304).qxp
6/7/07
09:35
Página 297
Martín-Sánchez E et al. Capítulo 4: El ensayo clínico. Metodología de calidad y bioética
tivo de mejorar la práctica clínica diaria y la calidad de la atención prestada a los pacientes. A partir de este objetivo, los diversos estudios epidemiológicos realizados por los investigadores aportan diferentes niveles de conocimiento ante cada una de las cuestiones planteadas. Los estudios analíticos, tal como se indicó en el capítulo anterior, estudian la relación existente entre diferentes variables, permitiendo establecer relaciones causales1. Dentro de éstos, los estudios experimentales, al ser el investigador el que controla el factor de estudio y el resto de condiciones que rodean a la investigación, se consigue disminuir la posibilidad de que otros factores influyan sobre los resultados, y, por tanto, proporcionan una mayor confianza sobre la veracidad de las conclusiones obtenidas. En otras palabras, los estudios experimentales, y de forma más específica los ensayos clínicos aleatorios (ECA), aportan un nivel más alto de evidencia2 que el resto de diseños epidemiológicos descritos, encabezando las listas de cualquier clasificación de la calidad de la evidencia. La importancia de este diseño en el campo de la biomedicina se aprecia, por ejemplo, al observar que la mayoría de las recomendaciones terapéuticas y guías de práctica clínica se basan en las pruebas proporcionadas por ECA, o que las autoridades sanitarias obligan a la realización de un ECA para demostrar la eficacia y seguridad de un nuevo fármaco antes de su comercialización. Constituyen el tipo de diseño que nos acerca, de forma más directa, a la noción de causalidad entre una intervención y unos resultados concretos. El diseño experimental más importante es el ECA, sobre el que hablaremos durante todo este capítulo, pero también existen otros tipos de estudios experimentales. La prueba o ensayo de campo se realiza sobre sujetos sanos, que aún no han adquirido la enfermedad, o sobre sujetos que están en riesgo de adquirirla, y estudia factores preventivos, como es el caso de la administración de vacunas, o el seguimiento de dietas. Generalmente se utilizan para el estudio de enfermedades muy frecuentes, o muy graves. La intervención se realiza de forma individual, y por tanto los sujetos son aleatorizados de forma individual a los diferentes grupos de estudio. La información se recoge sobre la comunidad misma, en el ambiente epidemiológico natural de los sujetos, sin necesidad de una institución cerrada específica para realizar el estudio. Los ensayos comunitarios o de intervención3 son estudios experimentales que se emplean para probar hipótesis. Se realizan, al igual que el ECA, sobre un grupo experimental y uno de control, aunque la diferencia con éste radica en que los grupos de intervención y control no son individuos elegidos al azar, sino comunidades completas. De este modo, la asignación a los grupos no es aleatoria, sino que se eligen comunidades enteras por razones de conveniencia del investigador, o de las autoridades interesadas en el estudio. Son diseños buenos para probar hipótesis de intervenciones educativas, para evaluar sistemas de gestión y organización de la atención médica, o para abordar enfermedades crónicas no transmisibles asociadas a condiciones socioculturales o a estilos de vida.
Tabla 1. Condiciones básicas de un ensayo clínico aleatorio La única razón por la que los sujetos reciben la intervención en estudio es el cumplimiento del protocolo del estudio La asignación de la intervención a una serie de sujetos, denominados grupo de intervención, se lleva a cabo por mecanismos debidos al azar En el estudio existe una serie de sujetos denominados grupo control, que no reciben la intervención cuyo efecto se desea analizar
EL ENSAYO CLÍNICO ALEATORIO: FASES Un ECA es un experimento planificado en el que, de forma prospectiva, se comparan dos o más intervenciones preventivas, curativas o rehabilitadoras, que son asignadas de forma individualizada y aleatoria a un grupo de pacientes, con el objetivo de estudiar la eficacia y/o seguridad de dichas intervenciones en el hombre4. Tanto la selección de los sujetos como los períodos de tratamiento y seguimiento han de tener lugar simultáneamente en todos los grupos (grupos de intervención y grupos control). En la tabla 1 se resumen las condiciones básicas de un ECA. Cuando la intervención estudiada es un nuevo fármaco que se pretende introducir en el mercado, ha de superar un complejo proceso que requiere gran cantidad de recursos y tiempo hasta obtener la aprobación de las agencias reguladoras de cada país3. En primer lugar, los compuestos pasan por una fase de investigación preclínica, durante la cual se realizan estudios de laboratorio y en animales para detectar actividad biológica ante una determinada enfermedad, y realizar una evaluación previa de su seguridad. Si el fármaco logra superar satisfactoriamente esta fase, y cuenta con el permiso de las autoridades sanitarias para estudiar el producto en humanos, pasaría a la etapa de desarrollo clínico. Dentro de esta etapa el fármaco pasará por cuatro fases. Durante la fase I se realizan estudios no controlados en los que el producto se administrará a voluntarios sanos para estudiar el perfil de seguridad del fármaco, los rangos de seguridad de la dosificación y algunos datos farmacológicos relativos a la absorción, distribución, metabolización, excreción y duración de su acción. En esta fase también se realiza la denominada prueba de concepto, para determinar si existen indicios razonables de que el fármaco puede ser eficaz para la indicación seleccionada. Si el fármaco se considera razonablemente seguro para el hombre pasará a la fase II, donde se realizarán estudios no controlados y ECA controlados con placebo. El fármaco de administrará a un número mayor de voluntarios (pacientes potenciales o voluntarios sanos) con la finalidad de confirmar la seguridad, evaluar la eficacia en humanos a corto plazo y determinar algunos parámetros farmacocinéticos y farmacodinámicos como la dosificación, para ensayos posteriores. Una vez probada la eficacia a corto plazo el fármaco pasa a la fase III, donde se determinará la eficacia y seguridad a medio plazo, evaluando la relación beneficio/riesgo en comparación con otras alternativas terapéuticas disponibles, mediante la realización de ECA sobre muestras de
23
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 FC (296-304).qxp
6/7/07
09:35
Página 298
Martín-Sánchez E et al. Capítulo 4: El ensayo clínico. Metodología de calidad y bioética
1.000 a 3.000 pacientes. Si el fármaco logra superar todas estas fases se lanza al mercado, y a partir de aquí entraría en una fase IV, donde se realizan ECA y estudios observacionales para obtener un mayor conocimiento sobre su perfil de seguridad, sobre nuevas indicaciones o vías de administración, y sobre su eficacia real en las condiciones habituales de uso.
METODOLOGÍA DEL ENSAYO CLÍNICO Selección de los participantes y tamaño de la muestra El sujeto o participante de un ECA es la persona sana o enferma que participa en el mismo después de haber otorgado libremente su consentimiento informado. Los motivos por los que un sujeto decide participar libremente en un ECA pueden ser muy variados: por la oportunidad de contribuir al avance de la ciencia y el beneficio de la colectividad, por tener un acceso preliminar a medicamentos nuevos, para obtener acceso a médicos y especialistas de prestigio, o para recibir la información y la estrecha atención médica que no cubre su plan de seguro. A la hora de seleccionar a los participantes hay que tener en cuenta, por un lado, cuál es la población diana sobre la que se desean extrapolar los resultados de nuestro estudio, y por otro, cómo seleccionar la población experimental sobre la que se realizará el estudio, una población definida por una serie de criterios especificados a priori. Es muy importante el establecimiento de unos adecuados criterios de inclusión, que definirán el perfil de los sujetos susceptibles de participar en el estudio y los más adecuados para el objetivo de éste (sexo, edad, lugar de residencia, patologías actuales o pasadas, medicación actual, etc.). Estos criterios permiten definir una población homogénea sobre la que la intervención estudiada estaría igualmente indicada y potencialmente podría suponer el mismo nivel de riesgo o de beneficio. Además, es preciso establecer unos criterios de exclusión, que impidan participar en el estudio a sujetos en los que una de las alternativas de intervención pueda ser preferible a la otra, o aquellos en los que cualquiera de las intervenciones pueda estar contraindicada, pueda presentar interacciones, o presenten alguna característica que pueda comprometer la participación en el estudio o afectar a la variable de interés. Es conveniente, a la hora de definir los criterios de selección de los participantes4,5, alcanzar un buen equilibrio entre unos criterios de selección estrictos, que conducirían a una muestra muy homogénea, aumentando la validez interna del estudio, o unos criterios más laxos, más amplios, que permiten seleccionar una muestra más representativa de la población diana y, por tanto, una mayor posibilidad de generalizar los resultados obtenidos (mayor validez externa). Criterios muy estrictos hacen que la muestra de nuestro estudio se aleje de la población general y que limite la capacidad de extrapolar los resultados al resto de sujetos que son potenciales pacientes susceptibles de recibir la intervención en el futuro. Sin embargo, criterios muy amplios, al conducir a muestras más heterogéne-
as hacen que sea más difícil detectar respuestas significativas al tratamiento, y requieren experimentar sobre muestras de sujetos más amplias. En la figura 1 se muestran las etapas de la elaboración de un ECA. La determinación de un tamaño muestral adecuado pretende dotar a la muestra del poder estadístico suficiente para que si existen diferencias no debidas al azar entre los dos grupos sean detectadas. Para ello, además de tener en cuenta la homogeneidad de las poblaciones participantes, es necesario valorar la cuantía de las diferencias que se pretende poner de manifiesto, los errores de tipo I y II que se consideran aceptables y la proporción esperada de pacientes que abandonarán el estudio. En el capítulo siguiente de esta serie de investigación se tratará con más detalle cómo calcular tamaños muestrales. Asignación aleatoria. Sesgo de selección La aleatorización de los sujetos a los grupos de intervención define y diferencia el ECA de otros diseños epidemiológicos, como los estudios de cohortes. Consiste en la asignación de los sujetos participantes a los diferentes grupos de intervención por un mecanismo únicamente debido al azar, de modo que ni el investigador ni el sujeto pueden influir ni conocen el grupo al que son asignados1,4. Es la única herramienta metodológica que, teóricamente, permite una distribución equilibrada de las características de los pacientes a los grupos de tratamiento, generando grupos comparables respecto a cualquier condición conocida o no –variables de confusión– que pudiera afectar al desenlace de interés, de modo que la diferencia principal entre los grupos sea la intervención recibida. Es evidente que la eficacia de la aleatorización depende del tamaño muestral del estudio, por lo que en muestras pequeñas de sujetos, aunque sean adecuadamente aleatorizadas, existen más posibilidades de que la distribución de las características de los grupos de intervención no sea totalmente homogénea. Así, si tirásemos una moneda al aire 10 veces, con bastante probabilidad no nos saldrían exactamente 5 caras y 5 cruces; sin embargo, si la tiráramos 200 veces, la probabilidad de que la proporción de caras y cruces esté equilibrada, será mayor. Existen diferentes métodos de aleatorización, aunque los más frecuentemente empleados son la aleatorización simple, aleatorización por bloques y aleatorización estratificada6. Un ejemplo de aleatorización simple, que es el procedimiento más intuitivo y fácil de aplicar, sería lanzar una moneda al aire, o de forma más sofisticada, el empleo de tablas de números aleatorios, o la generación de números aleatorios mediante un programa informático. Son sistemas sencillos, pero como se ha comentado, en muestras pequeñas no garantizan el equilibrio en el tamaño de los grupos, ni la distribución homogénea de los factores de confusión. Estos problemas se resuelven utilizando la aleatorización por bloques, que consiste en definir bloques de sujetos de un tamaño predeterminado en los que, por diseño, se fuerza a que el número de sujetos asignado a cada una de las intervenciones en estudio sea el mis-
24
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 FC (296-304).qxp
6/7/07
09:35
Página 299
Martín-Sánchez E et al. Capítulo 4: El ensayo clínico. Metodología de calidad y bioética
– Resumen – Índice – Información general • Título • Promotor • Investigadores principales • Lugar de realización • Fase del ensayo – Justificación y objetivos – Tipo de ensayo y diseño – Selección de sujetos, tamaño de la muestra – Descripción de intervenciones – Variables primarias y secundarias – Aspectos ético-legales • Consentimiento informado • Póliza de seguros • Indemnización • Normas predefinidas de detención del tratamiento – Consideraciones prácticas – Análisis estadístico – Documentación complementaria • Contratos • Presupuesto • Distribución de gastos – Cuaderno de recogida de datos – Manual del investigador – Procedimientos normalizados de trabajo
Elaboración de la pregunta de investigación Consideraciones éticas y legales Desarrollo del protocolo del ECA
Población de pacientes Criterios de inclusión y exclusión Muestras de pacientes Consentimiento informado Aleatorización
Diseño paralelo
Diseño cruzado Cegamiento
Intervención activa
Intervención control
Resultados A
Resultados B
Análisis de datos
Intervención activa
Resultados A1
Intervención control
Período de lavado
Resultados C1
Intervención activa
Intervención control
Resultados A2
Resultados C2
Análisis de datos
Figura 1. Etapas en la realización de un ensayo clínico aleatorio (ECA).
mo. Una vez constituidos los bloques se aleatorizan uno a uno los sujetos de cada bloque. Un último sistema frecuente para dividir a los sujetos en los grupos de intervención es la aleatorización estratificada. Para ello, se definen previmente los factores pronóstico por los que se desea estratificar (por ejemplo, sexo: hombre/mujer, y estado civil: soltero/casado/separado/viudo). Se constituyen tantos estratos como el producto del número de categorías de cada uno de los factores considerados (en nuestro
ejemplo, dos por cuatro igual a ocho). Cada vez que se incorpora un nuevo sujeto al estudio se le asigna directamente a su estrato correspondiente (mujer soltera), y dentro de cada estrato se realiza un proceso de aleatorización independiente. Además de la posibilidad de homogeneizar los grupos, evitando que sean otras variables diferentes de la intervención las que condicionen los resultados obtenidos, la aleatorización permite utilizar técnicas de enmascaramiento
25
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 FC (296-304).qxp
6/7/07
09:35
Página 300
Martín-Sánchez E et al. Capítulo 4: El ensayo clínico. Metodología de calidad y bioética
para evitar el denominado sesgo de selección7. Este sesgo tiene lugar cuando, o bien el investigador encargado de realizar la asignación, o bien el sujeto, tienen alguna influencia sobre el grupo al que será incorporado. No es difícil que el investigador conozca qué tratamiento corresponde a cada uno de los grupos, como es el caso de intervenciones que llevan asociados efectos adversos característicos. El interés personal del investigador en el éxito del nuevo tratamiento experimental puede influir en que trate de evitar que los sujetos con mejor pronóstico o mayores expectativas de mejoría vayan al grupo control, por ejemplo, aumentando el rigor a la hora de buscar criterios de exclusión por los que el sujeto no pueda participar en el estudio. Para que ni las preferencias del investigador, ni las del paciente influyan en la decisión del grupo al que éste es asignado, es importante, lo primero, que la aleatorización se produzca cuando los sujetos ya estén incluidos en el estudio, una vez superados los criterios de selección y entregado el consentimiento informado de participación, y en segundo lugar, que la secuencia de asignación esté oculta para el investigador, ya que, al no conocer el tratamiento asociado a cada grupo su decisión no podrá influir en la inclusión de los sujetos a uno u otro. Este procedimiento se denomina “encubrimiento de la asignación” (del inglés, concealment allocation). Exposición a las distintas intervenciones Los ensayos clínicos se realizan fundamentalmente para evaluar tratamientos, ya sean farmacológicos, técnicas experimentales o intervenciones quirúrgicas, pero además, pueden realizarse para evaluar medidas preventivas, medidas de detección y diagnóstico de enfermedades, e incluso medios de mejora de la calidad de vida. En cualquiera de los casos, el estudio de una intervención debe realizarse conjuntamente con el de un grupo control, constituido por un conjunto de personas que comparte con el grupo activo todos los predictores de las variables de resultado, y se somete a lo largo del estudio a las mismas pautas y medidas, diferenciándose esencialmente en el tratamiento que reciben6. De forma general, el grupo control de un ECA suele estar constituido por una de las siguientes opciones: un placebo, un tratamiento activo, o ninguna intervención. Los compuestos placebo son preparados que carecen de actividad farmacológica, pero cuyo aspecto y caracteres organolépticos son idénticos a los del preparado en estudio, y son diseñados para simular terapias médicas. También hablamos de técnicas placebo, constituidas por intervenciones o procedimientos que no tienen un efecto fisiológico ni bioquímico sobre la condición de estudio. La finalidad de emplear estos compuestos o procedimientos es controlar el denominado “efecto placebo”, es decir, el efecto psicológico o fisiológico que tiene cualquier intervención, independientemente de su actividad, y que depende de la personalidad del paciente, del entusiasmo del equipo investigador, de las expectativas de mejoría, etc. Se produce una reducción de los síntomas, y en algunas
ocasiones una aparición de efectos adversos, como resultado de la percepción de los pacientes de estar recibiendo una intervención terapéutica. Al comparar ambos grupos, es posible estimar el efecto real de la intervención estudiada, deduciéndolo del efecto logrado por el placebo en la misma situación clínica. De este modo, se puede estudiar la eficacia de una determinada intervención, ya que el placebo controla los efectos derivados de cualquier característica del tratamiento que no sea el efecto que se está estudiando. Si queremos estudiar, por ejemplo, la eficacia de un nuevo fármaco antihipertensivo, administrado vía oral en cápsulas rojas de un determinado tamaño, podemos emplear un grupo control constituido por cápsulas del mismo color rojo, tamaño, olor y sabor, pero formuladas con excipientes inactivos, carentes de actividad farmacológica alguna. Los sujetos, por un lado, no tendrán información sobre cuál es el tratamiento que están recibiendo (no es posible diferenciarlos), y por otro, tendrán las mismas expectativas de mejoría, misma susceptibilidad ante la aparición de eventos adversos, o las mismas reacciones fisiológicas ante la administración de un nuevo tratamiento. Cuando existe una medida terapéutica aceptada como eficaz ante una determinada condición clínica, lo más adecuado para el estudio de una nueva intervención para tratar la misma condición es emplear la técnica conocida como intervención control. Utilizamos un tratamiento activo (el mejor tratamiento disponible) como grupo control, ya que, por un lado, no sería ético para los participantes emplear un placebo, y por otro, nos permite estimar la relación beneficio/riesgo del nuevo tratamiento ante una situación clínica concreta. Podemos, de este modo, acercarnos a la efectividad clínica del nuevo tratamiento, o realizar estudios de no inferioridad (demostramos que el nuevo tratamiento no es peor) y de equivalencia (demostramos que ambos son iguales) con intervenciones conocidas. Cualquier ventaja en cuanto a eficacia, seguridad, coste, adherencia al tratamiento, preferencia del paciente, etc. puede suponer un motivo para que el nuevo tratamiento constituya una alternativa terapéutica interesante ante esa misma dolencia. Es importante, cuando comparamos dos tratamientos activos, desarrollar un método para cegar al paciente. Si, por ejemplo, quisiéramos comparar un nuevo antibiótico monodosis para el tratamiento de una determinada infección, con el que se emplea habitualmente, en dosis diarias durante cinco días, a los sujetos asignados al grupo de intervención, habría que administrarles el nuevo antibiótico el primer día, y los cuatro días restantes se les daría un preparado placebo para que continúen en el estudio a la par que los sujetos del grupo control, que estarían los cinco días recibiendo el fármaco de referencia. En este ejemplo, a igualdad de eficacia en los dos grupos, la pauta de administración puede constituir una ventaja importante ante el tratamiento convencional. En algunos casos, por la propia estructura de la pregunta de investigación, lo más conveniente es emplear como grupo control sujetos sobre los que no se realiza nin-
26
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 FC (296-304).qxp
6/7/07
09:35
Página 301
Martín-Sánchez E et al. Capítulo 4: El ensayo clínico. Metodología de calidad y bioética
guna intervención. Estos sujetos simplemente reciben los cuidados o atención que tienen habitualmente. Por ejemplo, para estudiar el efecto de una determinada intervención educativa en la prevención del hábito tabáquico en sujetos con riesgo cardiovascular elevado, podríamos emplear un grupo control constituido por sujetos sobre los que no se va a realizar ninguna intervención educativa, sino que simplemente se someterán a sus cuidados, revisiones y consejos dados por sus médicos y cuidadores habituales. Es importante en la realización del ECA que respete el denominado principio de incertidumbre, según el cual sólo debe realizarse cuando existe verdadera incertidumbre sobre cuál de las intervenciones que se comparan beneficiará más al paciente. De lo contrario, si se realiza un ECA conociendo con certeza a priori que la intervención control es inferior a la experimental, no sería un comportamiento ético para los participantes del estudio, y además su publicación introduciría un importante sesgo en las evidencias disponibles sobre la eficacia de esa intervención, con las correspondientes implicaciones en la práctica de tales conclusiones. Enmascaramiento (cegamiento). Sesgo de realización Las técnicas de ciego, o de enmascaramiento, son aquellos procedimientos realizados con el fin de que algunos de los sujetos relacionados con el estudio no conozcan algunas características concretas de la realización de éste –generalmente el tratamiento que recibirá cada sujeto–, que pudieran ejercer un cambio en sus acciones o decisiones y sesgar los resultados6. En función de los sujetos que han sido cegados a tal información se definen diferentes tipos de estudios1. 1) Ensayos abiertos son aquellos estudios en los que no se han utilizado técnicas de enmascaramiento. Todos los sujetos relacionados con el estudio conocen la intervención asignada a cada uno de los grupos. 2) Estudios simple ciego son aquellos en los que los sujetos participantes desconocen qué intervención están recibiendo. 3) Hablamos de doble ciego cuando tanto los pacientes como los investigadores desconocen el tratamiento administrado, y, por tanto, se elimina la posibilidad de que si el investigador conoce las intervenciones examine con más minuciosidad cualquier respuesta o posible efecto secundario experimentado por los sujetos. Existe, además, un triple ciego en los casos en los que el profesional estadístico que analizará los resultados tampoco conoce el tratamiento asignado a cada sujeto. 4) En los casos en los que no es posible el enmascaramiento de algunos de los sujetos implicados en el estudio (por ejemplo, no es posible enmascarar al investigador que aplica la técnica cuando ésta consiste en una intervención quirúrgica), o la variable respuesta es blanda e incluye elementos de subjetividad (percepción de mejoría, cuestionarios de síntomas, etc.), se emplea la técnica del evaluador ciego (evaluación ciega por terceros). En estos casos, la
persona que ha de medir la variable respuesta no está involucrada directamente en la investigación, y desconoce el grupo al que pertenece cada uno de los sujetos, por lo que las mediciones e interpretaciones se realizarán de igual manera para todos los participantes, con independencia del tratamiento que hayan recibido. El cegamiento permite que cualquier grado de imparcialidad sobre alguna de las intervenciones en estudio por parte del investigador, o bien del sujeto participante (autosugestión, confianza en una nueva intervención, etc.), pueda influir sobre los resultados o la interpretación de éstos. De este modo, se evita el denominado sesgo de realización7, que se da cuando existen diferencias en el trato o la atención sanitaria que reciben los sujetos en función del grupo al que pertenezcan. Si el grupo asignado es desconocido, todos los sujetos recibirán exactamente la misma atención, excepto la propia intervención. El conocimiento de la intervención puede influir tanto en las actitudes del investigador que administra dicha intervención, como en el sujeto que la recibe, como en el profesional encargado de analizar los datos, introduciendo en cualquiera de los casos un importante sesgo en los resultados finales. Aunque lo más deseable para la realización de un ECA es seguir una metodología, al menos, de doble ciego, ésta no siempre es posible. En el caso de intervenciones farmacológicas, los efectos secundarios o el perfil de toxicidad característico de algunos fármacos impide su cegamiento, así como en aquellos casos en los que no es posible disponer de una formulación galénica adecuada que actúe como grupo control placebo. Tampoco es posible el cegamiento cuando suponga riesgos innecesarios para el paciente, como en los casos en los que tendría que ser sometido a intervenciones quirúrgicas simuladas, o a administraciones repetidas de placebo por vía parenteral. Por último, en todos aquellos casos en los que por cualquier circunstancia el diseño doble ciego puede perjudicar la relación entre el médico y el paciente, no es conveniente llevarlo a cabo. Descripción de pérdidas y abandonos. Sesgo de seguimiento Otro aspecto metodológico a tener en cuenta en la realización de un ECA, es efectuar una correcta descripción de las pérdidas y abandonos experimentados durante su transcurso, es decir, recoger el número de sujetos que abandonan el estudio antes de su finalización, el grupo al que pertenecen y, si es posible, la causa del abandono o pérdida (aparición de evento adverso, falta de eficacia del tratamiento, etc.). Cada una de las causas tendrá un significado diferente en la valoración de la eficacia de la intervención en estudio, y, por tanto, disponer de esta información es muy importante para que no se produzca el denominado sesgo de seguimiento7. A partir de esta información hay diferentes estrategias para analizar los datos y llegar a resultados válidos. Una de las opciones frecuentemente empleadas, es la realización
27
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 FC (296-304).qxp
6/7/07
09:35
Página 302
Martín-Sánchez E et al. Capítulo 4: El ensayo clínico. Metodología de calidad y bioética
de un análisis por intención de tratar. Según éste, cada paciente es analizado en el grupo al que fue asignado al inicio del estudio, independientemente de que no terminara la intervención que correspondía a ese grupo. Así, si realizáramos un ECA para estudiar la eficacia de dos intervenciones activas (A y B) con una duración de 5 días, y sobre una muestra de 100 sujetos, de los cuales 50 fueran aleatoriamente asignados al grupo A y 50 al grupo B, y durante el transcurso de esos 5 días hubieran abandonado el estudio 3 sujetos del grupo A y 7 del grupo B, un análisis por intención de tratar utilizaría los datos de los 50 sujetos iniciales del grupo A y los 50 del grupo B (no sólo 47 y 43 que fueron los que recibieron correctamente la intervención que les había sido asignada). Este tipo de análisis, además de permitir controlar el sesgo de seguimiento, presenta dos ventajas fundamentales. Por un lado, es la única estrategia que conserva las ventajas adquiridas mediante la asignación aleatoria de los sujetos, creando dos grupos comparables en todas las variables excepto en la intervención recibida, y además, es la estrategia que más se aproxima a la realidad de la práctica clínica diaria, donde los pacientes frecuentemente incumplen o rechazan los tratamientos que tienen prescritos.
Tabla 2. Consentimiento informado Hoja de información para el posible participante
Contendrá información referente a los siguientes aspectos del ensayo clínico: Objetivo Metodología empleada Tratamiento que puede ser administrado, haciendo referencia al placebo, si procede Beneficios derivados del estudio Incomodidades y riesgos derivados del estudio Posibles acontecimientos adversos Tratamientos alternativos disponibles Carácter voluntario de su participación, así como posibilidad de retirarse del estudio en cualquier momento Personas que tendrán acceso a los datos del estudio y modo en que se mantendrá la confidencialidad Modo de compensación económica y tratamiento en caso de daño o lesión Investigador responsable del ensayo y de informar al sujeto, y modo de contactar con él en caso de urgencia Modelo de consentimiento por escrito
Título del ensayo……………………………… Yo, …………………………………………… He leído la hoja de información que se me ha entregado He podido hacer preguntas sobre el estudio He recibido suficiente información sobre el estudio He hablado con …………… (nombre del investigador) Comprendo que mi participación es voluntaria Comprendo que puedo retirarme del estudio: Cuando quiera Sin tener que dar explicaciones Sin que esto repercuta en mis cuidados médicos Presto libremente mi conformidad para participar en el ensayo Fecha ……………… Firma del participante:
REQUISITOS PARA REALIZAR UN ENSAYO CLÍNICO Sujeto participante: derecho a la intimidad personal; consentimiento informado Es necesario que todas las partes implicadas en un ECA guarden la más estricta confidencialidad para no vulnerar la intimidad personal ni familiar de los sujetos participantes en el mismo. Este derecho a la intimidad personal es una premisa establecida a priori para todos los participantes, y un derecho recogido tanto en la Constitución Española9, como en la Ley General de Sanidad10. Igualmente, es necesario tomar todas las medidas apropiadas para evitar el acceso de personas no autorizadas a los datos del ensayo. Antes de ser incluido en un ECA, el sujeto deberá otorgar libremente su consentimiento informado, un procedimiento que garantiza que participará voluntariamente en el estudio después de haber comprendido la información que se le ha dado acerca de los objetivos de éste, beneficios, incomodidades y riesgos previstos, alternativas posibles, derechos y responsabilidades. Toda esta información debe ser facilitada al sujeto en términos que pueda comprender, y preferiblemente por escrito, dejándole la posibilidad de consultar cualquier duda acerca de la realización del estudio y de abandonarlo libremente en cualquier momento8. El resto de personas implicadas en el estudio evitarán cualquier influencia sobre el sujeto participante. En la tabla 2 se recogen los datos que deben figurar tanto en una hoja de información para el posible participante, como en un modelo de consentimiento informado, de acuerdo con lo establecido en el Real Decreto 223/2004 de 6 de febrero, por el que se regulan los ensayos clínicos con medicamentos11. Consideraciones éticas: informe del Comité Ético de Investigación Clínica Ningún ECA podrá realizarse sin informe previo de un Comité Ético de Investigación Clínica. Los Comités de Ensayos Clínicos son los responsables de ponderar los aspectos metodológicos, éticos y legales del protocolo propuesto por el promotor del estudio. Su función, principalmente, es velar por los derechos de los sujetos sometidos voluntariamente a los ensayos clínicos, y suelen tener un carácter multidisciplinar, incluyendo componentes ajenos a las profesiones sanitarias. Es importante que conozcan y vigilen el cumplimiento de toda la normativa legal que rodea la realización de un ECA, con experimentación en humanos, desde los Principios de Buena Práctica Clínica y Garantía de Calidad y los principios éticos de la Declaración de Helsinki, hasta toda la normativa legal de cada comunidad autónoma, así como las disposiciones españolas y europeas elaboradas al respecto. Básicamente, estudian los siguientes criterios5: 1) Evaluación de la idoneidad del protocolo en relación a los objetivos del estudio, eficiencia científica, posibilidad de alcanzar conclusiones válidas, justificación de los riesgos y molestias previsibles, ponderadas en función de los
28
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 FC (296-304).qxp
6/7/07
09:35
Página 303
Martín-Sánchez E et al. Capítulo 4: El ensayo clínico. Metodología de calidad y bioética
beneficios esperados para el sujeto y para la sociedad. 2) Evaluación de la idoneidad del equipo investigador para llevar a cabo el estudio propuesto: experiencia y capacidad investigadora, obligaciones asistenciales, o compromisos previamente establecidos con otros protocolos de investigación. 3) Evaluación de la información escrita que se facilitará a los posibles participantes y tipo de consentimiento que va a obtenerse. 4) Comprobación de la previsión de la compensación y tratamiento que se ofrecerá a los sujetos participantes en caso de lesión o daño atribuibles al ECA, y del seguro o indemnización para cubrir las responsabilidades especificadas por la legislación. 5) Conocimiento y evaluación del alcance de las compensaciones que se ofrecerán a los investigadores y a los sujetos de la investigación por su participación.
FORTALEZAS Y DEBILIDADES DEL ENSAYO CLÍNICO ALEATORIO Debilidades Los ECA son experimentos cuyo desarrollo lleva aparejada una gran complejidad. Desde el punto de vista del diseño, requieren un cierto dominio de la metodología para poder definir un protocolo adecuado a la población, a la intervención y a las medidas de resultado que queremos estudiar. Es preciso informar y organizar a los sujetos, que se enfrentarán a numerosas visitas, pruebas, tests, etc.. Por otro lado, las importantes restricciones éticas y legales para la realización de estos estudios hacen que no siempre sea posible someter a las personas a las condiciones ideales de experimentación. Son estudios que sólo permiten evaluar el efecto de una única intervención y que suponen un elevado coste para llevarlos a cabo, el cual dependerá tanto de la duración del estudio como de la complejidad del protocolo establecido para su realización. Otra de las principales debilidades del ECA es que son realizados en condiciones muy diferentes a las de su aplicación habitual. Tanto el proceso de selección de la muestra de estudio como las rígidas pautas que se siguen a la hora de realizar las intervenciones, convierten las condiciones del estudio en “excesivamente ideales” y alejadas de la realidad del resto de sujetos, por lo que los resultados obtenidos son, en ocasiones, difícilmente extrapolables y generalizables a la población. Con respecto a los sujetos participantes se enfrentan a dos riesgos fundamentales. Por un lado, están recibiendo intervenciones cuya eficacia es, a priori, desconocida. Puede suceder que se trate de intervenciones completamente ineficaces o que hayan sido asignados a un grupo control constituido por una intervención placebo. De este modo, durante el período de duración del estudio no tienen las mismas posibilidades de prevenir o tratar su dolencia que los sujetos que sí estén recibiendo intervenciones de eficacia conocida. Al mismo tiempo, tampoco se tiene un conocimiento total del perfil de seguridad de la intervención estudiada, por lo que, aunque no suele ser habitual, po-
drían aparecer efectos secundarios graves desconocidos hasta entonces5. Fortalezas Los ECA son experimentos controlados. Es el investigador el que diseña un protocolo de actuación y decide cómo se llevará a cabo el estudio. Esto permite un mayor control del factor de estudio y, por tanto, definir mecanismos que cuiden de la seguridad del sujeto participante. Además son estudios prospectivos, por lo que el investigador participa y controla desde el comienzo, y es el que define su duración y el período de seguimiento postintervención durante el cual le conviene seguir a los participantes para obtener toda la información necesaria. Los ECA permiten conocer y cuantificar la aparición de efectos secundarios indeseados consecuencia de la intervención en estudio. Con otros tipos de diseños, al no controlarse, o hacerlo en menor medida, los demás factores que podrían influir sobre estos efectos colaterales no es posible atribuirlos con certeza a la intervención estudiada. Desde el punto de vista metodológico, por un lado, constituyen el diseño de investigación con mayor nivel de evidencia para comprobar hipótesis causales. La asignación aleatoria permite una distribución equitativa de todos los factores que pueden influir en el resultado, permitiendo aislar el efecto de la intervención del resto de factores y, por tanto, definiendo la causa real de los resultados obtenidos. Por otro lado, los ECA nos permiten un estudio de diferentes características de la intervención estudiada: eficacia, efectividad, eficiencia o equivalencia, en función del grupo control empleado o de las características de aplicación de dicha intervención. Por último, desde el punto de vista del paciente, los ensayos clínicos suponen, de forma particular, la posibilidad de recibir tratamientos nuevos a los que otros pacientes no tienen acceso, y que, en algunos casos, constituyen la última alternativa disponible ante una determinada dolencia12. Estos pacientes recibirán una elevada y especial atención médica durante toda la duración del estudio. De forma general, los ECA constituyen la mejor posibilidad de crear nuevas alternativas terapéuticas y de poner en el mercado, y por tanto al alcance del paciente, intervenciones preventivas, terapéuticas o rehabilitadoras que constituyen nuevas soluciones para la práctica asistencial diaria, con expectativas de mejorar la calidad de vida y el estado de salud del individuo.
BIBLIOGRAFÍA 1. Argimon JM, Jiménez J. Estudios experimentales I: el ensayo clínico aleatorio. En: Edide S.L. Métodos de Investigación Clínica y Epidemiológica. 3.ª ed. Madrid: Elsevier; 2004. p. 33-48. 2. Phillips B, Ball C, Sackett D, Badenoch D, Straus S, Haynes B, et al. Oxford Centre for Evidence-based Medicine Leves of Evidence. [Internet]. Oxford; May 2001 [entry on May, 2007]. Disponible en: www.cebm.net/downloads/Oxford_CEBM_levels_5.rtf 3. Argimon JM, Jiménez J. Estudios experimentales II: otros diseños. En: Edide S.L. Métodos de Investigación Clínica y Epidemiológica. 3.ª ed. Madrid: Elsevier; 2004. p. 49-65.
29
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 FC (296-304).qxp
6/7/07
09:35
Página 304
Martín-Sánchez E et al. Capítulo 4: El ensayo clínico. Metodología de calidad y bioética
4. Laporte JR. El ensayo clínico controlado. En: Laporte JR, editor. Principios básicos de investigación clínica. 2,ª ed. Barcelona: Astrazeneca; 2001. p. 27-54. 5. Pita S. Estudios experimentales en la práctica clínica. Investigación terapéutica. Ensayos clínicos. En: Gómez de la Cámara A, editor. Manual de Medicina Basada en la Evidencia. Elementos para su desarrollo y aplicación en Atención Primaria. Madrid: Jarpyo Editores; 1998. p. 147-63. 6. Cummings SR, Grady D, Hulley SB. Designing an Experiment: Clinical Trials I. En: Hulley SB, Cummings SR, Browner WS, Grady D, Hearst N, Newman RB, editors. Designing Clinical Research: An Epidemiologic Approach. 2.ª ed. Philadelphia: Lippincott Williams & Wilkins; 2001. p. 143-55. 7. Martín JLR, Seoane T. Lectura crítica de los estudios; el riesgo del sesgo. En: Revisiones Sistemáticas en las Ciencias de la Vida. El Concepto Salud a través de la síntesis de la Evidencia Científica. 1.ª
ed. Toledo: Fundación para la Investigación Sanitaria en Castilla-La Mancha (FISCAM); 2006. p. 155-69. 8. Sánchez-Caro J, Abellán F. Ensayos Clínicos en España. Aspectos científicos, bioéticos y jurídicos. 1.ª Ed. Badalona: Euromedice. Ediciones Médicas, S.L.; 2005. 9. Constitución Española de 27 de diciembre de 1978, BOE de 29 de diciembre: Art. 18.1 y 18.4 (derecho a la intimidad personal), art. 43 (derecho a la protección de la salud), art. 149.1 (competencias exclusivas del estado). 10. Ley 14/1986, de 25 de abril, BOE del 29, General de Sanidad: Art.10.2, 61 y 95.4. 11. Real Decreto 223/2004 de 6 de febrero, por el que se regulan los ensayos clínicos con medicamentos. Boletín Oficial del Estado N.º 33, (07-02-2004). 12. Torpy JM, Lynm C, Glass RM. JAMA patient page. Randomized controlled trials. JAMA. 2005;294:2262.
30
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 Formacion 1183 (356-361).qxp
5/9/07
09:39
Página 356
Seoane T et al. Capítulo 5: Selección de la muestra: técnicas de muestreo y tamaño muestral
formación SOCIEMA
PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA
Capítulo 5: Selección de la muestra: técnicas de muestreo y tamaño muestral T. Seoanea, J.L.R. Martína,b, E. Martín-Sáncheza, S. Lurueña-Segoviaa,c y F.J. Alonso Morenod,f aÁrea de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla-La bUnidad de Investigación Aplicada. Hospital Nacional de Parapléjicos. Toledo. cFENNSI Group. Fundación Hospital Nacional de Parapléjicos. Toledo. dCentro de Salud Sillería. Toledo. fResponsable de Investigación de Semergen.
Mancha (FISCAM). Toledo.
Para realizar un proyecto de investigación debemos obtener datos de la población objetivo, que se define como el conjunto de elementos del cual se quiere conocer cierto aspecto. En algunos estudios cada elemento de la población puede ser medido realmente, lo cual es posible solamente si la población no es muy numerosa y si todos los elementos son accesibles. Pero lo habitual es que el estudio completo de la población sea inviable, ya que el trabajo empírico necesario es costoso e implica mucho tiempo y recursos. Para obtener resultados confiables no es necesario obtener los datos de todos los elementos poblacionales, es suficiente recoger las variables de un subconjunto de elementos denominado muestra. El estudio tendrá la validez y la fiabilidad necesarias si este subconjunto es representativo de la población objetivo y los resultados obtenidos son extrapolables a la misma. Existen distintas técnicas o procedimientos para seleccionar la muestra, dependiendo del tiempo, de los recursos económicos y de la naturaleza de los elementos poblacionales. El conjunto de estas técnicas se denomina muestreo. En el diseño del estudio se debe definir el tamaño muestral necesario; su cálculo está relacionado con ciertos problemas que estudia la Inferencia Estadística y que permitirán extraer conclusiones científicamente válidas a la población.
To carry out a research project it is necessary to obtain data from the target population, which is defined as the set of elements about which we aim to find out a certain aspect. In some studies, this aspect can be directly measured in each element of the population; however, this is only possible if the population is not very large and if all of the elements are accessible. In the vast majority of cases, it is not viable to study the entire population because the empirical work necessary is expensive and involves much time and resources. To obtain reliable results, it is not necessary to obtain all of the data from all of the elements of the population; it is sufficient to collect the variables in a subgroup of elements called the sample. Unless this subgroup is representative of the target population, the results of the study cannot be extrapolated and will not be valid or reliable for the target population as a whole. There are different techniques or procedures to select the sample, depending on the time and financial resources available, as well as the nature of the elements of the population. This set of techniques is called sampling. When designing a study, it is necessary to define the necessary sample size, which involves certain problems studied by Inferential Statistics and will enable scientifically valid conclusions to be reached regarding the population.
Palabras clave: población, muestra, muestreo, tamaño muestral, estimación.
Key words: population, sample, sampling, sample size, estimation.
Correspondencia: J.L.R. Martín. Jefe del Área de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla la Mancha (FISCAM). Edificio Bulevar. C/ Berna, n.o 2, local 0-2. 45003 Toledo. Correo electrónico: jlrmartin@jccm.es
En determinados casos, dentro de nuestro marco de trabajo y para responder a la pregunta de investigación, nos encontraremos con el problema de la incapacidad técnica (por la excesiva necesidad de recursos, de todo tipo, que conlleva) de manejar poblaciones completas a la hora de realizar nuestros estudios. Por ello, deberemos seleccionar un subconjunto de dicha población, que sea representativo, y cuyos resultados obtenidos sean extrapolables a la misma. A este subconjunto poblacional lo llamaremos muestra, y a las técnicas para la selección de 31
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 Formacion 1183 (356-361).qxp
5/9/07
09:39
Página 357
Seoane T et al. Capítulo 5: Selección de la muestra: técnicas de muestreo y tamaño muestral
una muestra a partir de una población lo denominaremos muestreo. Este proceso nos permitirá ahorrar recursos y conseguiremos resultados similares a los obtenidos en el estudio poblacional completo. La Teoría de Muestras está totalmente ligada a la Teoría de Estimación, es decir, a la Inferencia Estadística, que es la parte de la estadística que estudia los métodos para la obtención del modelo de probabilidad que sigue una variable aleatoria de una determinada población, a través de una muestra obtenida de la misma. Estimar el tamaño de la muestra significa calcular a priori el número de individuos necesarios para poder comprobar la hipótesis de estudio. Para que los estudios tengan la validez y fiabilidad buscada es necesario que tal subconjunto de datos, o muestra, posea algunas características específicas que permitan, al final, generalizar los resultados hacia la población en total. Esas características tienen que ver principalmente con el tamaño de la muestra y con la manera de obtenerla. Para definir mejor los objetivos y métodos que trata la Teoría de Muestras es necesario comenzar dando las siguientes definiciones:
POBLACIÓN Población es el conjunto de entes del cual se quiere conocer cierto aspecto, al que hace referencia la pregunta de investigación. Es una entidad teórica definida como un grupo completo de individuos, cosas o hechos, que tienen algún rasgo en común. Por lo tanto, los elementos de una población no tienen que ser necesariamente seres humanos, como nos podría inducir a pensar la definición de la palabra, se puede considerar la población formada por las viviendas de una zona geográfica, las muestras de un laboratorio o los peces de una zona marítima.
MUESTRA Al realizar un proyecto de investigación y gracias a las técnicas estadísticas derivadas de la Teoría de Muestras, no es necesario recoger los datos de todos los individuos que forman la población objeto de estudio. Es suficiente calcular el valor de alguna característica en un subconjunto de la población denominado muestra, definido como cualquier subconjunto formado por elementos de la población. Se puede estimar, a partir de este subconjunto, la frecuencia de una determinada condición o la magnitud de una asociación en dicha población. Por ejemplo, supongamos que se desea conocer la altura media de los españoles, en este caso la población estaría formada por todos los individuos con nacionalidad española; para conocer la estatura media deberíamos medir uno por uno a todos los sujetos, sumar sus alturas y dividir por el número total de españoles. Este procedimiento, inviable, puede sustituirse por la medición de un número de individuos representativos de la población. Por supuesto, esta muestra nunca podría estar formada por los jugadores de distintos equipos de baloncesto, pues no sería un fiel reflejo de la realidad, la muestra debe comportarse como un espejo del conjunto población.
Las razones principales por las que se seleccionará una muestra en lugar de analizar toda la población son el tiempo y el dinero, es decir la eficiencia; incluir un número excesivo de individuos supondrá un incremento del coste y se expondrá a posibles factores de riesgo a un número innecesario de sujetos. Por lo tanto, su importancia está justificada por motivos científicos y éticos1. Generalmente, el número de elementos que forman la muestra está determinado antes de efectuar el muestreo. Este número de elementos se denomina tamaño muestral.
MUESTREO Es el conjunto de técnicas y procedimientos para seleccionar la muestra2,3. Para que esta muestra sea representativa de la población debe cumplir dos condiciones: 1. Independencia en la selección de los individuos que forman la muestra. 2. Que todos los elementos de la población tengan la misma probabilidad de ser incluidos en la muestra. Los métodos para seleccionar una muestra son numerosos, dependiendo del tiempo, del dinero y de la naturaleza de los elementos que conforman la población. Podemos clasificarlos de acuerdo a: 1. El número de muestras recogidas de una población. 2. La forma de seleccionar los elementos incluidos en la muestra. Según el número de muestras recogidas de la población, los métodos se clasifican en tres tipos: muestreo simple, muestreo doble y muestreo múltiple. En el muestreo simple se toma una única muestra, su tamaño debe ser suficiente para extraer conclusiones a nivel poblacional. En el caso de realizar un muestreo doble, seleccionaremos una muestra inicial, si el resultado del estudio de dicha muestra no es concluyente se extraerá una segunda muestra, se combinan las dos muestras y se vuelven a analizar los resultados. En el caso de que obtengamos algún tipo de resultado con el primer subconjunto de elementos de la población, no sería necesario extraer la segunda muestra. Supongamos que nos interesa comprobar la calidad de un lote de productos de laboratorio, si la primera muestra tiene una calidad muy alta se acepta el lote, si la calidad es mala rechazaremos dicho lote, en cualquier otro caso recogeremos una segunda muestra. El muestreo múltiple se realiza de forma similar al doble, en este caso el número de muestras que se recogerán sucesivamente es superior a dos. Dependiendo de la forma de seleccionar los elementos incluidos en la muestra nos encontramos con dos tipos de muestreo: El muestreo probabilístico En este tipo de muestreo la probabilidad de aparición de cualquier elemento de la población en la muestra es conocida. Se considera el único científicamente válido. Dentro de este tipo de muestreo distinguimos: 32
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 Formacion 1183 (356-361).qxp
5/9/07
09:39
Página 358
Seoane T et al. Capítulo 5: Selección de la muestra: técnicas de muestreo y tamaño muestral
Muestreo aleatorio simple
Es aquel en que, a priori, todos los elementos de la muestra tienen la misma probabilidad de aparición. Partimos de un listado de las unidades de muestreo, las numeramos y seleccionamos un conjunto de números al azar. Este método puede ser reemplazado por una tabla de números aleatorios o por un programa que nos permita aleatorizar. Es un método sencillo que permite estimar parámetros y errores de muestreo, pero necesitamos disponer de un listado completo de la población. Muestreo sistemático
En este caso seleccionamos los elementos de una manera ordenada, basándonos en una regla sistemática. La forma de seleccionar los individuos dependerá del número de elementos de la población y del tamaño de la muestra. Supongamos una lista de N elementos, si queremos una muestra de n sujetos, ordenamos los elementos de la población y obtenemos el coeficiente de elevación k = N/n. Después se elige al azar un elemento, denominado origen, comprendido entre 1 y k que nos indica el punto de arranque de la selección. Luego de manera sistemática tomamos el que esté k lugares después del primero y así sucesivamente. Como el primer elemento de la muestra es seleccionado al azar, una muestra sistemática nos permite obtener estimaciones y errores de muestreo. El muestreo sistemático es fácil de aplicar y no siempre es necesario disponer de un listado de los elementos poblacionales. Cuando la población está ordenada según cierta tendencia conocida, cubrimos todos los tipos de unidades. Pero si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones pueden estar sesgadas.
todos los grupos son muestreados, cada grupo tiene la misma probabilidad de ser elegido, por lo tanto la muestra es aleatoria. Es útil cuando la población es muy grande y dispersa, pero las estimaciones son menos precisas, pueden tener mayor error muestral. Supongamos que muestreamos por áreas de residencia, seguramente los individuos que vivan en la misma área se parezcan, por ejemplo si consideramos el nivel económico, entonces la variabilidad entre los elementos obtenidos de las áreas seleccionadas es mayor que la variabilidad obtenida si hacemos un muestreo aleatorio de toda la población. Por lo tanto, utilizando una muestra de conglomerados obtendremos la misma precisión en la estimación que si utilizamos una muestra aleatoria simple siempre que la variabilidad de los elementos dentro de cada conglomerado sea semejante a la variabilidad poblacional. El muestreo no probabilístico En este caso la selección de los elementos de la muestra no es por azar, lo realiza el investigador. Estas muestras son menos representativas de la población que las obtenidas por muestreo probabilístico, pero se consiguen rápidamente y el coste es inferior. La principal desventaja es el riesgo de obtener demasiado sesgo, que puede hacer imposible generalizar los resultados. Dentro de esta clase de muestreo existen dos tipos: Muestreo de casos consecutivos
El investigador elegirá a los sujetos que cumplan los criterios de selección en un intervalo temporal o hasta que se alcance un número de muestra suficiente. Muestreo de conveniencia
Muestreo estratificado
Puede ocurrir que se conozca previamente el comportamiento de la característica que se está analizando en la población de referencia, es decir, la población se reparte en subconjuntos tales que la característica considerada en los elementos de cada subconjunto se comporta de forma homogénea. En este caso se puede establecer un tipo de muestreo que utilice este conocimiento. Se estudiará una serie de subpoblaciones o estratos de la población, por lo tanto en la muestra debe haber una representación de todos y cada uno de los estratos considerados. En este tipo de muestreo debemos dividir la población en grupos, en función de esa característica relevante; estos grupos serán más homogéneos que la población como un todo. Entonces, los elementos de la muestra son seleccionados al azar o por un método sistemático dentro de cada estrato. Muestreo por conglomerados
En este caso se consideran “conglomerados de elementos” en lugar de seleccionar elementos de la población, es decir, se toman al azar grupos de elementos y la muestra estará formada por todos los sujetos o por n individuos (seleccionados por muestreo aleatorio o sistemático) de los conglomerados seleccionados. En este método, aunque no
Consiste en seleccionar los elementos más fácilmente accesibles, por ser fáciles de recoger o económico, por ejemplo incluir voluntarios.
MÉTODOS DE SELECCIÓN DE LA MUESTRA. TAMAÑO MUESTRAL En la fase de diseño de todo proyecto de investigación debemos determinar el tamaño muestral necesario para ejecutar dicho trabajo3-5. Si no se realiza este cálculo y el número de elementos muestrales es insuficiente, la estimación de los parámetros no es precisa y posiblemente no encontramos diferencias significativas entre grupos cuando sí existen. Por otra parte, la inclusión de un número excesivo de sujetos encarece el estudio y requiere más tiempo y esfuerzo, además de ser poco ético pues estamos sometiendo a exploraciones o intervenciones a un número innecesario de pacientes. Como ya se ha comentado, el cálculo del tamaño muestral y las técnicas de muestreo están relacionadas con la estimación. Debemos considerar entonces dos situaciones, los dos problemas fundamentales que estudia la Inferencia Estadística que nos permitirá extraer conclusiones válidas de la población a partir de los resultados muestrales: estimación de parámetros (por ejemplo estimar el nivel de colesterol promedio) y el contraste de hipótesis (por ejemplo 33
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 Formacion 1183 (356-361).qxp
5/9/07
09:39
Página 359
Seoane T et al. Capítulo 5: Selección de la muestra: técnicas de muestreo y tamaño muestral
estudiar si el nivel de colesterol promedio es igual en hombres que en mujeres). Estimación de parámetros Es el cálculo aproximado del valor poblacional de cierto parámetro de interés a partir de los valores observados en la muestra. Si por ejemplo queremos estimar el nivel de colesterol medio en pacientes que presentan problemas cardiacos, tomando como base el resultado de una muestra particular de tamaño n, una estimación puntual sería el valor del promedio muestral del nivel de colesterol. Supongamos que recogemos el nivel de colesterol de 100 individuos que padecen alguna afección cardiaca, obtenemos que el nivel de colesterol medio para esta muestra es de 220 mg/100 ml, con una desviación estándar de 13 mg/100 ml. Es sencillo imaginar que si utilizamos otra muestra de pacientes obtendríamos otros valores. Por lo tanto, la estimación puntual de un parámetro depende de la muestra particular y además no podemos cuantificar la proximidad (o lejanía) de este valor puntual a la media teórica, para ello debemos calcular el intervalo de confianza (IC), que nos da una idea de la precisión de la estimación, nos permite conocer entre qué límites es más probable que se encuentre el verdadero valor poblacional. Para calcular el tamaño de muestra necesario para estimar la media o proporción poblacional debemos conocer la variabilidad del parámetro; si no se conoce podemos obtener una aproximación en los datos aportados por la literatura científica o por un estudio piloto. Utilizaremos como medida de la variabilidad la desviación típica poblacional si trabajamos con una variable cuantitativa y en el caso de que sea una variable cualitativa utilizaremos el producto p(1-p), siendo p = probabilidad de éxito. Debemos fijar también el error de estimación, que es una medida de la precisión y se corresponde con la amplitud del IC (si queremos mayor precisión, es decir, un error de estimación menor, el IC deberá ser más estrecho, aumentaríamos entonces el tamaño muestral), y el nivel de confianza, que se define como la probabilidad de que el verdadero valor del parámetro poblacional estimado pertenezca al intervalo de confianza obtenido.
donde n = número de sujetos necesarios. z␣ = valor del coeficiente z correspondiente al nivel de confianza fijado. p = valor poblacional esperado. d = precisión. Por ejemplo, supongamos que queremos estimar la proporción de asmáticos en una determinada zona geográfica, a partir de los datos previos sabemos que esta proporción es de aproximadamente el 6% (p = 0,06), si queremos realizar la estimación con una confianza del 95% (z␣ = 1,96) y con una precisión del ± 3% (d = 0,03), necesitaríamos 241 sujetos. Tamaño muestral para la estimación de una media
Cuando queremos estimar una media, el cálculo es similar al anterior. En este caso debemos conocer también el nivel de confianza y la precisión de la estimación, además debemos tener una idea de la desviación típica s (o de la varianza s2) de la distribución de la variable cuantitativa en la población de referencia. En este caso la fórmula para calcular el valor de n es: n=
z2␣ s2 d2
donde: n = número de sujetos necesarios. z␣ = valor del coeficiente z correspondiente al nivel de confianza fijado. s2 = varianza de la distribución de la variable en la población. d = precisión. Si, por ejemplo, nos interesa conocer el nivel de colesterol medio en pacientes que padecen alguna enfermedad cardiaca, con una precisión de 5 mg/dl, un nivel de confianza del 95% y tenemos información por un estudio piloto que la desviación típica es de 50 mg/100 ml, aplicaríamos la fórmula y determinaríamos que el número necesario de pacientes que necesitamos es 385. Nos podemos encontrar situaciones en las que la población de referencia es finita, en este caso, si necesitamos extraer una muestra, aplicaríamos la siguiente corrección para poblaciones finitas:
Tamaño muestral para la estimación de una proporción
Si deseamos estimar una proporción debemos conocer: 1. El valor aproximado de la proporción que queremos estimar. Lo obtendremos revisando la literatura; si no disponemos de esa información utilizaremos el 50% que maximiza el tamaño muestral (p = 0,5). 2. La precisión con la que queremos realizar la estimación. 3. El nivel de confianza, normalmente al 95%, que da lugar a un coeficiente z␣ = 1,96. Aplicaremos la fórmula siguiente: n=
z2␣ p (1 – p) d2
n np =
[1+(n/N)]
donde: np = número de sujetos necesarios que extraemos de la población finita. n = número de sujetos necesarios calculado para poblaciones infinitas. N = tamaño de la población. Volvemos al ejemplo anterior, donde calculábamos el número necesario de pacientes con algún tipo de afección cardiaca necesarios para estimar el nivel de colesterol medio poblacional; el resultado que obteníamos es 385 suje34
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 Formacion 1183 (356-361).qxp
5/9/07
09:39
Página 360
Seoane T et al. Capítulo 5: Selección de la muestra: técnicas de muestreo y tamaño muestral
tos. Si la población de referencia es de 2.000 enfermos cardiacos, entonces aplicando la fórmula anterior determinamos que el tamaño de la muestra debe ser 323. Contraste de hipótesis, comparación de grupos Como en la estimación de parámetros, nuestro interés cuando comparamos grupos es obtener alguna conclusión sobre un parámetro poblacional, por ejemplo queremos conocer si el nivel medio de colesterol en sangre es igual en hombres que en mujeres, o si un fármaco nuevo es más eficaz que el que se utiliza para el tratamiento de una enfermedad. Para llevar a cabo dicha prueba debemos plantear dos hipótesis, la hipótesis nula H0, que recoge las opciones: no existe diferencia o asociación, o cualquier diferencia observada se debe al azar, y la hipótesis alternativa H1, existe diferencia o asociación, la diferencia observada no se debe al azar. El investigador debe realizar el test utilizando muestras de las poblaciones que queremos comparar y a partir de los resultados obtenidos, utilizando pruebas de significación, evaluará si existen diferencias significativas. Cuando realizamos una prueba de hipótesis podemos cometer dos tipos de errores: el error tipo I o error ␣, que se produce cuando rechazamos la hipótesis nula cuando es cierta en la población, y el error tipo II o error , que se comete cuando se acepta H0 siendo falsa en la población. Se denomina potencia estadística al valor 1-, que representa la probabilidad de observar en la muestra una diferencia o asociación que existe en la población (tabla 1). Para calcular el tamaño muestral en este tipo de análisis necesitamos: 1. Determinar la magnitud de la diferencia clínicamente relevante que queremos detectar comparando dos proporciones o dos medias. Si la diferencia es muy amplia se puede detectar con más facilidad y entonces necesitaremos menos sujetos. 2. Definir si el contraste es unilateral o bilateral. En el caso de un contraste unilateral se quiere probar si uno de los parámetros es mayor (o menor) que el otro, por ejemplo cuando contrastamos si un fármaco es más eficaz que otro. En un contraste bilateral se prueba la igualdad, por ejemplo contrastar si los fármacos difieren en su eficacia. 3. Determinar el riesgo de cometer el error tipo I; habitualmente se acepta un riego ␣ del 5%. 4. Establecer el riesgo de cometer un error tipo II; normalmente se sitúa entre un 5% y un 20%. En muchos casos en lugar de determinar este error  se fija la potencia estadística del contraste (1-), es decir la capacidad de la
Tabla 1. Tipos de errores en un contraste de hipótesis Realidad (población) H0 falsa
Resultado de la prueba
Rechazar H0 Aceptar H0
Correcto (1-) Error tipo II
H0 cierta
Error tipo I Correcto
prueba para detectar la diferencia, habitualmente entre un 80-90%. 5. Debemos conocer la variabilidad poblacional de la variable en estudio. Veamos como podemos calcular el tamaño muestral en los distintos contrastes de hipótesis. Comparación de dos proporciones El contraste de proporciones es una de las pruebas estadísticas más utilizadas en la investigación clínica; se comparan dos grupos utilizando una variable aleatoria cualitativa. Para calcular el tamaño muestral necesario aplicaremos la fórmula siguiente: n=
[z␣ √2p (1-p) + z √ p1 (1-p1) + p2 (1-p2)]2 (p1-p2)2
donde: n = número de sujetos necesarios en cada una de las muestras. z␣ = valor de z correspondiente al riesgo ␣ fijado. z = valor de z correspondiente al riesgo  fijado. p1 = valor de la proporción en el grupo de referencia, placebo, control o tratamiento habitual. p2 = valor de la proporción en el grupo del nuevo tratamiento, intervención o técnica. p = valor medio de las dos proporciones p1 y p2 → p=
p1 + p1 2
Por ejemplo, supongamos que nos interesa evaluar si un fármaco A es mejor que otro tratamiento B para controlar el nivel de colesterol; para este estudio diseñamos un ensayo clínico. La eficacia del tratamiento A está alrededor del 60% y se considera clínicamente relevante si el fármaco B mejora los niveles de colesterol en sangre en un 80%. Fijamos el riesgo ␣ en un 5% y queremos una potencia estadística de un 80%. Calculamos entonces el número necesario de pacientes que debemos incluir en nuestro estudio. p1 = 0,6 y p2 = 0,8, entonces p = 0,7, aplicamos la fórmula y obtenemos n = 40 pacientes para cada grupo. Comparación de dos medias
Cuando queremos calcular el tamaño muestral necesario para comparar dos medias debemos aplicar la fórmula siguiente: 2 (z␣ + z)2 s2 n= d2 donde: n = número de sujetos necesarios en cada una de las muestras. z␣ = valor de z correspondiente al riesgo ␣ fijado. z = valor de z correspondiente al riesgo  fijado. 35
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 Formacion 1183 (356-361).qxp
5/9/07
09:39
Página 361
Seoane T et al. Capítulo 5: Selección de la muestra: técnicas de muestreo y tamaño muestral
s2 = varianza de la variable cuantitativa que tiene el grupo de referencia. d = valor mínimo de la diferencia que se desea detectar. Planteamos un ejemplo. Queremos comparar si el nivel de colesterol en sangre es igual en sujetos que padecen algún tipo de enfermedad cardiaca y en sujetos completamente sanos, tenemos por lo tanto un contraste bilateral. Sabemos que en la población de interés el nivel de colesterol tiene una desviación típica de 50 mg/dl y se establece que la diferencia mínima entre ambos grupos que se considera de relevancia clínica es de 30 mg/dl. El riesgo de error ␣ que estamos dispuestos a asumir es de 0,05. Nos interesa poder detectar la diferencia con una capacidad del 80%. Aplicando la fórmula anterior nos da como resulta-
do 44 pacientes en cada grupo, en total deberíamos incluir en el estudio un mínimo de 88 sujetos.
BIBLIOGRAFÍA 1. Ruiz Canela M. La investigación empírica en Bioética. En: Bioética en las Ciencias de la Salud. Granada: Edit. Asociación Alcalá; 2001. 2. Armitage P, Berry G, Mattews JNS. Statistical methods in medical research. 4ª. ed. Oxford: Blackwell Science; 2002. 3. Argimón JM, Jiménez J. Objetivo del estudio. En: Edide SL, editor. Métodos de Investigación Clínica y Epidemiológica. 3.ª ed. Madrid: Elsevier; 2000. 4. Rebagliato M, Ruiz I, Arranz M. Metodología de investigación en epidemiología. Madrid: Díaz de Santos; 1996. 5. Kleinbaum DG, Kupper LL, Morgenstern H. Epidemiologic research. Principles and quantitative methods. Belmont, California: Lifetime Learning Publications Wadsworth; 1982.
36
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 Formacion 1187 (412-416).qxp
18/10/07
17:40
Página 412
Sánchez Moreno E. Capítulo 6: Diseño de cuestionarios
formación SOCIEMA
PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA
Capítulo 6: Diseño de cuestionarios E. Sánchez Moreno Departamento de Sociología V. Universidad Complutense de Madrid. España.
El cuestionario constituye una de las herramientas más utilizadas en la investigación social y sociosanitaria. Su utilización ha sido frecuente en diversas investigaciones con distintos diseños y diferentes objetivos. Sin embargo, el cuestionario constituye una herramienta de recogida de información con un lugar bastante concreto y específico en el marco de las fases que un proyecto de investigación debe incluir. De esta manera, el cuestionario es una herramienta central durante la fase que solemos denominar “trabajo de campo”, es decir, el momento en el cual se recoge la información que servirá para contrastar las hipótesis formuladas para nuestra investigación. Más aún, el cuestionario sólo es pertinente cuando el investigador ha seleccionado y definido un modelo de investigación basado en la estandarización de la información a través del lenguaje matemático-estadístico. Por tanto, para asegurar un contraste de hipótesis eficaz (es decir, un contraste basado en información fiel a la naturaleza del objeto de estudio), es preciso diseñar un “buen cuestionario”. Esta tarea depende de un amplio número de factores, todos ellos importantes a la hora de diseñar un cuestionario. El presente capítulo enfatiza dos de dichos factores, formulando los temas básicos a considerar cuando el investigador se ve en la necesidad de construir un cuestionario. Por un lado, la forma en la cual se administra el cuestionario (es decir, la forma a través de la que el cuestionario nos relaciona con el entrevistado). Por otro lado, el capítulo se ocupa de las claves para formular preguntas de manera correcta y adecuada, así como de los requisitos que debe cumplir la codificación de las respuestas para que los datos sean útiles y fiables. Palabras clave: entrevista, cuestionario, validez, trabajo de campo.
The questionnaire is one of the tools used most in social and socio-health care research. It has been used frequently in different researches with different designs and objectives. However, the questionnaire is a tool to collect information having a very definite and specific place in the framework of the phases that a research project should include. In this way, the questionnaire is a central tool during the phase that we generally call “field work” – that is, the time when the information is collected that will serve to compare the hypotheses formulated for our research. Even more, the questionnaire is only pertinent when the investigator has chosen and defined a research model based on the standardization of the information through mathematical-statistical language. Thus, to assure an effective hypothesis contrast (that is a contrast based on information faithful to the nature of the study purpose), it is necessary to design a “good questionnaire”. This task depends on a large number of factors, all of them important when designing a questionnaire. The present chapter stresses two of these factors, formulating the basic subjects to be considered when the investigator needs to make a questionnaire. On the one hand, the chapter deals with the keys to formulate questions correctly and adequately, and the requirements that should be fulfilled by the coding of the answers for the data to be useful and reliable.
Key words: interview, questionnaire, validity, field work.
EL LUGAR DEL CUESTIONARIO EN LA INVESTIGACIÓN SOCIAL Y SANITARIA Correspondencia: E. Sánchez-Moreno. Departamento de Sociología V. Universidad Complutense de Madrid. Campus de Somosaguas. 28223 Pozuelo de Alarcón. Madrid. Correo electrónico: esteban.sanchez@cps.ucm.es
A pesar de que el cuestionario es una de las herramientas de obtención de datos más utilizadas, lo cierto es que su lugar en el proceso de investigación es bastante específico. En efecto, el cuestionario constituye una estrategia concreta de acercamiento a la realidad, y su papel es fundamental en un momento concreto de la investigación: la
37
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 Formacion 1187 (412-416).qxp
18/10/07
17:40
Página 413
Sánchez Moreno E. Capítulo 6: Diseño de cuestionarios
recogida de la información que utilizaremos para contrastar nuestras hipótesis1. Por tanto, conviene contextualizar claramente el uso del cuestionario. Tal y como se señalaba en el capítulo 1 de la presente serie (véase la figura 1 del mencionado capítulo), la investigación se estructura en un número de fases diferenciadas, aunque íntimamente relacionadas. Dado que el cuestionario es, ante todo, una forma de recogida de información, su protagonismo es máximo durante el trabajo de campo. El cuestionario constituye el lenguaje al cual traduciremos la realidad que vamos a investigar. Dicho lenguaje (típicamente un lenguaje matemático-estadístico) nos permitirá contrastar nuestras hipótesis y establecer conclusiones apoyadas por datos empíricos. Ahora bien, para que el cuestionario sea útil es preciso primero seleccionar adecuadamente el problema u objeto de investigación, proceder a una formulación de objetivos viables y realistas para, a partir de dichos objetivos, elegir el diseño de investigación más adecuado. Una vez se ha optado por un diseño en el cual el uso del cuestionario está indicado (por ejemplo, si se ha elegido la encuesta como técnica de investigación) es preciso formalizar los objetivos en hipótesis concretas a contrastar. Y son dichas hipótesis las que deben dar lugar a los indicadores que queremos incluir en nuestro cuestionario. Dicho de otra manera, para que nuestro cuestionario sea adecuado debe ser coherente con la lógica de la investigación, lógica estructurada en fases que se suceden en una secuencia en la cual el cuestionario desempeña, tal y como hemos visto, un papel crucial y muy concreto. Por otro lado, la utilidad del cuestionario se ha demostrado para multitud de objetos de investigación. En general, el cuestionario es utilizado en la realización de encuestas y en aquellos diseños de tipo experimental o cuasi-experimental en los cuales se mide alguna variable de carácter psicosocial (autoestima, salud mental, adhesión al tratamiento, etc.). En este último caso es bastante frecuente que se trate de escalas de medición estandarizadas y validadas en distintos contextos culturales (por ejemplo, cuestionario de autoestima, cuestionario de afrontamiento, cuestionario de apoyo social, etc.). A continuación se abordarán los aspectos más relevantes a tener en cuenta a la hora de construir un cuestionario. Para facilitar la exposición abordaremos esta cuestión diferenciando dos grandes dimensiones: la forma de administración del cuestionario y la construcción de las preguntas y las categorías de respuesta. Como se verá se trata de un acercamiento eminentemente práctico, que pretende ser un apoyo en la tarea concreta de elaboración de un cuestionario, intentando ofrecer claves para tomar decisiones prácticas.
CÓMO ADMINISTRAR EL CUESTIONARIO Evidentemente no existe una única forma de administrar el cuestionario. De hecho, este aspecto constituye una de las decisiones cruciales en la construcción de un cuestionario2. Dependiendo de la forma de administración variarán la duración máxima, la complejidad y el coste de la
aplicación del mismo. A continuación se relacionan las diferentes formas de administración, mientras que en la tabla 1 se especifican las ventajas e inconvenientes del uso de cada una de ellas. Cuestionario autoadministrado En esta forma de aplicación los sujetos tienen físicamente el cuestionario en sus manos y lo rellenan de manera autónoma. El medio más utilizado para hacer llegar el cuestionario al sujeto es el correo, tanto postal como (más recientemente) por correo electrónico o a través de una página web. Igualmente, es común que en diseños experimentales o cuasi-experimentales los sujetos cumplimenten algún tipo de cuestionario o escalas de medición en formato autoadministrado. Entrevista En este caso nos encontramos con una situación que implica al sujeto objeto de estudio y a un entrevistador. Este último formula las preguntas y anota (codifica) las respuestas del entrevistado (que nunca tiene el cuestionario en sus manos). Conviene enfatizar que la entrevista tiene un carácter altamente estructurado, y de hecho es el cuestionario el que guía, de manera sistemática, la entrevista. El entrevistador ha de ceñirse a los criterios marcados por el investigador en el cuestionario, evitando convertirse en un elemento de distorsión de las respuestas. Su papel ha de ser meramente técnico, como “traductor” y “codificador” de la realidad a través del cuestionario que aplica. Existen dos formas fundamentales de entrevista, la telefónica (generalmente apoyada en software informático específico) y la personal (entrevistador y entrevistado se encuentran físicamente) (fig. 1).
PREGUNTAR Y CONTESTAR: CLAVES PRÁCTICAS PARA LA ELABORACIÓN DE CUESTIONARIOS No parece erróneo afirmar que la unidad básica del cuestionario es la pregunta. De hecho, un cuestionario consiste en un conjunto de preguntas cuyo objetivo fundamental consiste en estandarizar las respuestas de los sujetos a través de un conjunto de categorías homogéneo y comparable (las categorías de respuesta). Una pregunta puede tener dos o más categorías de respuesta, y de hecho la forma en la que preguntemos y la forma en la que codifiquemos las respuestas obtenidas constituye un elemento fundamental a tener en cuenta en el diseño de cualquier cuestionario. Además, estas preguntas y sus correspondientes categorías de respuestas serán posteriormente traducidas al lenguaje matemático-informático, y darán lugar a las variables que nos permitirán contrastar nuestras hipótesis. Por tanto, la formulación de las preguntas es un aspecto vital para construir un buen cuestionario3. Para empezar, conviene resaltar la importancia de un adecuado uso del lenguaje. No se trata de utilizar un lenguaje sofisticado, técnico o de utilizarlo “bien”. Lo importante es que el lenguaje utilizado sea accesible para la población/muestra que va a responder a dicho cuestionario. Es de vital im-
38
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 Formacion 1187 (412-416).qxp
18/10/07
17:40
Página 414
Sánchez Moreno E. Capítulo 6: Diseño de cuestionarios
Tabla 1. Potencialidades, ventajas, limitaciones y cautelas relativas a la forma de administración del cuestionario Forma de administración
Por correo (autoadministrada)
Entrevista telefónica
Entrevista personal
Ventajas/limitaciones relacionadas
Ventajas: 1. Reducido coste de envío (mayor aún en aquellas investigaciones que remitan el cuestionario a través de correo electrónico o recojan la información a través de un cuestionario telemático) 2. Posibilidad de una duración media del cuestionario (alrededor de 20 minutos como máximo, preferiblemente menor) Limitaciones y cautelas necesarias: 1. La formulación de las preguntas y sus categorías de respuesta ha de ser especialmente cuidadosa. Asimismo, el lenguaje utilizado ha de ser accesible para los sujetos. El cuestionario ha de ser atractivo, con un diseño cuidado 2. Es necesario elaborar una carta de presentación especialmente cuidadosa, utilizando en lo posible alguna institución de prestigio como valedora de la investigación. Igualmente es fundamental enfatizar el carácter confidencial de los datos que se van a facilitar. Evidentemente, es necesario incluir un sobre con franqueo para la devolución del cuestionario una vez cumplimentado 3. Conviene remitir un recordatorio en aquellos casos en los que no se obtenga respuesta, enfatizando la utilidad y relevancia de su participación en la investigación 4. La tasa de respuesta es muy baja. Es difícil señalar una tasa media de respuesta, pero en ningún caso el investigador debe esperar recibir más de 3-4 cuestionarios por cada 10 enviados Ventajas: 1. Coste medio, superior al correo pero notablemente inferior a la entrevista personal 2. Amplia cobertura de la red telefónica (fija y móvil) 3. Al contrario que el cuestionario remitido por correo, la tasa de respuesta es mayor 4. Presencia de un entrevistador asistido por un programa específico para codificar las respuestas Limitaciones y cautelas necesarias: 1. Duración máxima de la entrevista, que no debería exceder los 8 minutos en ningún caso, siendo altamente recomendable una duración menor 2. Es necesario evitar preguntas demasiado complicadas. Igualmente, las categorías de respuesta han de ofrecerse en un número moderado, para evitar los efectos de primacía y recencia. Preferiblemente, ha de ser el entrevistador el que codifique la respuesta obtenida Ventajas: 1. La duración de la entrevista puede alcanzar los 20-30 minutos. Como siempre, es recomendable ajustar al máximo la duración de la entrevista para evitar respuestas sesgadas, rápidas, poco meditadas, cómodas, etc. 2. Presencia de un entrevistador entrenado, con formación de carácter técnico 3. Alta consistencia/correspondencia entre la muestra extraída y los sujetos finalmente seleccionados Limitaciones y cautelas necesarias: 1. Elevado coste 2. Es preciso asegurar la adecuada cualificación de los entrevistadores, así como ofrecerles entrenamiento específico en el cuestionario concreto que vamos a utilizar
portancia que todos los sujetos entiendan adecuadamente y de forma homogénea las preguntas, con el fin de evitar sesgos u ocultaciones en las respuestas obtenidas. Asimismo, es necesario evitar preguntas que supongan un esfuerzo de memoria injustificado o cálculos demasiado complejos. Todo ello ayudará a que las respuestas de los entrevistados sean estandarizadas de manera válida y comparadas a través de técnicas de análisis estadístico. En segundo lugar la duración del cuestionario constituye (tal y como se indicó anteriormente) un factor fundamental. Por un lado, la forma de administración va a influir en la duración máxima recomendable. Por otro lado, no hay que olvidar que cada pregunta tiene un coste de tiempo y de dinero, dos elementos básicos para la planificación de la investigación. Por tanto, el cuestionario debe incluir únicamente preguntas relevantes para la investigación. Sólo aquellas preguntas que vayan a contribuir a contrastar las hipótesis (a su vez derivadas de los objetivos) deberán ser incluidas en el cuestionario, evitando alargarlo injustificadamente con preguntas formuladas “por curiosidad”, “por interés”, etc. Debe recordarse que un cuestionario excesivamente largo puede generar cansancio o desinterés en el entrevistado, factores ambos re-
lacionados con sesgos en las respuestas emitidas. Además, en numerosas ocasiones una pregunta más en nuestro cuestionario supone un incremento en el coste de su aplicación. En aquellas investigaciones donde la aplicación del cuestionario supone un capítulo importante del presupuesto, el criterio de relevancia a la hora de formular preguntas cobra aún mayor centralidad, ya que cada pregunta que añadimos incrementa el monto de la factura. En la investigación real, en la práctica cotidiana de la investigación, este factor tiene, en ocasiones, una importancia que va más allá de lo deseable, de manera que formular preguntas “por curiosidad” o en general preguntas que no sean útiles para contrastar las hipótesis es, en cierto sentido, un despilfarro. En otro orden de cosas conviene detallar la estructura de las preguntas que podemos incluir en nuestro cuestionario. En este sentido, existen diversos tipos de pregunta (véanse los ejemplos en la tabla 2). Cabe destacar los siguientes: 1. Abiertas (aquellas en las que el sujeto puede expresar con sus propias palabras la respuesta y se registra literalmente dicha respuesta).
39
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 Formacion 1187 (412-416).qxp
18/10/07
17:40
Página 415
Sánchez Moreno E. Capítulo 6: Diseño de cuestionarios
Tabla 2. Tipos de preguntas en un cuestionario. Ejemplos prácticos 1. ¿Es usted fumador, es decir, consume usted cigarrillos, puros, tabaco de pipa, etc., en este momento? (filtro, dicotómica) 1. Sí 2. No 1.1. Por término medio, ¿cuántos cigarrillos consume diariamente? 1. Menos de 5 2. De 5 a 10 cigarrillos 3. De 11 a 20 cigarrillos 4. Más de 20 cigarrillos 5. No sabe/no contesta 1.2. ¿Con qué frecuencia piensa en dejar de fumar? (respuestas categorizadas) 1. Nunca o casi nunca 2. Con muy poca frecuencia 3. Con poca frecuencia 4. Con bastante frecuencia 5. Con mucha frecuencia 6. Todos o casi todos los días 1.3. ¿Podría indicarme cuál es el grado de interés que usted tiene en dejar de fumar? Por favor, utilice la siguiente escala donde el 1 significa ningún interés y el 7 indica máximo interés (escala numérica, fin del filtro) Ninguno 1 2 3 4 5 6 7 Máximo (fin del filtro, ir a la pregunta 2) 2. Aparte de tabaco y alcohol, ¿consume algún otro tipo de droga? (filtro, dicotómica) 1. Sí 2. No (fin del cuestionario) 3. ¿Podría decirme cuáles? (respuesta múltiple, semicerrada) 1. Cannabis (porros, etc.) 2. Cocaína 3. Opiáceos (heroína, crak, etc.) 4. Anfetaminas 5. Inhalantes 6. Sintéticas (éxtasis, pastillas, MDMA) 7. Ketamina 8. Psicofármacos 9. Otras. ¿Cuáles? 10. No sabe/no contesta
2. Cerradas (aquellas en las que la respuesta del sujeto es codificada y clasificada según un número cerrado de categorías de respuesta) y semicerradas (las más utilizadas, similares a las cerradas pero con una categoría de respuesta abierta, categoría que suele tomar la forma de: “Otras. Por favor, especifique cuáles”). 3. De respuesta única o de respuesta múltiple. 4. Con respuesta dicotómica (sólo dos respuestas posibles), categorizada (varias categorías, ordenadas en ocasiones según orden ascendente o descendente) o de escala numérica (donde sólo se establecen los dos polos del continuo y el sujeto adecúa su respuesta en el espacio comprendido entre ambos). En cuanto a las categorías de respuesta en las preguntas cerradas o semicerradas existen dos requisitos básicos que deben cumplir: – Exhaustividad. Las categorías de respuesta deben cubrir todo el rango semántico de la pregunta. Dicho de otra manera, la respuesta que emita el sujeto debe tener cabida en las categorías de respuesta previstas al respecto. Esto es
especialmente importante en los cuestionarios autoadministrados. – Exclusividad. Las categorías de respuesta han de ser excluyentes entre sí. Dicho de otra manera, no debe haber duda en torno a la categoría de respuesta que refleja la respuesta del sujeto. Las categorías no deben solaparse. Como puede apreciarse el objetivo es el de aproximarse a la realidad de manera precisa y exacta. De hecho, precisión y exactitud son dos rasgos que han de caracterizar todas las preguntas (y sus correspondientes categorías de respuesta) de nuestro cuestionario, con el objetivo de medir adecuadamente las variables que utilizaremos en nuestro contraste de hipótesis. Se trata de una cuestión fundamental a la hora de diseñar el cuestionario. Anteriormente señalábamos que la formulación del objeto de estudio, de los objetivos del mismo y de las hipótesis, inciden directamente en el cuestionario que debemos diseñar, ya que éste constituye la forma en la que “traducimos” la información al lenguaje de investigación que hemos elegido (el matemático-estadístico). Pues bien, de la misma forma el diseño y aplicación del cuestionario incidirán en fases posteriores de nuestra investigación. Y en concreto, dicha influencia se dejará sentir de manera patente en el tipo de variables que tendremos a nuestra disposición y el tipo de análisis que podemos realizar. El próximo capítulo de esta serie se dedica específicamente a la cuestión del análisis estadístico. Baste decir aquí que diferentes tipos de pregunta dan lugar a diferentes tipos de variable. La variable constituye la “unidad mínima” del análisis estadístico, es la traducción de las preguntas (y respuestas) del cuestionario al lenguaje informático-matemático. En función del tipo de variable generado por nuestro cuestionario podremos aplicar un tipo de análisis estadístico u otro, de manera que el contraste de hipótesis tomará una forma u otra en función de la manera en la que preguntemos. Pues bien, todo esto (el tipo de variable que buscamos, las técnicas de análisis estadístico, el contraste de hipótesis, etc.) ha de estar en la mente del investigador que está formulando o buscando preguntas y respuestas para construir un cuestionario, con el objetivo de evitar imprevistos (por ejemplo, información insuficiente o mal estandarizada) cuando comencemos a contrastar, a poner a prueba nuestras hipótesis.
ÚLTIMAS SUGERENCIAS PARA LA CONSTRUCCIÓN DEL CUESTIONARIO Además de lo dicho hasta ahora conviene tener presente que a la hora de construir un cuestionario es altamente recomendable comprobar qué han hecho otros investigadores para medir los conceptos y procesos que estamos investigando. En muchas ocasiones investigaciones anteriores se ocupan del mismo objeto de estudio que plantea nuestra investigación. En este sentido, suele ser productivo acudir a los cuestionarios ya utilizados en otras investigaciones antes de construir el nuestro. Se pueden en-contrar muchas claves, incrementando además la comparabilidad de los resultados de nuestra investigación (es
40
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
06 Formacion 1187 (412-416).qxp
18/10/07
17:40
Página 416
Sánchez Moreno E. Capítulo 6: Diseño de cuestionarios
decir, incrementando las posibilidades de comparar los resultados de nuestra investigación con otras investigaciones que previamente hayan abordado nuestro objeto de estudio). En este sentido, y tal y como se ha mencionado anteriormente, existen cuestionarios o escalas específicas para medir conceptos particulares. Por ejemplo, autoestima, apoyo social, afrontamiento de la enfermedad, satisfacción con los servicios, calidad de vida, etc. Estas escalas suelen haber sido validadas en distintos contextos culturales y facilitan la obtención de datos válidos y consistentes. Por otro lado, conviene señalar que la elaboración del cuestionario constituye una tarea técnica. Evidentemente la intuición y conocimientos previos del investigador son herramientas útiles para elaborarlo, pero ciertamente dicha labor constituye una actividad basada en la destreza técnica del investigador. La elaboración de un buen cuestionario es vital para que la investigación ofrezca resulta-
dos válidos y relevantes, de manera que no conviene precipitarse en la aplicación del cuestionario, siendo altamente recomendable aplicarlo previamente (en un estudio piloto) a una muestra reducida (de entre 20 y 50 sujetos) para detectar los posibles problemas de comprensión, respuesta, codificación, funcionamiento de las categorías de respuesta, etc. De esta manera nos aseguramos de que la aplicación definitiva del cuestionario evitará problemas en su administración, ofreciendo datos válidos para contrastar nuestras hipótesis.
BIBLIOGRAFÍA 1. García Ferrando M, Ibáñez J, Alvira F. El análisis de la realidad social: métodos y técnicas de investigación. Madrid: Alianza. 2. Bosch JLC, Torrente D. Encuestas telefónicas y por correo. Madrid: CIS; 1993. 3. Azofra MJ. Cuestionarios. Madrid: CIS; 1999.
41
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
gˇ¯
15/12/07
14:40
Página 466
Seoane T et al. Capítulo 7: Estadística: Estadística Descriptiva y Estadística Inferencial
formación SOCIEMA
PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA Capítulo 7: Estadística: Estadística Descriptiva y Estadística Inferencial
T. Seoanea, J.L.R. Martína,b, E. Martín-Sáncheza, S. Lurueña-Segoviaa,c y F.J. Alonso Morenod,e aÁrea de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla-La bUnidad de Investigación Aplicada. Hospital Nacional de Parapléjicos. Toledo. cFENNSI Group. Fundación Hospital Nacional de Parapléjicos. Toledo. dCentro de Salud Sillería. Toledo. eResponsable de Investigación de Semergen.
Mancha (FISCAM). Toledo.
La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, permite obtener conclusiones válidas y tomar decisiones razonables basadas en el análisis. La estadística es, por tanto, la ciencia que recoge, clasifica y analiza la información que se presenta habitualmente mediante datos agregados que permiten que las observaciones puedan cuantificarse, medirse, estimarse y compararse utilizando medidas de tendencia central, medidas de distribución, métodos gráficos, etc. La estadística aplicada trata sobre cómo y cuándo utilizar los procedimientos matemáticos (estadística matemática) y cómo interpretar los resultados que se obtienen. Así, la bioestadística es la rama de la estadística que enseña y ayuda a investigar en todas las áreas de las ciencias de la vida donde la variabilidad es la regla. Se divide en dos grandes ramas, la bioestadística descriptiva y la bioestadística analítica o inferencial. La estadística descriptiva resume la información contenida en los datos recogidos y la estadística inferencial demuestra asociaciones y permite hacer comparaciones entre características observadas.
Statistics is the study of the scientific methods for collecting, organizing, summarizing, and analyzing data; it makes it possible to reach valid conclusions and make reasonable decisions on the basis of the analysis. Statistics is, therefore, the science of gathering, classifying, and analyzing information that is usually presented through aggregated data that enable observations to be quantified, measured, estimated, and compared using measurements of central tendency, measurements of distribution, graphical methods… Applied statistics deals with how and when to use the mathematical procedures (mathematical statistics) and how to interpret the results that are obtained using these procedures. Likewise, biostatistics is the branch of statistics that teaches and helps the investigator to carry out research in all of the different branches of the life sciences where variability is the rule. Biostatistics can be divided into two main areas: descriptive biostatistics and analytical or inferential statistics. Descriptive statistics summarizes the information contained in the data collected and inferential statistics demonstrates associations and makes it possible to make comparisons among the characteristics observed.
Palabras clave: estadística, bioestadística, variable, estadística descriptiva, inferencia estadística, contraste de hipótesis, regresión.
Key words: statistics, biostatistics, variable, descriptive statistics, statistical inference, hypothesis testing, regression.
INTRODUCCIÓN
Correspondencia: J.L.R. Martín. Área de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla-La Mancha (FISCAM). Edificio Bulevar. C/ Berna, n.o 2, local 0-2. 45003 Toledo. Correo electrónico: jlrmartin@jccm.es
La estadística se define como la ciencia matemática que se refiere a la recopilación, estudio e interpretación de los datos obtenidos en un estudio. Se aplica a una amplia variedad de disciplinas, entre las que cabe destacar las ciencias de la salud; en particular, en el campo de la Atención Primaria es necesario conocer los fundamentos de la estadística ya que la medicina es cada vez más cuantitativa, los resultados se utilizarán para la toma de decisiones pues se obtienen conclusiones correctas 42
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
gˇ¯
15/12/07
14:40
Página 467
Seoane T et al. Capítulo 7: Estadística: Estadística Descriptiva y Estadística Inferencial
de procedimientos diagnósticos y de diversas pruebas. La bioestadística es la disciplina que trata del desarrollo y aplicación de la teoría y métodos estadísticos en aquellos fenómenos que surgen de las ciencias biomédicas1,2. Como hemos estudiado en el capítulo “Selección de la muestra” de esta serie, para aplicar un análisis estadístico necesitamos recopilar información de cierta población que se define como el conjunto homogéneo de elementos que reúne unas características determinadas objeto de estudio. Por razones prácticas se estudia un subconjunto de la población denominado muestra, sobre el que realizamos las mediciones o el experimento para obtener conclusiones generalizables a la población. Los datos recogidos se analizan estadísticamente siguiendo dos propósitos: descripción e inferencia.
TIPOS DE DATOS La naturaleza de las observaciones es importante a la hora de elegir el método estadístico más apropiado para el análisis. La característica observada de cada individuo de la muestra se denomina variable, por ejemplo: el peso, la edad, el nivel de colesterol en sangre, etc., y se pueden clasificar en dos grupos según el tipo de valores que toman3-5: 1) Variables cualitativas: son variables que representan una cualidad, no pueden medirse numéricamente pero pueden clasificarse en una o varias categorías. A su vez las variables cualitativas se dividen en ordinales y nominales, dependiendo de que esas categorías admitan cierto orden. Por ejemplo, el estado de un paciente (leve, moderado, grave) es una variable cualitativa ordinal y la variable sexo (hombre, mujer) es una variable cualitativa nominal. 2) Variables cuantitativas: son variables que toman valores numéricos y que se dividen a su vez en dos categorías: variables continuas, asociadas a procesos de medición como la edad, el peso, etc., y variables discretas, asociadas a procesos de conteo, por ejemplo, número de hijos, de casos de sida, etc. Puede realizarse una transformación de una variable cuantitativa pasándola a una escala ordinal, este proceso se denomina categorización de una variable. Partiendo de una variable numérica creamos grupos de casos colapsándolos en k categorías. Por ejemplo, supongamos que hemos recogido la variable edad de los individuos que forman nuestra muestra, a partir de esta variable podemos crear una nueva variable (edad categorizada) de la forma siguiente: categoría 1 = joven (menores de 25 años), categoría 2 = mediana edad (individuos entre 26-59 años) y categoría 3 = mayor (individuos mayores de 60 años).
ción contenida en los datos reales, o bien utilizando representaciones gráficas que son muy útiles, ya que pueden aportar mucha información en un solo golpe de vista5,7. Si la variable a estudio es una variable cualitativa utilizaremos tablas de frecuencias, que consisten una representación estructurada de toda la información que se ha recogido sobre dicha variable. En estas tablas se detalla cada uno de los valores diferentes en el conjunto de datos con el número de veces que aparece, la frecuencia absoluta. Se puede completar añadiendo la frecuencia relativa que representa la frecuencia en porcentaje sobre el total de datos. Si describimos una variable cualitativa gráficamente debemos utilizar un diagrama de barras en el que se representan tantas barras como categorías tiene la variable, de forma que la altura de cada uno de los rectángulos es proporcional a la frecuencia de casos en cada clase; o un diagrama de sectores, en el que se divide un círculo en tantas porciones como clases tiene la variable, de forma que a cada una de las clases le corresponde un arco de círculo proporcional a la frecuencia absoluta o relativa. Supongamos que hemos recogido de una muestra de 100 individuos la variable “hábito tabáquico”, dicha variable tiene tres categorías: “fumador, no fumador y ex fumador”. La tabla de frecuencias se puede observar en la tabla 1 y las figuras 1 y 2. Las variables cuantitativas se describen mediante gráficos y medidas características. Las medidas características se clasifican en cuatro grupos: 1) Medidas de tendencia central: nos indican el valor alrededor del cual se agrupan los datos, dentro de este tipo de medidas distinguimos: – Media: que se obtiene sumando los valores de la variable divididos por el número total de datos. n
xi – = x1 + x2 + ... + xn = ⌺ i=1 X n n
– Mediana: es la observación que ocupa la posición central después de haber ordenado los datos, si el número de casos es impar será el dato que ocupa la posición (n + 1)/2, en el caso de que el número de observaciones sea par, la mediana se obtiene calculando la media de los datos que ocupan las posiciones n/2 y (n/2) + 1. – Moda: es el valor o valores más frecuentes de la distribución. 2) Medidas de dispersión: cuantifican la variabilidad de la distribución, es decir, nos dan una idea de la dispersión de los datos. Entre estas medidas distinguimos:
ESTADÍSTICA DESCRIPTIVA La estadística descriptiva es la parte de la estadística que sintetiza y resume la información contenida en un conjunto de datos, por tanto, un análisis descriptivo consiste en clasificar, representar y resumir los datos2,3,6. La descripción se puede hacer utilizando dos tipos de procedimientos: mediante el cálculo de índices estadísticos que son números que resumen de modo sencillo la informa-
Tabla 1. Distribución de frecuencias Frecuencia absoluta
Fumador No fumador Ex fumador
Frecuencia relativa
Simple
Acumulada
Simple
Acumulada
45 27 28
45 72 100
0,45 0,27 0,28
0,45 0,72 1
43
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
15/12/07
14:40
Página 468
Seoane T et al. Capítulo 7: Estadística: Estadística Descriptiva y Estadística Inferencial
50
45
A
C
B
40 30
26
28 X
0
20 10 0
1
2
3
4
5
6
Figura 3. Asimetría. A = asimétrica por la derecha; B = función simétrica; C = asimétrica por la izquierda.
Fumador
No fumador
A
Ex fumador
Fuma B Figura 1. Diagrama de barras. C Ex fumador
X
0
1
2
3
4
5
6
Figura 4. Curtosis. A = leptocúrtica; B = mesocúrtica; C = platocúrtica;
40 Fumador
30 No fumador
Figura 2. Diagrama de sectores.
Frecuencia
gˇ¯
20
10
– Varianza: mide la dispersión de los datos alrededor del valor medio. Cuanto mayor sea la varianza mayor es la variabilidad y cuanto menor sea más homogénea será la distribución. 1 n S2 = n ⌺ (xi – x–) i=l – Desviación típica: que se define como la raíz cuadrada de la varianza, informa sobre la dispersión de la distribución y se expresa en las mismas unidades que la variable. – Rango: es la diferencia entre el valor mayor y el valor menor de la distribución, por tanto, está muy influenciado por los outliers. 3) Medidas de posición: entre este tipo de medidas distinguimos: – Percentiles: el percentil de orden k es el valor de la variable que deja por debajo el k% de las observaciones. – Cuartiles: dividen el conjunto de datos en cuatro grupos de igual tamaño, el Q1 o 1.er cuartil deja por debajo el 25% de los datos, el Q2 o 2.o cuartil es la mediana y el Q3 o 3.er cuartil deja por debajo de sí el 75% de los datos.
0 140
150
160
170
180
190
200
Altura (cm)
Figura 5. Histograma, representa la variable aleatoria altura de una muestra de 316 individuos.
4) Medidas de forma: describen dos aspectos de la distribución: – Asimetría: se define el coeficiente de asimetría como el grado en que los datos se reparten por encima y por debajo de la tendencia central (fig. 3). – Curtosis: indica el grado de apuntamiento de la distribución en la zona central (fig. 4). Para resumir una variable aleatoria numérica continua, como por ejemplo la edad, se puede utilizar el histograma, en el cual el rango de valores de la variable se divide en intervalos de igual amplitud, sobre cada intervalo se representa un rectángulo de forma que su altura mantiene la proporción entre las frecuencias (absolutas o relativas) y la longitud del intervalo (fig. 5). 44
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
15/12/07
14:40
Página 469
Seoane T et al. Capítulo 7: Estadística: Estadística Descriptiva y Estadística Inferencial
200 190 180 170 160 150 140 Altura (cm) Figura 6. Diagrama de cajas, representa la variable aleatoria altura de una muestra de 316 individuos.
200 190 Altura (cm)
gˇ¯
180
62
170 160 150 140 Hombre
Mujer Sexo
Figura 7. Diagrama de cajas, representa la variable aleatoria altura de una muestra de 316 individuos por sexo.
El diagrama de cajas es otra forma de describir gráficamente una variable de tipo numérico, este tipo de gráfico utiliza los percentiles, de forma que la caja central concentra el 50% de los datos (sus límites se corresponden con el 1.er y 3.er cuartil). La línea central representa la mediana. Los “bigotes” de los extremos de las cajas encierran el 95% de los datos centrales (pueden coincidir en algunos casos con los extremos de la distribución), se representan los valores extremos, denominados outliers, por puntos y por asteriscos. Una de las ventajas de este tipo de gráficos es que podemos de forma visual detectar posibles errores en los datos y además nos permite comparar grupos de sujetos (figs. 6 y 7).
INFERENCIA ESTADÍSTICA La inferencia se define como el conjunto de métodos estadísticos que permiten deducir cómo se distribuye la población e inferir las relaciones entre variables a partir de la información que proporciona la muestra recogida8. Por tanto, los objetivos fundamentales de la inferencia estadís-
tica son la estimación y el contraste de hipótesis. Para que un método de inferencia estadística proporcione buenos resultados debe basarse en una técnica matemática (estadística) adecuada al problema planteado, además la muestra seleccionada debe ser representativa de la población y de tamaño suficiente (tabla 2). La estimación estadística es el conjunto de técnicas que nos permitirán dar un valor aproximado de un parámetro poblacional a partir de la información obtenida de la muestra. Para realizar estimaciones utilizaremos ciertas fórmulas que dependen de los valores obtenidos en la muestra, se denominan estimadores. Un buen estimador debe ser insesgado, lo que significa que la estimación muestral debe coincidir con la poblacional; eficiente, es decir, de mínima varianza; y suficiente, debe utilizar toda la información contenida en la muestra. La estimación de un parámetro poblacional utilizando un único valor se denomina estimación puntual; por ejemplo, para estimar la edad media poblacional utilizaremos la edad media muestral, pero este tipo de estimación tiene ciertos inconvenientes, ya que no podemos conocer cómo de precisa es esta medida. La estimación por intervalos de confianza nos permite presentar una estimación acompañada de cierto margen de error (con un límite superior y un límite inferior), por tanto, un intervalo de confianza es simplemente un rango de valores que contiene el parámetro poblacional con cierta probabilidad. Esta probabilidad se denomina nivel de confianza y se denota por (1-␣), aunque habitualmente se expresa en tanto por ciento. Los niveles de confianza que se utilizan generalmente son del 95%, del 90% o del 99%, que se corresponden con un nivel de significación, que es la probabilidad de que la estimación falle, del 0,05, 0,1 y 0,01, respectivamente. Para calcular intervalos de confianza se debe utilizar el error estándar, que es una medida de dispersión de la media muestral alrededor de la media poblacional. Se calcula como el cociente entre la desviación típica y la raíz cuadrada del número de observaciones (s/n).
PRUEBAS ESTADÍSTICAS Las pruebas estadísticas8,9 forman parte de la teoría de decisión, a partir de la información que extraemos de la muestra estimamos características generales de la población de referencia. Existen tres tipos de pruebas estadísticas: 1) Pruebas de conformidad: en las que se comprueba si una estimación coincide con un valor teórico. Por ejemplo, queremos comprobar si la proporción de recurrencia de una úlcera duodenal al tomar cierto fármaco es inferior al 10%. 2) Pruebas de homogeneidad: comparan poblacionalmente dos o más grupos; supongamos que nos interesa comprobar si la proporción de recurrencia de la úlcera duodenal con un nuevo fármaco es igual a la proporción de recurrencia en pacientes tratados con otro fármaco. 45
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
gˇ¯
15/12/07
14:40
Página 470
Seoane T et al. Capítulo 7: Estadística: Estadística Descriptiva y Estadística Inferencial
Tabla 2. Principales técnicas estadísticas Variable dependiente (Y) Variable independiente (x) Cualitativa (nominal)
Cualitativa (nominal) Cualitativa (ordinal) Cuantitativa (discreta) Cuantitativa (normal) Cuantitativa (no normal)
Comparación 2 proporciones/ Chi-cuadrado Chi-cuadrado
Cualitativa (ordinal)
Chi-cuadrado
Regresión logística
3) Pruebas de relación: evalúan la relación entre variables. Los contrastes de hipótesis o tests de hipótesis10 permiten comprobar si la información muestral concuerda con la hipótesis estadística formulada, nos permiten cuantificar hasta qué punto los resultados de un estudio particular dependen de la variabilidad de la muestra. La hipótesis que se contrasta se denomina hipótesis nula y se denota por H0, se puede interpretar como la hipótesis que normalmente sería aceptada mientras los datos no indiquen lo contrario. Rechazar la hipótesis nula supone asumir una hipótesis complementaria, la hipótesis alternativa (H1), como correcta. Para realizar un contraste de hipótesis debemos definir la hipótesis nula y la alternativa y definir una medida, el estadístico de contraste, que permite cuantificar la magnitud de la diferencia entre la información que proporciona la muestra y la hipótesis H0. Se pueden cometer dos tipos de errores11: 1) Error tipo I: rechazamos la hipótesis nula cuando es cierta. 2) Error tipo II: no rechazamos la hipótesis nula cuando es falsa. En la práctica no es posible saber si estamos cometiendo un error tipo I o un error tipo II, pero existen ciertas recomendaciones para disminuir dichos errores. Por ejemplo, para disminuir el error tipo I deberíamos depurar la base de datos para evitar posibles outliers o valores extremos que puedan producir resultados significativos, utilizar un nivel de significación pequeño y disponer de una teoría que guíe las pruebas. Para reducir el error tipo II es aconsejable incrementar el tamaño muestral, estimar la potencia estadística o incrementar el tamaño del efecto a detectar. Es necesario establecer a priori el nivel de significación (␣) que se define como la probabilidad de cometer un error tipo I, normalmente se elige un valor pequeño, el 5% o el 1%. El valor del nivel de significación divide en dos regiones el conjunto de posibles valores del estadístico de contraste: 1) Zona de rechazo (con probabilidad ␣, bajo H0). 2) Zona de aceptación (con probabilidad 1-␣, bajo H0).
Cuantitativa (discreta)
Cuantitativa (normal)
Cuantitativa (no normal)
Mann-Whitney/ Druskall-Wallis
t de Student/ ANOVA
Mann-Whitney/ Druskall-Wallis
Correlación/ Regresión Poisson
Correlación/Regresión lineal
Cuando analizamos la muestra obtendremos la significación del contraste, que se representa con la letra p, es un indicador de la discrepancia entre la hipótesis nula y los datos muestrales, de forma que cuanto más se acerque a cero tenemos mayor evidencia en contra de la hipótesis nula (si p es menor que el nivel de significación rechazaremos H0). Debemos tener en cuenta que la significación estadística depende de la magnitud de la diferencia que queremos probar, cuanto mayor sea esta diferencia más sencillo será demostrar que es significativa. Al mismo tiempo depende también del tamaño muestral, cuanto más grande sea el número de observaciones más sencillo es detectar diferencias.
MODELOS DE REGRESIÓN Los modelos de regresión estudian la relación cuantitativa12 entre una variable de interés, que se denomina variable respuesta o dependiente (Y), y un conjunto de variables explicativas (X1,X2,…,Xk). Puede ocurrir que exista una relación funcional, de forma que el conocimiento de las variables explicativas determina el valor de la variable dependiente, o, en cambio, que no exista ninguna relación, lo que significa que conocer el valor de las variables (X1,X2,...,Xk) no aporta ninguna información sobre la variable Y. Lo habitual es que exista cierta relación entre ellas de manera que el hecho de conocer el valor de las variables independientes nos permite predecir el valor de la variable respuesta. Existen tantos modelos como funciones matemáticas, los más utilizados son: el modelo de regresión lineal, polinómico, logístico, de Poisson, etc. Los modelos de regresión se utilizan con dos objetivos: 1) Predicción: se pretende predecir la variable dependiente utilizando un conjunto de variables independientes. 2) Estimación: el interés se centra en apreciar la relación entre la variable respuesta y las variables explicativas. Cuando utilizamos los modelos de regresión para la estimación debemos tener en cuenta dos conceptos importantes, la interacción y la confusión. Existe interacción cuando la asociación entre la variable respuesta y la variable independiente varía según los diferentes niveles de otra variable. Y existe confusión cuando la asociación entre la variable respuesta y la de exposición difiere significativamente si se considera, o no, una tercera variable, denominada variable de confusión. 46
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
gˇ¯
15/12/07
14:40
Página 471
Seoane T et al. Capítulo 7: Estadística: Estadística Descriptiva y Estadística Inferencial
El modelo de regresión más sencillo es el Modelo de Regresión Lineal13 que estudia la posible relación lineal entre la variable dependiente, que es una variable cuantitativa, y las variables independientes. La metodología de la regresión lineal no se puede aplicar cuando la variable respuesta es dicotómica, por ejemplo, presencia/ausencia de una enfermedad. En estos casos el modelo de regresión que se debe utilizar es el Modelo Logístico14.
BIBLIOGRAFÍA 1. Daniel WW. Bioestadística. Base para el análisis de las ciencias de la salud. México: Ed. Uteha. Noriega Editores; 1995. 2. Martín Andrés A, Luna del Castillo J. Bioestadística para las ciencias de la salud. 4.ª ed. Madrid: Ed. Norma; 1994. 3. Cao R, Francisco M, Naya S, Presedo MA, Vázquez M, Vilar JA, Vilar JM. Introducción a la Estadística y sus aplicaciones. Ed. Pirámide; 2001.
4. Dawson-Saunders B, Trapp RG. Bioestadística Médica. 2.ª ed. México: Editorial el Manual Moderno; 1996. 5. Altman DG, Bland JM. Statistics Notes: Presentation of numerical data. BMJ. 1996;312:572. 6. De la Horra J. Estadística aplicada. Díaz de Santos; 1995. 7. Singer PA, Feinstein AR. Graphical display of categorical data. J Clin Epidemiol. 1993;46:231-6. 8. Wassertheil-Smoller S. Biostatistics and Epidemiology. A primer for health professionals. 2nd ed. New York: Springer-Verlag; 1995. 9. Altman DG. Preparing to analyse data. En: Practical statistics for medical research. London: Chapman and Hall; 1991. p. 132-45. 10. Jekel JF, Elmore JG, Katz DL. Epidemiology Biostatistics and Preventive Medicine. Philadelphia: W.B. Saunders Company; 1996. 11. Daly LE, Bourke GJ. Interpretation and uses of medical statistics. 5th ed. Oxford: Blackwell science; 2000. 12. Pita Fernández S, Rey Sierra T, Vila Alonso MT. Relaciones entre variables cuantitativas (I). Cuadernos de Aten Primaria. 1997;4: 141-5. 13. Altman DA. Practical statistics for medical research. 1th ed. repr. 1997. London: Chapman & Hall; 1997. 14. Hosmer DW, Lemeshow S. Applied Logistic Regression, 2nd ed. New York: Wiley; 2000.
47
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 509
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
formación SOCIEMA
PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA
Capítulo 8: Pruebas diagnósticas. Concordancia C. Gómez Gonzáleza y J.F. Pérez Castánb aEspecialista en Medicina Preventiva. Máster en Salud Pública. Servicio de Medicina bEspecialista en Medicina Familiar y Comunitaria. Máster en Salud Pública. Técnico
Preventiva del Hospital San Pedro de Alcántara. Cáceres. de Salud. Unidad Docente y Gerencia de Atención Primaria.
Don Benito-Villanueva de la Serena. Badajoz.
.Los procesos diagnósticos en la práctica clínica habitual se basan en el manejo de probabilidades que nos ayudan a la toma de decisiones ante la incertidumbre inherente a ellos. La interpretación de síntomas y signos que presentan los pacientes es el paso inicial de aproximación diagnóstica, siendo ésta la probabilidad pre-prueba o la prevalencia de una determinada enfermedad y que es conocida a priori. Al realizar una serie de pruebas diagnósticas de forma simultánea (en paralelo) o secuencial (en serie), determinamos la probabilidad posprueba de tener la enfermedad o el valor predictivo positivo. El rendimiento diagnóstico de una prueba es mayor al aumentar la diferencia entre ambas y está claramente influido por la prevalencia de la enfermedad en los individuos donde se aplicó la prueba. La sensibilidad y la especificidad definen la validez de una prueba, siendo características intrínsecas de la misma, y su relación queda definida en las curvas ROC, que indican la probabilidad de tener la prueba positiva en un enfermo con respecto a uno sano. Las tablas 2x2 son la forma básica de cálculo de la relación entre enfermedad y resultado de aplicación de una prueba; es necesario saber construirla a partir de las características de la prueba empleada y de la prevalencia de la enfermedad. Es necesario conocer el grado de acuerdo entre dos métodos diagnósticos, entre dos observadores o por un mismo observador en distintos momentos del tiempo.
The diagnostic processes in the common clinical practice are based on the management of likelihoods that help us make decisions when faced with their inherent uncertainty. Interpretation of the signs and symptoms that the patients have is the initial step in the diagnostic approach, this being the pre-test likelihood or prevalence of a certain disease which is known a priori. When a series of diagnostic tests are made simultaneously (in parallel) or sequentially (in series), we determine the post-test likelihood of having the disease or the Positive Predictive Value. Diagnostic performance of a test is greater when the difference between both increases and this is clearly influenced by the prevalence of the disease in the individuals in whom the test is applied. Sensitivity and specificity define the validity of a test, these being intrinsic characteristics of it, and their relationship is defined in the ROC curves that indicate the likelihood of having a positive test in a patient compared to a healthy subject. The 2x2 tables are the basic form of calculation of the relationship between disease and the result of the application of a test. It is necessary to know how to construct them based on the characteristics of the test used and the disease prevalence. The degree of agreement between two diagnostic methods, between two observers or between the same observer at different points in time must also be known.
Palabras clave: investigación, Atención Primaria, pruebas diagnósticas.
Key words: investigation, Primary Health Care, diagnostic tests.
INTRODUCCIÓN Las pruebas diagnósticas, exámenes diagnósticos o test, forman parte de la práctica habitual del médico clínico. Su manejo no es siempre fácil y la solicitud de las mismas e Correspondencia: J.L.R. Martín. Jefe del Área de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla La Mancha (FISCAM). Edificio Bulevar. C/ Berna, n.o 2, local 0-2. 45003 Toledo. Correo electrónico: jlrmartin@jccm.es
interpretación en el contexto de sospecha o confirmación diagnósticas es un reto diario que forma parte de la incertidumbre y que nos lleva a aceptar y asumir que el error diagnóstico es un hecho posible1,2. Bajo la denominación de pruebas diagnósticas se engloban las pruebas utilizadas para la detección precoz de enfermedades y las pruebas confirmatorias, que deben cumplir requisitos distintos en función de su utilidad. El abordaje inicial de un paciente es realizado a través de una buena anamnesis, inspección y examen físico. En cada uno de estos pasos aplicamos criterios que nos van 48
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 510
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
orientando hacia una sospecha diagnóstica, que puede derivar de forma inicial en una actividad terapéutica si el grado de certeza es alto o hacer necesaria la realización de pruebas complementarias si el grado de certeza diagnóstica es insuficiente. Si dispusiéramos de pruebas perfectas no habría incertidumbre, pero la realidad es que todas llevan algún grado de error que debemos conocer y asumir. En un término amplio estamos hablando de pruebas clínicas porque todas ellas tienen un objetivo común, realizar un diagnóstico, y engloban no solamente pruebas de laboratorio, radiológicas, sino también los pasos del examen clínico. El diagnóstico se enmarca dentro de un proceso general de toma de decisiones y es un proceso dinámico que nos permite manejarnos en términos de probabilidades hacia la confirmación de una enfermedad o hacia su descarte.
CARACTERÍSTICAS DE LAS PRUEBAS DIAGNÓSTICAS Una buena prueba diagnóstica es aquélla que resulte normal en los individuos sanos y anormal en los individuos enfermos. La expresión real de los resultados de la aplicación de una prueba permite clasificar a un individuo sano o enfermo, con resultados correctos o incorrectos de la prueba, y constituir de esta manera las tablas 2x2 (tabla 1). Hemos de manejar conceptos como la sensibilidad y la especificidad, que son características de la prueba, mientras que los valores predictivos positivo (VPP) y negativo (VPN) son el resultado de aplicar una prueba a la población con una prevalencia determinada de enfermedad. Como clínicos, cuando aplicamos una prueba diagnóstica tenemos que valorar: 1. Tipo de enfermedad: a) Prevalencia (factores de riesgo aumentan la prevalencia). b) Gravedad. c) Curable o no. ¿Tiene tratamiento? d) ¿Podemos perder casos? ¿Podemos asumir los falsos negativos? e) ¿Qué consecuencias tienen los falsos positivos? f) Interés en diagnosticarla o en excluirla. 2. Tipo de prueba aplicada. Qué sensibilidad y especificidad tiene la prueba en estudios previos validados.
3. Contexto y tipo de población donde se aplica la prueba. Validez, fiabilidad y seguridad Las características que debe tener una prueba son validez, fiabilidad y seguridad, es decir, que mida lo que realmente pretende, que sea reproducible produciendo resultados semejantes y que pueda predecir la presencia o ausencia de enfermedad3-8. Validez
Es la capacidad de la prueba para medir lo que pretende medir. Es el grado de coincidencia entre los resultados de la prueba y los exámenes diagnósticos más complejos y rigurosos subsiguientes que se constituyen como patrón de referencia o estándar, aunque éstos no siempre son perfectos o están disponibles. Las medidas de la validez son la sensibilidad y la especificidad, que realizan el análisis de la tabla por columnas. Ambas son características inherentes a la prueba (tabla 1). 1. Sensibilidad. Probabilidad de que un enfermo sea identificado correctamente por la prueba, es decir, que tenga una prueba positiva. Son los enfermos con prueba positiva de entre todos los enfermos. 2. Especificidad. Probabilidad de que un individuo sin la enfermedad sea identificado correctamente por la prueba, es decir, que tenga una prueba negativa. Son los sanos con prueba negativa de entre todos los sanos. 3. Proporción de falsos negativos (c/[a + c]). Probabilidad de que un enfermo sea identificado incorrectamente por la prueba y obtenga una prueba negativa. Son los enfermos con prueba negativa de entre todos los enfermos. 4. Proporción de falsos positivos (b/[b + d]). Probabilidad de que un individuo sin la enfermedad sea identificado incorrectamente por la prueba, es decir, que tenga una prueba positiva. Son los sanos con prueba positiva de entre todos los sanos. Sensibilidad y especificidad son conceptos que expresan la capacidad intrínseca de la prueba y resultan valores estables para cada una. Una prueba puede presentar distintos valores de sensibilidad y especificidad, según las condiciones de su realización. Se pueden utilizar en todas las poblaciones y no varían con la prevalencia, siendo ésta la probabilidad de que el su-
Tabla 1. Tabla 2 ⫻ 2. Cálculo de las características de las pruebas diagnósticas Enfermedad
Prueba diagnóstica
Presente
Ausente
+
Verdadero positivo a
Falso positivo b
a+b
Valor predictivo positivo = a/(a + b)
–
Falso negativo c
Verdadero negativo d
c+d
Valor predictivo negativo = d/(c + d)
a+c
b+d
a+b+c+d
Sensibilidad = a/(a + c)
Especificidad = d/(b + d)
Prevalencia = a + c/(a + b + c + d)
49
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 511
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
jeto esté enfermo antes de realizar la prueba, que se conoce como probabilidad pre-prueba. Si no tenemos ninguna información adicional sobre el sujeto, dicha probabilidad será la prevalencia de la patología en la población, aplicable sólo en el caso de programas de cribado o screening sobre la población general, ya que en la práctica habitual los sujetos candidatos a una prueba diagnóstica lo son por las sospechas deducidas de la anamnesis o por una sintomatología, exploraciones o pruebas previas y, por tanto, la probabilidad de que padezcan la enfermedad bajo sospecha será superior a la prevalencia de ésta en la población general. Seguridad
Capacidad de una prueba para predecir la ausencia o la presencia de enfermedad. Los valores predictivos o probabilidad posprueba representan la probabilidad de que el paciente tenga la enfermedad una vez que conocemos el resultado de la prueba. 1. Valor predictivo positivo (VPP). Probabilidad de que un individuo con prueba positiva tenga la enfermedad. Corresponde a los enfermos con pruebas positivas de entre todas las pruebas positivas. 2. Valor predictivo negativo (VPN). Probabilidad de que un individuo con prueba negativa no tenga la enfermedad, es decir, que esté realmente sano. Corresponde a los pacientes sanos con prueba negativa de entre todas las pruebas negativas.
en este caso es del 5% (0,05) y ponemos el resultado 1.000 * 0,05 = 50 en la celda de a + c. Ahora podemos obtener la celda del número de enfermos b + d restando al total (a + b + c + d) (1.000) el n.o de enfermos (a + c) (50), con lo que nos da 950, y lo ponemos en su celda (tabla 4). 4. Multiplicamos a + c (50) por la sensibilidad de la prueba que nos ha indicado el fabricante, que es del 94% (0,94), y ponemos la cifra (47) en la casilla a (tabla 5). 5. Multiplicamos b + d (950) por la especificidad que nos ha indicado el fabricante, que es del 90% (0,90), y la cifra (855) la ponemos en d (tabla 6). 6. A partir de ahí iremos rellenando, sumando y restando, el resto de las casillas vacías (tabla 7). Ya podemos calcular el VPP, el VPN y la exactitud de la prueba e informar al paciente sobre el valor real que tienen esos resultados. VPP = a/(a + b) = 47/142 = 0,33. Si su prueba dio positivo, hay un 33% de probabilidad de que tenga realmente la enfermedad. VPN = d/(c + d) = 855/858 = 0,99. Si su prueba dio negativo, podemos descartar la enfermedad en un 99%.
Tabla 2. Ejemplo 1 de cómo hacer una tabla 2 ⫻ 2 Enfermedad
CÓMO HACER UNA TABLA DE 2 ⫻ 2 Ya sabemos cómo son las tablas de 2x2, lo que es la sensibilidad, la especificidad, el VPP y el VPN. Ahora vamos a tratar de ver la utilidad que puede tener todo esto para un clínico. Imaginemos que estamos en la consulta y que queremos hacer el diagnóstico a un paciente. Lo primero que hacemos es buscar una prueba diagnóstica con una sensibilidad y una especificidad apropiadas para el tipo de diagnóstico que queremos hacer (confirmar un diagnóstico, la gravedad de la enfermedad, etc.). Nosotros habitualmente para diagnosticar una enfermedad nos apoyamos en una serie de pruebas diagnósticas clínicas y/o complementarias de más o menos probada utilidad y con una sensibilidad y una especificidad determinadas que nos vienen ya dadas y sobre las que nosotros no podemos influir, sólo decidir si la utilizamos o no. Pero ¿cómo sabremos qué capacidad predictora tiene esta prueba al ser aplicada sobre nuestra población de referencia? ¿Qué le decimos al paciente en el caso de que dé positivo? ¿Y si da negativo? Él nos preguntará si este diagnóstico es definitivo, si la predicción es real o si puede existir alguna duda en el diagnóstico y cómo de grande es esa duda. Para ello construiremos1 una tabla de 2x2 con los datos de que disponemos: 1. Dibujamos una tabla de 2x2 en blanco (tabla 2). 2. Añadimos un número total (a + b + c + d) ficticio que nos resulte cómodo para hacer operaciones matemáticas, por ejemplo el 1.000 (tabla 3). 3. Multiplicamos 1.000 por la prevalencia de la enfermedad existente en nuestra población. Supongamos que
Prueba diagnóstica
+ – a+c
Presente
Ausente
a c b+d
b d a+b+c+d
a+b c+d
Tabla 3. Ejemplo 2 de cómo hacer una tabla 2 ⫻ 2 Enfermedad Presente
Prueba diagnóstica
Ausente
+ – 1.000
Tabla 4. Ejemplo 3 de cómo hacer una tabla 2 ⫻ 2 Enfermedad
Prueba diagnóstica
Presente
Ausente
50
950
+ – 1.000
Tabla 5. Ejemplo 4 de cómo hacer una tabla 2 ⫻ 2 Enfermedad Presente
Prueba diagnóstica
+ –
Ausente
47 50
950
1.000
50
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 512
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
Tabla 6. Ejemplo 5 de cómo hacer una tabla 2 ⫻ 2
Tabla 8. Ejemplos de utilización de pruebas diagnósticas Diagnóstico de cáncer de próstata por PSA
Enfermedad Presente
Prueba diagnóstica
+ –
Sensibilidad 15%, especificidad 91%
Ausente
47
Enfermedad
855 950
50
Sí
1.000 PSA positivo PSA negativo Total
Tabla 7. Ejemplo 6 de cómo hacer una tabla 2 ⫻ 2 Enfermedad
Prueba diagnóstica
+ –
Presente
Ausente
47 3 50
95 855 950
142 858 1.000
Elegiremos una prueba sensible 1. Cuando hagamos un screening o cribado para captar a todos los enfermos. 2. Ante enfermedades graves, donde no podemos perder casos (cáncer de mama, prueba de otoemisiones para la sordera infantil, etc.). 3. Ante enfermedades tratables. 4. Cuando se necesita detectar el máximo número de casos de la enfermedad en la población general (debido a que el diagnóstico tardío puede conllevar pronóstico fatal). 5. Cuando los falsos positivos no supongan un trauma psicológico o económico para los individuos. 6. Si los falsos negativos producen un trastorno importante (dejamos la enfermedad sin tratar). Las pruebas muy sensibles implican que cuando se aplican a un individuo determinado y es negativa podemos descartar con confianza que tenga la enfermedad, porque si la tuviera hubiera dado positivo. Sin embargo, cuando es positiva no podemos asegurar que sea enfermo, y algunos de los individuos que hemos considerado inicialmente enfermos no tendrán la enfermedad (falsos positivos). Elegiremos una prueba específica 1. Cuando la enfermedad sea importante pero difícil de curar o incurable. 2. Cuando exista gran interés por conocer la ausencia de enfermedad. 3. Cuando los falsos positivos puedan suponer un trauma psicológico o económico a los individuos. 4. Cuando necesitemos pruebas de confirmación diagnóstica (VIH, esclerosis en placas, etc.).
25 135 160
Prevalencia Sensibilidad Especificidad Porcentaje FN Porcentaje FP VPP VPN 1-VPP 1-VPN
75 765 840
100 900 1.000
16,00 0,156 0,91 84,38 8,93 25,00 85,00 75,00 15,00 Determinación del D-dímero para el diagnóstico de trombosis venosa profunda
UTILIZACIÓN DE PRUEBAS DIAGNÓSTICAS La sensibilidad y la especificidad nos permiten valorar una prueba diagnóstica, pero carecen de utilidad en la práctica clínica. Nos hablan de la “bondad” de una prueba según el objetivo diagnóstico y el tipo de patología que queramos detectar, pero no podemos saber con certeza quién está enfermo o no lo está tras su aplicación (tabla 8).
No
Sensibilidad 95%, especificidad 60% Enfermedad Sí
D-dímero positivo D-dímero negativo Total Prevalencia Sensibilidad Especificidad Porcentaje FN Porcentaje FP VPP VPN 1-VPP 1-VPN
152 8 160
No
588 252 840
740 260 1.000
16,00 0,95 0,30 5,00 70,00 20,54 96,92 79,46 3,08
FN: falsos negativos; FP: falsos positivos; PSA: antígeno prostático específico; VPP: valor predictivo positivo; VPN: valor predictivo negativo.
Las pruebas muy específicas identificarán a todos los individuos sanos, de tal manera que cuando se aplican a un individuo determinado y es positiva se puede asumir con confianza que el individuo está enfermo. Pero si la prueba es negativa, no podríamos asegurar que fuese un individuo sano, ya que puede haber falsos negativos. En las pruebas poco específicas hay un número elevado de falsos positivos, lo que provoca un sobrediagnóstico con realización posterior de pruebas confirmatorias. El interés clínico en el procedimiento diagnóstico es saber la probabilidad con que la prueba nos proporciona un diagnóstico correcto. La respuesta a esto la encontramos en el análisis horizontal de la tabla. Elegiremos una prueba con alto valor predictivo positivo 1. Cuando el tratamiento de los falsos positivos pudiera tener graves consecuencias (quimioterapia). 2. Cuando queramos hacer una prueba de cribado. 51
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 513
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
Tabla 9. Relación sensibilidad-especificidad y los resultados de la prueba FN
FP
VPP
VPN
Sensibilidad elevada
↓
↑
↓
↑
(+) Tienden a confirmar presencia de enfermedad Su valor depende del número de FP (-) Descartan el diagnóstico con alta probabilidad
Resultado de la prueba
Especificidad elevada
↑
↓
↑
↓
(+) Son muy sugestivos de enfermedad porque hay pocos falsos positivos (-) No permite descartar el diagnóstico Su valor depende del número de FN
FN: falsos negativos; FP: falsos positivos; VPN: valor predictivo negativo; VPP: valor predictivo positivo.
El VPP depende de la prevalencia, de la especificidad y, en menor grado, de la sensibilidad. Elegiremos una prueba con alto valor predictivo negativo La elegiremos cuando un falso negativo tenga consecuencias indeseables. Los valores predictivos de los signos, los síntomas y las pruebas de laboratorio cambian con la prevalencia de la enfermedad en la población donde se aplica la prueba y también con la sensibilidad y la especificidad. Al aumentar la prevalencia aumenta el VPP para una misma sensibilidad y especificidad, ya que disminuye el número de falsos positivos. Es importante que la enfermedad sea frecuente en la población elegida cuando se va a realizar un cribado, y ello se consigue aplicando la prueba a la población de riesgo. El VPP es el parámetro de mayor relevancia para los programas de screening, pues un bajo valor significa que la prevalencia es baja, que la prueba es poco específica o ambas cosas. En el ejemplo podemos observar la aplicación de la prueba del antígeno prostático específico (PSA) en el diagnóstico del cáncer de próstata y dímero-D para la trombosis venosa profunda (tabla 8). Observamos que un resultado negativo de la prueba, el D-dímero es más concluyente, ya que existe un 3% de probabilidad de estar enfermo frente a un 15% en el PSA. Podemos ver en la tabla 9 la relación entre la sensibilidad, la especificidad y la valoración de los resultados de la prueba. Pongamos otro ejemplo, se hizo un estudio sobre las otoemisiones acústicas para el cribado universal de hipoacusia congénita9-11. Se utiliza como prueba de screening las otoemisiones evocadas acústicas (OEA), que es una prueba rápida, económica y sencilla, combinada con los potenciales evocados (PEATC) para la confirmación diagnóstica. En estudios previos los valores de sensibilidad oscilan entre el 85 y el 94%. Las hipoacusias que escapan a la detección neonatal son generalmente de aparición tardía o posnatales o por interpretación incorrecta de la prueba. Se realiza una primera prueba de OEA a los niños a las 48 horas del nacimiento y una reprueba a los 7 días a los niños que habían dado “no normal” en la primera. Tras esta segunda prueba, a todos los niños con
OEA “no normales” se les aplica el PEATC de confirmación. Aplicamos la OEA a 2.567 niños con una sensibilidad del 93% y una especificidad del 89%. En la tabla 10 podemos observar los resultados. Al aplicar la prueba por primera vez vemos que 591 niños tienen otoemisiones patológicas y 1.976 presentan Tabla 10. Resultados de aplicación de OEA OEA: primera prueba Sordera Otoemisión Sí
No normal Normal Total
17 1 18
Prevalencia Sensibilidad Especificidad Porcentaje FN Porcentaje FP VPP VPN 1-VPP 1-VPN CP+ = S/(b/b + d) CP- = (c/a + c)/E
0,70 0,93 0,77 7,00 22,53 2,83 99,94 97,17 0,06 4,13 0,09
No
574 1.975 2.549
591 1.976 2.567
1-sensibilidad 1-especificidad
OEA: segunda prueba, reprueba Sordera Otoemisión Sí
No normal Normal Total
17 1 18
Prevalencia Sensibilidad Especificidad Porcentaje FN Porcentaje FP VPP VPN 1-VPP 1-VPN CP+ = S/(b/b + d) CP- = (c/a + c)/E
3,05 0,93 0,99 7,00 1,27 69,75 99,82 30,25 0,18 73,40 0,07
No
7 566 573
24 567 591
1-sensibilidad 1-especificidad
CP+: cociente de probabilidad positivo; CP-: cociente de probabilidad negativo; E: especificidad; FN: falsos negativos; FP: falsos positivos; OEA: otoemisiones evocadas acústicas; S: sensibilidad; VPN: valor predictivo negativo; VPP: valor predictivo positivo.
52
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 514
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
Tabla 11. Resultados de aplicación de PEATC PEATC
Tabla 13. Probabilidades pospruebas, según sensibilidad y especificidad
Diagnóstico de confirmación Sordera
Otoemisión Sí
Anormal Normal Total
18 0 18
Prevalencia Sensibilidad Especificidad Porcentaje FN Porcentaje FP VPP VPN 1-VPP 1-VPN CP+ = S/(b/b + d) CP- = (c/a + c)/E
75,00 0,99 0,99 0,00 1,00 99,67 100,00 0,33 0,00 0,99 0,00
No
0 6 6
18 6 24
Sensibilidad 90% Especificidad 90%
Al disminuir la prevalencia, disminuye el VPP y aumenta el VPN
Sensibilidad 90% Especificidad 65%
Disminuye más el VPP, pues aumentan los FP. Un resultado positivo es menos concluyente
Sensibilidad 65% Especificidad 90%
Disminuye más el VPN pues aumentan los FN. Un resultado negativo es menos concluyente
Sensibilidad baja
En prevalencias altas disminuye más el VPN. Una prueba negativa carece de valor En prevalencias bajas disminuye más el VPP, una prueba positiva carece de valor
Especificidad baja
FN: falsos negativos; FP: falsos positivos; VPN: valor predictivo negativo; VPP: valor predictivo positivo.
Supongamos que una prueba diagnóstica la aplicamos en poblaciones donde la enfermedad estudiada tiene diferentes probabilidades a priori, por ejemplo en población general o en colectivos de riesgo intermedio o alto. Obtendríamos la tabla 12 empleando una prueba de sensibilidad y especificidad del 90%. Podríamos construir de esta manera las diferentes tablas aplicando los valores de sensibilidad y especificidad de nuestras pruebas y ver las probabilidades aportadas por cada una (tabla 13).
CP+: cociente de probabilidad positivo; CP-: cociente de probabilidad negativo; E: especificidad; FN: falsos negativos; FP: falsos positivos; PEATC: potenciales evocados; S: sensibilidad; VPN: valor predictivo negativo; VPP: valor predictivo positivo.
otoemisiones normales. La sensibilidad de la prueba es del 93% y la prueba detecta a 17 de los 18 individuos con sordera. Hay 574 pruebas “no normales” en niños sanos. El VPP es bajo debido a la baja prevalencia de la enfermedad en la población general y nos dice que ante un niño con resultado de OEA “no normal”, tengo muy poca probabilidad de que sea sordo. Pero un resultado negativo en esta primera prueba del cribado me dice con certeza que es realmente sano, así, un 99% de niños con prueba negativa son realmente sanos. La segunda prueba de cribado se realiza a la semana sobre los 591 niños que tuvieron una primera prueba no normal. Aquí la población ha cambiado, pues la prevalencia de la enfermedad ha aumentado hasta el 3%, con lo cual el VPP de la prueba ha aumentado muchísimo y nos orienta algo más, aunque no nos permite confirmar la presencia de enfermedad, de tal manera que cuando la prueba de OEA nos da “no normal” hay un 69% de probabilidad de ser sordos. El VPN nos hace descartar prácticamente la enfermedad ante un resultado normal. Al aplicar la prueba de confirmación diagnóstica de PEATC (tabla 11), con alta sensibilidad y especificidad a una población muy seleccionada, la prevalencia de enfermedad aumenta hasta el 75%, con lo cual un resultado positivo o negativo es concluyente de sano o enfermo.
EFECTO DE LA PREVALENCIA EN LOS VALORES PREDICTIVOS Observamos que al disminuir la prevalencia, es decir, la probabilidad de tener la enfermedad antes de la prueba, disminuye la probabilidad de tener la enfermedad tras un resultado positivo de la misma (VPP), con lo que aumenta el VPN, de forma que la probabilidad de tener la enfermedad tras la prueba negativa es muy pequeña, por lo cual la prueba negativa la descarta prácticamente1,3,4. La rentabilidad de la prueba medida en máxima información aportada, por modificar al máximo (aumentar o disminuir) la probabilidad pre-prueba, se obtiene con prevalencias del 40 al 60% (máximo en el 50%), de forma que los resultados positivos son indicativos de enfermedad y los negativos son indicativos de ausencia de la misma con una alta probabilidad. En prevalencias muy altas de la enfermedad (alto índice de sospecha, con signos o síntomas o pruebas previas o colectivo de riesgo), los resultados positivos son indicativos de enfermedad y los negativos no la excluyen, pues la
Tabla 12. Variación de los valores predictivos en función de la probabilidad a priori de la enfermedad Sensibilidad 90% especificidad 90%
Prevalencia VPP VPN 1-VPN
90 99 50 50
80 97 69 31
70 95 79 21
60 93 85 15
50 90 90 10
40 86 93 7
30 79 95 5
20 69 97 3
10 50 99 1
5 32 99 0,6
1 8,3 99,9 0,1
0,5 4,3 99,94 0,06
0,3 2,64 99,97 0,03
0,1 0,89 99,98 0,01
VPN: valor predictivo negativo; VPP: valor predictivo positivo.
53
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 515
Probabilidad posterior: probabilidad posprueba de enfermedad
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
.80
mos con prueba positiva entre la proporción de no enfermos con prueba positiva. Valores mayores de CP+ indican mejor capacidad para diagnosticar la presencia de enfermedad.
.70
CP+ = sensibilidad/1-especificidad.
1.00 .90
.60 .50 .40 .30 .20 .10 0
0 .10 .20 .30 .40 .50 .60 .70 .80 .90 1.00 Probabilidd de tener la enfermedad; probabilidad anterior: probabilidad pre-prueba de enfermedad: prevalencia Probabilidad posprueba cuando el resultado de la prueba es positivo (valor predictivo positivo) Probabilidad posprueba cuando el resultado de la prueba es negativo (1 - valor predictivo negativo Resultados de una prueba con sensibilidad (tasa PV) = 95% especificidad 95% – . – Resultados de una prueba con sensibilidad (tasa PV) = 75% especificidad 85% Figura 1. Fuente: Sackett et al1.
probabilidad de estar enfermo es alta cuando la prueba es negativa, con lo cual nos ayuda poco y habría que valorar si realizamos o no la prueba. En prevalencias muy bajas, como nuestro ejemplo anterior, los resultados positivos no nos aportan información, pues la probabilidad de estar enfermo es pequeña y los resultados negativos sí nos confirman su ausencia. Realmente tenemos que valorar a la hora de realizar una prueba lo que nos aporta si nos da un resultado positivo o negativo en el contexto de las características de la misma (sensibilidad y especificidad), valorando lo que aporta la prueba en términos de ayuda diagnóstica, es decir, ver la diferencia entre probabilidad pre-prueba y probabilidad posprueba. La influencia de la sensibilidad y la especificidad en todo lo anterior se refleja en la figura 1, donde vemos que una reducción de ellas disminuye el rendimiento de la prueba1.
RAZONES DE PROBABILIDAD A veces nos interesa expresar los resultados comparando la probabilidad de obtener un resultado en un individuo con enfermedad y sin enfermedad. Ese índice llamado cociente de probabilidad nos permite evaluar dos métodos diagnósticos diferentes2,3. Por ello, estos índices no dependen de esa proporción de enfermos en la muestra. 1. Cociente de probabilidad positivo (CP+), también conocido como cociente de verosimilitud (likelihood ratio of positive test). Se calcula dividiendo la proporción de enfer-
2. Cociente de probabilidad negativo (CP-). Se calcula dividiendo la proporción de enfermos con prueba negativa entre la proporción de no enfermos con prueba negativa. Vemos que valores de CP- menores indican una mejor capacidad diagnóstica de la prueba. CP+ = 1-sensibilidad/especificidad. En el ejemplo tenemos un CP+ de 4, lo que quiere decir que es 4 veces más probable que la prueba sea anormal en los enfermos que en sanos para la primera prueba y 73 veces más probable para la segunda prueba. En el mismo ejemplo, el CP- es 0,09, es decir, un resultado negativo se encontró 11 veces más frecuente entre los que no tienen la enfermedad que entre los que la tienen (1/CP- = 1/0,09 = 11,1). La ventaja de ese índice frente a los VPP y VPN de la prueba radica en que, a diferencia de éstos, no depende de la proporción de enfermos en la muestra, sino tan sólo de la sensibilidad y la especificidad de ésta, de ahí su utilidad a la hora de comparar pruebas diagnósticas. Además, si conocemos o podemos hacer una estimación de la probabilidad pre-prueba de que un sujeto padezca la enfermedad, utilizando los cocientes de probabilidad, al realizar la prueba podemos “corregir” ese valor de acuerdo con el resultado, de tal manera que la probabilidad aumenta o disminuye según sea el resultado positivo o negativo, aplicando la siguiente fórmula. P Post = P * CP/1 + P(CP-1) donde P es la probabilidad pre-prueba, CP el correspondiente cociente de probabilidad (positivo si deseamos calcular la probabilidad de que padezca la enfermedad, negativo en caso contrario) y Ppost es la probabilidad posprueba.
CURVAS ROC Cuando los valores de la prueba diagnóstica son cuantitativos podemos elegir los puntos de corte de nuestra prueba, con lo cual la sensibilidad y la especificidad variarán. Al usar una variable continua debe decidirse qué valor se utilizará para clasificar a los individuos como sanos o enfermos. La curva ROC nos permite relacionar la proporción de verdaderos positivos (sensibilidad) con la proporción de falsos positivos (1-especificidad), o cociente de probabilidad positivo, de tal manera que vamos dando diferentes valores para ver en qué punto es mayor la probabilidad de clasificar correctamente a un individuo al aplicarle la prueba, es decir, la exactitud diagnóstica12,13. Un valor del 60% significa que un individuo enfermo tiene un 60% más de probabilidad de tener la prueba positiva que uno sano. 54
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 516
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
Interpretación de la curva ROC 1. La curva ROC es creciente si se modifica el valor de corte para obtener mayor sensibilidad; sólo puede hacerse a expensas de disminuir al mismo tiempo la especificidad. 2. La diagonal que une los vértices inferior izquierdo y superior derecho, representa el momento en que la curva no sería discriminatoria, es decir, se observan los mismos resultados en enfermos que en sanos. 3. La exactitud de la prueba aumenta a medida que la curva se desplaza desde la diagonal hacia el vértice superior izquierdo. Si la discriminación fuera perfecta (100% de sensibilidad y 100% de especificidad) pasaría por dicho punto.
PRUEBAS MÚLTIPLES El uso de pruebas múltiples es muy frecuente en la práctica médica. Generalmente ante una sospecha diagnóstica se suele disponer de varias posibilidades de pruebas que nos ayuden a confirmar el diagnóstico o a descartarlo. Hay dos formas de indicar varias pruebas: En paralelo 1. Todas las pruebas se aplican simultáneamente a la misma muestra de individuos. 2. Se consideran negativos aquellos sujetos que obtienen resultados negativos en todas las pruebas. 3. Se consideran positivos si obtienen resultados positivos en alguna de ellas. En serie 1. Se aplica una prueba en primer lugar y después se indica la otra prueba sólo si el individuo resulta positivo en la anterior. 2. Se considera positivo al sujeto que haya tenido resultados positivos en todas las pruebas. 3. Se consideran negativos todos los demás (una o ambas pruebas negativas). Pongamos un ejemplo: se utilizan dos pruebas para el diagnóstico de una patología cardiaca (electrocardiograma [ECG] y radiografía [Rx]), en 1.000 pacientes, y se obtienen todos los posibles resultados de las dos pruebas, que están reflejados en la tabla 14. Calculamos la sensibilidad y la especificidad de cada prueba (tabla 15). Calculamos la sensibilidad, la especificidad, el VPP y el VPN para las dos pruebas de forma conjunta. Al realizar las pruebas en paralelo o a la vez, observamos un aumento de sensibilidad y una disminución de especificidad (tabla 16). Por ello debemos utilizar estas pruebas cuando nos interese identificar enfermos (infarto de miocardio). Al realizar las pruebas en serie (tabla 17) exigimos que ambas pruebas diagnósticas sean positivas y observamos un aumento de la especificidad y una disminución de la sensibilidad. Por ello, estas pruebas nos interesan cuando queramos identificar a individuos sanos (prueba del VIH).
Tabla 14. Ejemplo de dos pruebas aplicadas sobre 1000 pacientes ECG
Rx
Enfermo
No enfermo
Total
+ + – –
+ – + –
276 23 140 61 500
26 18 164 292 500
302 41 204 353 1.000
ECG: electrocardiograma; Rx: radiografía.
Tabla 15. Sensibilidad y especificidad del ejemplo de la tabla 14 ECG Sensibilidad = 276 + 23/500 = 59,8% (ECG positivos en enfermos) Especificidad = 164 + 292/500 = 91,2% (ECG negativos en sanos) Rx Sensibilidad = 276 + 140/500 = 83,2% (Rx positivas en enfermos) Especificidad = 18 + 292/500 = 62% (Rx negativas en sanos) ECG: electrocardiograma; Rx: radiografía.
Tabla 16. Pruebas en paralelo En paralelo
Sensibilidad Especificidad VPP VPN
Se realizan las dos pruebas a la vez
87,8% 58,4% 17,3% 50,0%
(276 + 23 +140)/500 Alguna prueba positiva 292/500 Las dos pruebas negativas 439/647 292/353 Enfermo
+ – Total
Sí
No
439 61 500
208 292 500
647 353 1.000
VPN: valor predictivo negativo; VPP: valor predictivo positivo.
Tabla 17. Pruebas en serie En serie
Sensibilidad Especificidad VPP VPN
Primero una prueba y si da positiva se aplica la segunda
55,2% 94,8% 91,4% 67,9%
(276)/500 (18 + 164 + 292) 276/698 474/698
Las dos pruebas positivas Alguna prueba negativa
Enfermo
+ –
Sí
No
276 224 500
26 474 500
302 698 1.000
VPN: valor predictivo negativo; VPP: valor predictivo positivo.
ANÁLISIS DE CONCORDANCIA La precisión de una prueba depende tanto del instrumento de medida como del proceso de medición. Para su control, necesitamos comparar entre sí medidas repetidas de la misma variable y evaluar el grado de acuerdo entre ellas. Ese grado de acuerdo se denomina concordancia, y el análisis de la concordancia entre dos variables nos va a permitir evaluar la reproducibilidad o variabilidad de la medición. 55
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 517
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
En el caso de que se trate de comparar dos mediciones realizadas en distinto momento por un mismo observador o un mismo instrumento de medida hablamos de concordancia intraobservador o consistencia interna. Si hablamos de comparar las mediciones de dos observadores o dos instrumentos sobre una misma variable, hablamos de concordancia interobservador o consistencia externa. Existen varios procedimientos para evaluar la concordancia en función del tipo de variable de que se trate. Variables cualitativas En el caso de las variables cualitativas hablaremos del índice kappa y dentro de éste lo más sencillo se refleja cuando esta variable es dicotómica, como las que veremos a continuación2. Podemos estudiar la concordancia entre dos métodos de medida distintos o entre dos observaciones distintas por un mismo observador o por dos observadores (tabla 18). La mejor manera para entenderlo es ir haciendo paralelamente un ejemplo; en este caso veremos la valoración realizada por un médico de familia y por un traumatólogo sobre la presencia de escoliosis entre los alumnos de una clase durante el reconocimiento escolar (tabla 19). Lo primero que se nos ocurriría para ver el grado de concordancia entre ambos médicos sería calcular la proporción del número de observaciones coincidentes (que sería la suma de los diagnósticos de escoliosis en que ha existido acuerdo y de los casos de acuerdo en la no existencia de escoliosis) con respecto al total de niños examinados, (a + d)/n = (4 + 85)/100 = 0,89, que nos indicaría una concordancia de un 89% (P0). Pero esto no es así, porque parte de este acuerdo en los diagnósticos puede deberse tan sólo al azar. Supongamos por ejemplo que el traumatólogo no explora a los pacientes y decide a cara o cruz quién tiene o no escoliosis, los resultados que obtendría serían aproximadamente un 50% de alumnos con escoliosis, lo que nos daría una concordancia de aproxima-
Tabla 18. Distintos estudios de concordancia Método de medida 2
Método de medida 1
+ –
+
–
a c a+c
b d b+d
a+b c+d a+b+c+d
Médico 2 Diagnóstico + Diagnóstico –
Médico 1
+ –
a c a+c
b d b+d
a+b c+d a+b+c+d
2.o examen
Único médico
Diagnóstico + Diagnóstico –
1.er examen
+ –
a c a+c
b d b+d
a+b c+d a+b+c+d
Tabla 19. Ejemplo: concordancia médico de familia-traumatólogo Traumatólogo
Escoliosis Médico de familia No escoliosis Total
Escoliosis
No escoliosis
4 3 7
8 85 93
12 88 100
damente un 61%, que estaría claramente influenciada por el azar. Por tanto, este valor no nos sirve y hay que utilizar otro índice que tenga en cuenta el azar, como es el índice kappa. El índice de concordancia kappa se define como la proporción de la concordancia real más allá del azar con respecto a la concordancia potencial más allá del azar. Para entenderlo mejor fijémonos en la figura 21.
Concordancia observada (P0)
Concordancia esperada debida al azar (Pe)
Concordancia real más allá del azar
No concordancia 0%
Concordancia completa 100%
Concordancia potencial más allá del azar
Máxima concordancia = 100% = 1 Figura 2. Concordancia. Modificada de Sackett et al1.
56
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 518
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
Tabla 20. Grado de concordancia en función del índice kappa Índice kappa
Grado de concordancia
<0
0-0,2
0,2-0,4
0,4-0,6
0,6-0,8
0,8-1
Sin acuerdo
Insignificante
Bajo
Moderado
Bueno
Muy bueno
Tabla 21. Grado de concordancia en función del coeficiente de correlación interclase R
Grado de concordancia
Índice kappa =
< 0,31
0,31-0,50
0,51-0,70
0,71-0,90
> 0,90
Mala o nula
Mediocre
Moderada
Buena
Muy buena
Concordancia real más allá del azar Concordancia potencial más allá del azar
Índice kappa = P0 - Pe/1 - Pe De donde P0 = proporción de concordancia observada. Pe = proporción de concordancia esperada debida al azar. P0 = (a + d)/N = 89/100 = 0,89; concordancia observada del 89%. La proporción de concordancia esperada debida al azar (Pe) la calcularíamos a partir de las celdas marginales. Así, el número de ocasiones en que ambos médicos concuerdan debido al azar en el diagnóstico de escoliosis sería igual a (a + b)(a + c)/N = 12 * 7/100 = 0,84, y el número de ocasiones en que los dos médicos coincidirían debido al azar en la no existencia de escoliosis sería igual a (c + d)(b + d)/N = 88 * 93/100 = 81,8. La proporción de concordancia esperada debida al azar sería la suma de ambas dividida entre el número de alumnos Pe = (0,84 + 81,8)/100 = 0,83.
Variables cuantitativas Si se trata de variables cuantitativas, se han utilizado de manera inadecuada algunas pruebas estadísticas como el coeficiente de correlación de Pearson (que mide el grado de relación entre dos variables y no su concordancia), la regresión lineal (que permite predecir el valor de una variable en función de otra, pero no su concordancia) o la comparación de medias (que mide la ausencia de significación estadística dando resultados opuestos a la concordancia)2. Mencionaremos los procedimientos utilizados con la finalidad de saber interpretarlos, pero sin ahondar en ellos para no complicar en exceso este tema. Se utiliza el coeficiente de correlación interclase (R), que sería la proporción entre la variabilidad verdadera entre sujetos (2v) y la variabilidad total de las mediciones (2x), siendo esta última la suma de la variabilidad residual de los errores de medida (2e) y la variabilidad verdadera de los sujetos (2v) (tabla 21)2. R=
2v 2v = 2v + 2e 2x
Índice kappa = (0,89 - 0,83)/1 - 0,83 = 0,35. En el caso de máxima concordancia, el índice kappa tendría un valor de 1; si la concordancia observada es igual a la esperada tendría un valor de 0; y si la concordancia observada fuese inferior a la esperada tendría un valor inferior a 0. Para valorar el grado de concordancia en función del índice kappa se utilizan los márgenes expresados en la tabla 20. Por tanto, en nuestro ejemplo 0,35 se trataría de un grado de concordancia bajo. En lugar de dar un valor puntual podemos calcular su intervalo de confianza (IC) de manera sencilla con la siguiente fórmula2: Para un IC del 95%; índice Kappa ± 1,96
冪
P0 (1-P0) N (1-Pe)
En el caso de que no fuera dicotómico y presentara varias categorías se puede hacer el índice de concordancia global o transformar los resultados en dos únicas respuestas convirtiéndolo en tablas de 2x2 como si fuera dicotómica, calculando el índice kappa igual que antes.
Otro método que se puede utilizar en caso de variables cuantitativas es el análisis de las diferencias individuales, que puede complementar al anterior. Se basa en la determinación de la magnitud de las diferencias entre métodos de medida y se representa en un gráfico, de tal manera que hace muy asequible su interpretación. Por último, debemos indicar que existen en Internet distintos programas de distribución gratuita con los que se pueden calcular de manera interactiva gran parte de los parámetros e índices de los que hemos hablado, por ejemplo SISA (http://home.clara.net/sisa).
BIBLIOGRAFÍA 1. Sackett DL, Haynes RB, Tugwell P. Epidemiología clínica. Madrid: Ed. Díaz de Santos; 1989. 2. Argimón-Pallás JM, Jiménez-Villa J, editores. Métodos de investigación clínica y epidemiológica. 2.a ed. Madrid: Harcourt; 2000. 3. Gómez de la Cámara A, ed. Manual de Medicina basada en la evidencia. Elementos para su desarrollo y aplicación en Atención Primaria. Madrid: Jarpyo Ed. 1998. 4. Pita Fernández S, Pertegas Díaz S. Unidad de epidemiología Clínica y Bioestadística. Complejo Hospitalario Juan Canalejo. Pruebas diagnósticas. Cad Aten Primaria. 2003;10:120-4.
57
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
03 FORMACION 1221 (509-519).qxp
22/12/07
11:48
Página 519
Gómez González C y Pérez Castán JF. Capítulo 8: Pruebas diagnósticas. Concordancia
5. Tobías A. Pruebas diagnósticas (I): sensibilidad y especificidad. Jano. 1999;LVI. 6. Tobías A. Pruebas diagnósticas (II): valores predictivos. Jano. 1999;LVI. 7. González Enrique J, Banegas Banegas JR, Martín Moreno J, Rodríguez Artalejo F. Criterios para la realización de programas de detección precoz de enfermedad en la población. Medicina Integral. 1989;13. 8. López García-Franco A, Blasco Lobo A. Bases metodológicas para la selección de actividades preventivas. JANO. 2000;1364:71-6 9. Evaluación de tecnologías sanitarias. Aplicaciones clínicas de las otoemisiones acústicas. Evidencia. Actualización en la práctica ambulatoria. [mayo/junio 2006]. Disponible en: www.evidencia. org
10. Torrico P, Gómez C, López Ríos J, de Cáceres MC, Trinidad G, Serrano G. Influencia de la edad en las otoemisiones acústicas para el screening de hipoacusia infantil. Acta Otorrinolaringl Esp. 2004;55:153-9. 11. González de Dios J, Mollar Maseres J, Rebagliato Russo M. Evaluación del programa de detección precoz universal de la hipoacusia en el recién nacido. An Pediatr (Barc). 2005;63:230-7. 12. López de Ulibarri Galparsorro I, Pita Fernández S. Unidad de epidemiología Clínica y Bioestadística. Complejo Hospitalario Juan Canalejo. Curvas ROC. Cad Aten Primaria. 1998;5:229-35. 13. Tobías A. Pruebas diagnósticas (III): curvas ROC valores predictivos. Jano. 1999;LVI.
58
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
04 FORMACION 1234 (11-16).qxp
19/3/07
16:49
Página 11
Martin JLR et al. Capítulo 9: Investigación secundaria: la revisión sistemática y el metaanálisis
formación SOCIEMA
PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA
Capítulo 9: Investigación secundaria: la revisión sistemática y el metaanálisis J.L.R. Martína,b, E. Martín-Sáncheza, E. Torralbab, E. Díaz Domíngueza, S. Lurueña-Segoviaa,c y F.J. Alonso Morenod,f aÁrea de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla-La bUnidad de Investigación Aplicada. Hospital Nacional de Parapléjicos. Toledo. España. cFENNSI Group. Fundación Hospital Nacional de Parapléjicos. Toledo. España. dCentro de Salud Sillería. Toledo. España. fResponsable de Investigación de Semergen.
La revisión sistemática y el metaanálisis forman parte de la investigación secundaria, la cual parte del estudio de las pruebas disponibles sobre una determinada intervención sanitaria, con el objeto de responder a cuestiones concretas, siguiendo una metodología explícita y rigurosa. El primer paso en su elaboración es la formulación de la pregunta de investigación, que definirá los criterios de inclusión de los estudios de nuestra revisión: metodología del estudio, participantes, intervenciones, comparaciones a estudiar y medidas de resultado. Estas características marcarán el protocolo de estudio y su correcta definición facilitará el resto del proceso. La siguiente etapa consiste en la búsqueda de estudios en la literatura científica sobre el tema a tratar, y la lectura crítica de los mismos para descartar –en ocasiones simplemente con la lectura del título o el abstract y en otras revisando el artículo completo– aquellos que no reúnen nuestros criterios de selección y quedarnos con los que finalmente serán incluidos. Estos estudios constituirán nuestra revisión, de ellos se extraerán los datos necesarios y se evaluarán tanto cualitativa como cuantitativamente. En aquellos casos en los que exista homogeneidad entre los estudios incluidos, y al menos dos de ellos presenten datos razonablemente combinables, se realizará un análisis cuantitativo denominado “metaanálisis”, generalmente mediante la ayuda de programas estadísticos informatizados que facilitan este trabajo, y que permiten visualizar los resultados gráficamente en los denominados forest plot. La última fase de una revisión, al igual que en el resto de estudios epidemiológicos, consiste en interpretar los resultados obtenidos y extraer las correspondientes conclusiones,
Correspondencia: J.L.R. Martín. Jefe del Área de Investigación Clínica. Fundación para la Investigación Sanitaria en Castilla la Mancha (FISCAM). Edificio Bulevar. C/ Berna, nº 2, Local 0-2. 45003 Toledo. España. Correo electrónico: jlrmartin@jccm.es
Mancha (FISCAM). Toledo. España.
que en este tipo de estudios tendrán repercusiones tanto para la investigación, como para la práctica clínica. Palabras clave: revisión sistemática, metaanálisis, investigación secundaria, sesgo, ensayo clínico aleatorizado, forest plot, funnel plot.
The systematic review and meta-analysis form a part of secondary research which begins with the study of the evidence available on a certain health care intervention in order to respond to specific questions by means of an explicit and rigorous methodology. The first step in its elaboration is the writing of the research question that will define the inclusion criteria of the studies of our review: study methodology, participants, interventions, comparisons to be studied and measurements of the results. These characteristics will define the study protocol and their correct definition will facilitate the rest of the procedure. The following stage consists in the search for studies in the scientific literature on the subject in question and the critical reading of them to rule out, sometimes only by reading the title or abstract and others by reading the complete article, those that do not fulfill our selection criteria. Finally, those remaining will be included in the study. These studies will make up our review and will be used to obtain the necessary data and to evaluate them both qualitatively and quantitatively. In those cases where there is homogeneity between the studies included and where at least two of them have reasonably combinable data, a quantitative analysis called metaanalysis will be conducted. This is generally done with the help of computerized statistical programs that aid this work and that make it possible to visualize the results graphically in the so-called forest plot. The last phase of the review, as in the rest of the epidemiological studies, consists in interpreting the results obtained and in drawing the corresponding conclusions. In this
59
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
04 FORMACION 1234 (11-16).qxp
19/3/07
16:49
Página 12
Martin JLR et al. Capítulo 9: Investigación secundaria: la revisión sistemática y el metaanálisis
type of studies, they will have repercussions in both the research and clinical practice. Key words: systematic review, meta-analysis, secondary research, bias, randomized clinical trial, forest plot, funnel plot
sin ningún criterio previamente establecido los artículos que incluirá y revisará, en una revisión sistemática se establece a priori un protocolo explícito y “sistemático”, con el objetivo de no poder intervenir a posteriori sobre los resultados obtenidos2. También este protocolo debe permitir poder replicar la revisión a cuantos investigadores les parezca oportuno.
INTRODUCCIÓN
REALIZACIÓN DE UNA REVISIÓN SISTEMÁTICA
Durante los 8 capítulos anteriores de este Curso de introducción a la investigación en Atención Primaria, hemos trabajado en la realización de estudios primarios. Sin embargo, en este capítulo se va a prestar atención a una nueva forma de aportar conocimiento científico a partir de los datos de otras investigaciones ya realizadas. Esto es lo que se conoce como investigación secundaria, que parte del estudio de las pruebas disponibles en ese momento sobre una intervención sanitaria, con el objetivo de responder principalmente a cuestiones sobre su eficacia, efectividad y seguridad, mediante una metodología explícita y rigurosa (sistemática)1. A finales del siglo pasado el exponencial aumento de la publicación científica y el fácil acceso a la misma por parte de los profesionales –y también por usuarios de servicios de salud– conllevó una serie de problemas centrados en la calidad y heterogeneidad de dicha información. Usar parte de esa información, como ayuda a la hora de tomar una decisión clínica concreta, debe traer asociado la necesidad de leer e interpretar todos los artículos publicados hasta esa fecha sobre el tema que se pretende abordar. De lo contrario, no podríamos contestar preguntas como: ¿cuál es el artículo sobre el que debo basar mi decisión? ¿Con qué criterios selecciono un artículo u otro? ¿Qué información estoy perdiendo al no leer todos los artículos? ¿Quién me asegura que los artículos elegidos son los adecuados? Sin embargo, actualmente es inviable la lectura de todos los artículos relacionados con una intervención sanitaria antes de poder tomar una decisión clínica. Como ejemplo sólo hay que buscar en PubMed la literatura relacionada con las palabras smoking cessation and therapy; en total aparecerán 8.609 trabajos publicados sobre este tema. Si por el contrario definiésemos más la búsqueda nos surgirían dudas sobre los estudios que podríamos estar perdiendo por el camino. Además, también sería conveniente buscar en otras bases de datos generales, como EMBASE, y siguiendo con este ejemplo añadir algunas específicas de psicología o salud mental. Sin embargo, también ese aumento de la información científica y su fácil acceso puede ser la solución a las cuestiones planteadas en el párrafo anterior.
Formulación de la pregunta de investigación El primer paso y más importante es determinar qué pregunta o cuestión clínica nos interesa contestar1. Por ejemplo, preguntarnos el efecto que tiene el ejercicio físico en la prevención de la obesidad infantil, o el efecto de reuniones educativas grupales en el control de la diabetes tipo 2, o la eficacia y seguridad de cualquier fármaco en el tratamiento de una determinada enfermedad, y así un largo etcétera. Aunque las revisiones sistemáticas también pueden contestar preguntas sobre pruebas diagnósticas y sobre factores de riesgo y protección, la mayor parte de las que se publican intentan contestar preguntas sobre intervenciones (terapéuticas, rehabilitadoras, preventivas, de gestión, etc.). Esto es debido al estricto criterio de inclusión de estudios que tienen estas revisiones, o por decirlo de otro modo, la utilización de ensayos controlados y aleatorios como fuente de datos primarios –como estudios a incluir dentro de una revisión–. La parte cuantitativa de una revisión sistemática, denominada metaanálisis3, tratará de ponderar estadísticamente todos los estudios incluidos en la revisión, por lo tanto si estos estudios difieren entre sí en una o varias de sus características principales (especialmente la muestra seleccionada), terminaremos mezclando “peras con manzanas”, e interpretando erróneamente los datos obtenidos. Por este motivo, los ensayos controlados aleatorios, al tener un nexo de unión común, la aleatorización, supondremos que las características generales de cada estudio se habrán repartido en las mismas proporciones para los grupos de intervención y control; pero siempre y cuando las características más específicas, como la definición de la intervención que evalúan, el tiempo de tratamiento o las dosis empleadas sean homogéneas en todos los estudios analizados. Como los ensayos clínicos aleatorios evalúan principalmente intervenciones, las revisiones sistemáticas también se realizan sobre intervenciones. La pregunta de investigación debe definir el protocolo de trabajo de la revisión sistemática. Por lo tanto, al realizar nuestra pregunta tendremos que decidir:
¿Qué es una revisión sistemática de la evidencia científica? La finalidad de una revisión sistemática es contestar una pregunta clínica a partir de la valoración e interpretación –cuantitativa y cualitativa– de todas las pruebas (evidencias) actualmente disponibles1. A diferencia de las revisiones narrativas, donde es el propio autor quien selecciona
– Qué tipo de estudios vamos a incluir: por ejemplo, ensayos controlados aleatorios doble-ciego. – Qué tipo de intervención: por ejemplo, determinar la eficacia y seguridad de una intervención farmacológica específica para el abandono del hábito de fumar. – Qué tipo de comparaciones: por ejemplo, comparándola con placebo y con otras intervenciones que demostrasen con anterioridad que son eficaces. 60
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
04 FORMACION 1234 (11-16).qxp
19/3/07
16:49
Página 13
Martin JLR et al. Capítulo 9: Investigación secundaria: la revisión sistemática y el metaanálisis
– Qué tipo de participantes: por ejemplo, fumadores mayores de edad con más de 5 años de hábito y con una valoración ⱖ 5 en el test de Richmond4. – Qué tipo de resultados (medidas de resultado): por ejemplo, porcentaje de sujetos libres del hábito al año de seguimiento. Búsqueda de estudios Una vez concretada la pregunta el siguiente paso es realizar una búsqueda sistemática por las diferentes bases de datos, con el propósito de encontrar todos los estudios que cumplan nuestros criterios de inclusión –formulados en nuestra pregunta1–. A tal fin, diseñaremos una estrategia de búsqueda para las bases de datos electrónicas PubMed, EMBASE y todas aquellas a las que tengamos acceso. También buscaremos en la sección bibliográfica de todos los artículos que recuperemos de esas bases de datos, así como en internet, consultando bases de datos de estudios en curso (clinical-trials.gov, current controlled trials), las páginas web de sociedades y congresos (en busca de abstracts) y contactando directamente por correo electrónico con investigadores expertos en la materia de nuestra pregunta y con responsables de investigación de compañías farmacéuticas. Para diseñar las estrategias de búsqueda electrónica lo habitual es contar con un documentalista especializado en revisiones sistemáticas. Esto es debido a la complejidad que entraña la unión de infinidad de términos específicos. En nuestro ejemplo a los términos habituales de las intervenciones a comparar habría que añadir los relacionados con la investigación experimental: RANDOMIZED CONTROLLED TRIAL.pt. CONTROLLED CLINICAL TRIAL.pt. RANDOMIZED CONTROLLED TRIALS.sh. RANDOM ALLOCATION.sh. DOUBLE BLIND METHOD.sh.SINGLEBLIND METHOD.sh. ANIMAL.sh. not HUMAN.sh. CLINICAL TRIAL.pt. exp CLINICAL TRIALS. PLACEBOS.sh… Selección de los estudios Después de obtener los resultados de las búsquedas debemos cribar, a partir de los abstract, los estudios que potencialmente cumplen criterios de inclusión y los que claramente no los cumplen2. Estos últimos se excluirán directamente, mientras que se pedirán los fulltext de los primeros. También se pedirán los artículos completos de los estudios que, a partir de la lectura del resumen, no podamos determinar su inclusión o exclusión de la revisión sistemática. Por poner algunos ejemplos, desde mi equipo se revisaron unos 2.500 abstract –120 se pidieron en fulltext– para terminar seleccionando, a partir de nuestro criterio de inclusión, 28 estudios que evaluaban antipsicóticos atípicos frente a típicos en el tratamiento de la esquizofrenia. Para una revisión sobre el uso terapéutico de cannabis en dolor crónico se revisaron 210 abstracts, se pidieron 82 artículos fulltext y finalmente se seleccionaron 13 estudios. Por los datos mostrados en estos ejemplos, siempre que se plantee la necesidad de una revisión sistemática es conveniente tener muy claro aspectos como la financiación es-
pecífica que se necesita para recopilar una gran cantidad de artículos y las vías de acceso a ellos. Extracción de datos Una vez obtenidos los artículos se determina si éstos cumplen los criterios de inclusión o no. Este trabajo se debe realizar separadamente por dos miembros del equipo de investigadores, utilizando a un tercer investigador cuando no exista concordancia sobre la inclusión o no de un determinado estudio. El siguiente paso es la extracción de datos de los estudios incluidos. La lógica de este proceso se basa en la simplificación de la información que contienen los artículos. Se extrae lo necesario exportándolo a unas hojas de recogida de información, con las que se trabajará a partir de ahora, mientras que se archivan los textos completos de los artículos. Las hojas de extracción de datos pueden realizarse tanto en formato papel como electrónico, y deben contener los puntos esenciales esgrimidos en el protocolo y los específicos para el análisis de datos y la evaluación de la calidad de los estudios incluidos. Calidad de los estudios incluidos Antes de pasar al análisis estadístico de los estudios seleccionados es necesario determinar la calidad individual de cada estudio. Como los que se incluyen en una revisión sistemática son principalmente ensayos clínicos aleatorios, la calidad de éstos viene marcada por: a) la selección de pacientes a los diferentes grupos de tratamiento y control; b) la realización de las intervenciones; c) las medidas de resultado utilizadas; d) el seguimiento a los pacientes y d) el denominado sesgo de publicación. Como en el capítulo dedicado a los ensayos clínicos se vieron los 4 primeros puntos, aquí nos centraremos en el último, en el sesgo de publicación1,2,5. La definición de este sesgo hace referencia al hecho de que normalmente se publican más los estudios con resultados positivos que los que muestran resultados negativos (o sin diferencias significativas entre los grupos estudiados). Sin embargo, dentro de una revisión sistemática nos tenemos que preguntar si hemos encontrado todos los estudios con nuestro criterio de inclusión o, por el contrario, no hemos sido capaces de encontrar estudios con resultados negativos –si es que existen–. Este hecho es de suma importancia, ya que si sólo utilizamos estudios con resultado positivo, pero obviamos los negativos, estaremos sobreestimando la intervención evaluada. Para poder controlar este posible sesgo en una revisión sistemática se deben realizar algunas pruebas estadísticas, donde la más conocida es el denominado “gráfico de embudo” o funnel plot5. Este gráfico va a ordenar los estudios a partir de la precisión de su medida, y podremos comprobar si existen estudios con poca precisión y resultados extremos, tanto a favor de la intervención experimental como en contra. Si sólo observamos resultados extremos de estudios con poca precisión (normalmente con escasa muestra de sujetos) a favor de la intervención experimental, pero no a favor de la intervención control, podríamos suponer que éstos (los estudios con resultado 61
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
04 FORMACION 1234 (11-16).qxp
19/3/07
16:49
Página 14
Martin JLR et al. Capítulo 9: Investigación secundaria: la revisión sistemática y el metaanálisis
4
Estudios restantes
2
0
–2
–4 0
0,5
1
1,5
Figura 1. Representación gráfica de un funnel plot o gráfico de embudo. Estudio real para el análisis del sesgo de publicación del metaanálisis sobre la eficacia de una determinada intervención farmacológica. La zona señalada identifica la ausencia de estudios incluidos con resultados en esa dirección.
negativo) existen pero no han sido publicados. Cuando las muestras son pequeñas el error aleatorio del estudio es alto y, por lo tanto, los resultados deberían ir tanto a favor como en contra (por azar). Se muestra un ejemplo de este gráfico en la figura 1. Análisis estadísticos: metaanálisis La parte cuantitativa de una revisión sistemática se denomina metaanálisis3,6. Para poder realizarlo se necesitan al menos dos estudios en un mismo análisis. Sin embargo, en muchas revisiones sistemáticas la heterogeneidad de los estudios incluidos (en población, dosis, tiempo de tratamiento, etc.) hacen inviable poder aportar una medida cuantitativa común, por lo que podemos tener una revisión sistemática sin ningún estimador analítico conjunto (sin metaanálisis); lo que nunca tendremos es un metaa-
Tabla 1. Principales pruebas estadísticas utilizadas en un metaanálisis Tipo de variable
Estimador del efecto
Modelo
Dicotómica
Odds ratio
Efectos fijos
Continua
Método estadístico
Peto Mantel-Haenszel Woolf Efectos aleatorios DerSimonian-Laird Riesgo relativo Efectos fijos Mantel-Haenszel Woolf Efectos aleatorios DerSimonian-Laird Diferencia Efectos fijos Mantel-Haenszel de riesgos Woolf Efectos aleatorios DerSimonian-Laird Diferencia de Efectos fijos Woolf medias ponderada Efectos aleatorios DerSimonian-Laird Diferencia Efectos fijos Woolf estandarizada de medias
nálisis sin revisión sistemática previa. Es lógico pensar que si se analizan únicamente los estudios que convienen al investigador, los resultados siempre irán a su favor. Por este motivo, los estudios analizados tienen que provenir de una búsqueda “sistemática” previa y de un estudio de su calidad y heterogeneidad. Cuando se realiza un metaanálisis al estimador resultante lo denominamos tamaño del efecto conjunto (overall effect size) y se obtiene a partir de la diferencia de medias entre las intervenciones a comparar. Si la medida es dicotómica, el effect size será principalmente un estimador conjunto de la odds ratio, riesgo relativo o la diferencia de riesgo6,7. Al unir diferentes estudios analíticamente se ganará precisión en la medida aumentando la potencia individual de cada estudio. Sin embargo, antes de poder sumar los estudios debemos realizar uno de homogeneidad, tanto clínica como estadística. En el ámbito clínico debemos decidir qué estudios unir a partir de variables, como el tiempo de tratamiento o seguimiento de los ensayos. No es lo mismo un estudio a corto plazo que a medio o largo plazo. Lo mismo ocurre con las dosis administradas. En este último caso se pueden agrupar los análisis en, por ejemplo, estudios con dosis medias y estudios con dosis altas. Aquí, el equipo de investigadores deberá decidir los puntos de corte adecuados. La heterogeneidad estadística6 viene determinada por un análisis de la variabilidad inter-estudio. En un metaanálisis se debe prestar atención a las diferentes variaciones en los resultados individuales de los estudios. Estas variaciones deben estar basadas únicamente en el azar. A partir de la variabilidad individual de cada estudio (que normalmente está muy relacionada con el tamaño de muestra) y que determina la precisión de su medida se realiza una prueba Q para determinar si los diferentes resultados encontrados entre los estudios son dependientes de la precisión de los mismos (sólo el azar hace variar los resultados de un estudio a otro) o, por el contrario, existe alguna variable entre los estudios que está creando confusión en los resultados. En este caso, cuando encontramos heterogeneidad, no podemos ofrecer resultados analíticos, ya que no sabemos la causa de la variación –la causa del effect size– y por lo tanto no podríamos interpretar el resultado obtenido. En estos casos, por un lado tendríamos que utilizar un modelo de análisis denominado aleatorio –que tiene en cuenta la variabilidad inter-estudio– y por otro, realizar análisis de subgrupos de estudios si la medida es dicotómica (a partir de la variable que creemos que está modificando el resultado: dosis, población, etc.) o realizar un análisis de regresión (meta-regresión) si la medida es continua (tiempo de tratamiento, etc.). En la literatura existen varios ejemplos de meta-regresiones que lograron determinar la causa de la heterogeneidad y aportaron un importante conocimiento clínico sobre las intervenciones que estudiaron: la eficacia diferencial de una vacuna a partir de la distancia al ecuador que existe en los países de aplicación8, o la realizada por nuestro equipo sobre la efectividad a corto plazo de las benzodiazepinas en el trastorno de ansiedad generalizada, con relación al año de publicación de los ensayos clínicos9. 62
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
04 FORMACION 1234 (11-16).qxp
19/3/07
16:49
Página 15
Martin JLR et al. Capítulo 9: Investigación secundaria: la revisión sistemática y el metaanálisis
Estudios (años)
N
Media (DE) tratamiento activo
N
Media (DE) placedo
Estudio A (1975a) Estudio B (1975b) Estudio C (1978a) Estudio D (1978b) Estudio E (2003) Estudio F (2005)
10 34 28 15 12 33
–3,05 (1,77) –3,80 (3,82) –4,72 (3,54) –4,40 (2,08) –1,90 (4,44) –2,73 (2,50)
10 34 26 15 12 32
–0,90 (1,77) –1,90 (3,82) –2,15 (3,54) –1,87 (2,08) –1,20 (4,44) –1,41 (2,70)
SMD (ef.fijos) (IC 95%)
Total (IC 95%) Heterogeneidad: x2 = 5,15; I2 = 3,0% (p = 0,40)
SMD (ef.fijos) (IC 95%) –1,16 (–2,13 –0,20) –0,49 (–0,97 –0,01) –0,72 (–1,26 –0,17) –1,18 (–1,97 –0,40) –0,15 (–0,95 0,65) –0,49 (–0,99 0,00)
Tamaño del efecto global –0,62 (–0,87 —0,37)
–10
–5 0 A favor del tratamiento activo
5 A favor del placebo
10
Figura 2. Representación gráfica de los resultados de un metaanálisis (forest plot). Representación gráfica de los resultados de un metaanálisis sobre la eficacia de una intervención sanitaria. Se representan los valores de la diferencia de medias estandarizada (SMD) con su correspondiente intervalo de confianza (IC) para cada estudio individual y el valor global para el metaanálisis. La línea vertical representa el valor del efecto nulo. A su izquierda se representan los estudios cuyos resultados están a favor del grupo de intervención activa, y a la derecha aquellos cuyos resultados están a favor del grupo control.
Etapas en la elaboración de una revisión sistemática 1. Formulación de la pregunta de investigación
2. Revisión de la literatura sobre el tema a tratar: búsqueda bibliográfica
3. Lectura crítica de los estudios: Riesgo de sesgo: ¿Se realizó un correcto encubrimiento de la asignación?
Sesgo de selección
¿El cegamiento fue adecuado?
Sesgo de realización
¿Cómo se trataron las pérdidas y abandonos?
Sesgo de seguimiento
¿La búsqueda ha sido completa?
Sesgo de publicación
4. Extracción de los datos
¿Existe homogeneidad entre los estudios? ¿Los datos son combinables?
Sí: Metaanálisis Modelo de efectos fijos/ aleatorios Estudio de la heterogeneidad Representación gráfica: forest plot
No: Revisión sistemática
Implicaciones: Para la investigación Para la práctica clínica Figura 3. Etapas en la elaboración de una revisión sistemática.
Dentro de un metaanálisis cada estudio tiene un peso que viene determinado por su variabilidad. Así, cuanto más preciso en su medida es el estudio más peso tiene en el global del metaanálisis. Esta ponderación se realiza normalmente por el inverso de la varianza de cada estudio. Existen diferentes programas estadísticos con función para metaanálisis que simplifican considerablemente el tiempo que se precisa para realizar los análisis cuantitativos. Algunas de las técnicas estadísticas más utilizadas en metaanálisis aparecen esquematizadas en la tabla 1. A nivel gráfico7, las figuras que presentan los análisis se denominan forest plot y suelen presentar los efectos individuales de los estudios y el peso de cada uno de éstos sobre el estimador global; el efecto conjunto, o effect size junto con su intervalo de confianza; el test de homogeneidad; el modelo utilizado (fijo o aleatorio) y el intervalo de confianza elegido para realizar el análisis, tal como muestra la figura 2. Conclusiones e interpretación de los resultados Por último, una revisión sistemática debe ser capaz de aportar una serie de conclusiones o implicaciones tanto para la práctica clínica como para la futura investigación sobre la intervención estudiada10. En las conclusiones de una revisión sistemática se debe comenzar con una frase que conteste la pregunta inicialmente planteada: “esta revisión sistemática encuentra evidencia/no encuentra evidencia de...”, para continuar con una interpretación de la calidad de los estudios y de los estimadores estadísticos encontrados. A partir de aquí, la sección de conclusiones o discusión de una revisión sistemática se asemeja a las conclusiones y discusión de cualquier otro artículo clínico. Las diferentes etapas en la elaboración de una revisión sistemática aparecen esquematizadas en la figura 3.
BIBLIOGRAFÍA 1. Urrutia G, García JM, Martín JLR, Seoane T. Cómo realizar una revisión sistemática. En: Martín JLR, Tobías A, Seoane T, editores. Revisiones sistemáticas en las Ciencias de la Vida. El concepto Salud
63
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
04 FORMACION 1234 (11-16).qxp
19/3/07
16:49
Página 16
Martin JLR et al. Capítulo 9: Investigación secundaria: la revisión sistemática y el metaanálisis
a través de la síntesis de la evidencia científica. 1a ed. Toledo: Fundación para la Investigación Sanitaria en Castilla-La Mancha (FISCAM); 2006. p. 119-69. 2. Fletcher RH, Fletcher SW. Systematic reviews. En: Fletcher RH, Fletcher SW, editors. Clinical epidemiology: the essentials. 4th ed. USA: Lippincott Williams & Wilkins; 2005. 3. Egger M, Davey G, Altman D. Systematic reviews in health care: meta-analysis in context. 2nd ed. London: BMJ Books; 2001. 4. Córdoba R, Martín C, Casas R, Barberá C, Botaya M, Hernández A, et al. Value of brief questionnaires in predicting smoking cessation in primary care. Aten Primaria. 2000;25:32-6. 5. Rothstein HR, Sutton AJ, Borenstein M. Publication bias in metaanalysis: prevention, assessment and adjustement. 1st ed. England: John Wiley & Sons, Ltd; 2005. 6. Espallargues i Carreras M, Tebé C, Sánchez-Meca J, Marín F, Huedo TB, Tobías A. El meta-análisis. En: Martín JLR, Tobías A, Seoane T, editores. Revisiones sistemáticas en las Ciencias de la Vida. El concepto salud a través de la síntesis de la evidencia científica. 1st
ed. Toledo: Fundación para la Investigación Sanitaria en Castilla-La Mancha (FISCAM); 2006. p. 173-217. 7. Argimon JM, Jiménez J. Análisis de una revisión sistemática. En: Edide SL, editor. Métodos de investigación clínica y epidemiológica. 3th ed. Madrid: Elsevier. p. 347-54. 8. Colditz GA, Brewer TF, Berkey CS, Wilson ME, Burdick E, Fineberg HV, et al. Efficacy of BCG vaccine in the prevention of tuberculosis. Meta-analysis of the published literature. JAMA. 1994;271:698-702. 9. Martin JLR, Sainz-Pardo M, Furukawa TA, Martín-Sánchez E, Seoane T, Galán C. Benzodiazepines in generalized anxiety disorder: heterogeneity of outcomes based on a systematic review and metaanalysis of clinical trials. J Psychopharmacol. 2007;21:774-82. 10. Pons Joan MV. Interpretando los resultados de una revisión sistemática. En: Martín JLR, Tobías A, Seoane T, editores. Revisiones sistemáticas en las Ciencias de la Vida. El concepto Salud a través de la síntesis de la evidencia científica. 1st Ed. Toledo: Fundación para la Investigación Sanitaria en Castilla-La Mancha (FISCAM); 2006. p. 221-37.
64
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 FORMACION 1246 (75-79).qxp
8/2/08
10:13
Página 75
Sánchez Moreno E. Capítulo 10: La investigación cualitativa en la investigación en salud. Fundamentos y rigor científico
formación SOCIEMA
PROPEDEUTICA EN INVESTIGACIÓN CLÍNICA Capítulo 10: La investigación cualitativa en la investigación en salud. Fundamentos y rigor científico E. Sánchez Moreno Departamento de Sociología V. Universidad Complutense de Madrid. Madrid. España.
Las técnicas cualitativas de investigación social constituyen un conjunto de herramientas de recogida y análisis de la información con fundamentos epistemológicos propios y diferenciados de otro tipo de técnicas (por ejemplo, la encuesta cuantitativa). En el presente capítulo se introducen los fundamentos básicos para el desarrollo de investigaciones a través de grupos de discusión y/o entrevistas en profundidad. Tres son los ejes que articulan este capítulo. En primer lugar, se discute el lugar que ocupan las denominadas técnicas cualitativas en el conjunto de la investigación, determinando aquellos objetos de estudio susceptibles de abordaje a través de alguna de estas técnicas. En la medida en que es útil para iluminar la especificidad de las técnicas cualitativas, se procede igualmente a una breve comparación con los rasgos característicos de las comúnmente denominadas técnicas cuantitativas (en concreto, la encuesta). En el segundo y tercer epígrafes se describen con cierta concreción dos de las técnicas cualitativas más utilizadas en la investigación social en general, y sociosanitaria en particular. Se trata del grupo de discusión y de la entrevista en profundidad. De ambas técnicas se mencionan sus rasgos característicos y se ofrecen algunas sugerencias para su adecuada utilización. El cuarto epígrafe se ocupa de un problema central y común a todas las técnicas de carácter cualitativo: el muestreo y la selección de los individuos concretos que participarán en la fase de trabajo de campo.
The qualitative techniques of social research make up a combination of tools for collection and analysis of information with epistemological rationale that is differentiated from other types of techniques (for example, the quantitative survey). The basic rationales for the development of research through discussion groups and/or comprehensive interviews are introduced in this chapter. There are three axes described in this chapter. In the first one, the place occupied by the so-called qualitative techniques in the group of research is discussed. Those study objects that can be approached through any of these techniques are determined. When useful to clarify the specificity of the qualitative techniques, a brief comparison is also made with the characteristic traits of the commonly called quantitative techniques (specifically, the survey). In the second and third sections, two of the qualitative techniques used most in social research in general and social-health care specifically are summarized to some degree. This refers to the discussion group and comprehensive interview. The characteristics traits are mentioned for both techniques and some suggestions are made for their adequate use. The fourth section deals qualitatively with a central and common problem to all the techniques: sampling and screening of the specific individuals who will participate in the field study phase.
Palabras clave: investigación cualitativa, entrevista, grupo de discusión, cuestionario, muestreo.
Key words: qualitative research, interview, discussion group, questionnaire, sampling.
TÉCNICAS “CUALITATIVAS” Y TÉCNICAS “CUANTITATIVAS”
ción cuyo conjunto de datos está constituido por los discursos elaborados por los sujetos en una situación de interacción social. Con notable frecuencia, la presentación de las características de las técnicas cualitativas de investigación corre de la mano de su comparación con los rasgos fundamentales de las técnicas cuantitativas. Esta táctica es útil en la medida en la que permite diferenciar con mayor nitidez las diferencias de fondo entre uno y otro conjunto de técnicas de investigación. Ahora bien, existe el peligro de transmitir de manera implícita la idea de que técnicas
Los métodos y técnicas cualitativos de investigación social constituyen un amplio conjunto de técnicas de investigaCorrespondencia: E. Sánchez Moreno. Departamento de Sociología V. Universidad Complutense de Madrid. Campus de Somosaguas. 28223 Pozuelo. Madrid. España. Correo electrónico: esteban.sanchez@cps.ucm.es
65
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 FORMACION 1246 (75-79).qxp
8/2/08
10:13
Página 76
Sánchez Moreno E. Capítulo 10: La investigación cualitativa en la investigación en salud. Fundamentos y rigor científico
cualitativas y técnicas cuantitativas constituyen herramientas de investigación excluyentes o incompatibles. La realidad, no obstante, es más bien la contraria, ya que, como veremos, ambos conjuntos de técnicas se caracterizan por su carácter complementario, al constituir miradas diferenciadas con respecto a los procesos sociales objeto de estudio. Dicho de otra forma, tanto las técnicas cuantitativas como las técnicas cualitativas constituyen herramientas metodológicas útiles para estudiar aspectos concretos de los procesos sociales. De hecho (y esto es lo verdaderamente importante), la elección de unas u otras no depende de la naturaleza de las técnicas, sino más bien de la naturaleza del objeto de estudio y de los objetivos de la investigación. En el primero de esta serie de artículos se analizaron las distintas fases que constituyen cualquier investigación. Como se recordará, la elección de las técnicas de investigación supone una fase muy concreta en el conjunto de la investigación. De hecho, se trata de una decisión que está directamente supeditada a las fases inmediatamente anteriores, a saber, la elección y definición del objeto de estudio y la formulación de los objetivos de la investigación. Sólo en el caso de que alguna de las técnicas cualitativas se adapte a la formulación de dichos objetivos será posible aplicarlas de manera rigurosa. Por tanto, la pregunta fundamental a la que hay que dar respuesta es la siguiente: ¿cuáles son las características del tema de investigación que justifican la utilización de técnicas como el grupo de discusión o la entrevista en profundidad? En principio, cualquier objeto de estudio es susceptible de ser abordado a través de cualquier técnica. Ahora bien, las técnicas cualitativas estarán justificadas cuando las características a analizar requieran obtener información de naturaleza discursiva y dialógica. En este sentido, las técnicas cualitativas son especialmente relevantes para profundizar en la naturaleza de los procesos objeto de estudio, captando la experiencia cualitativa de los individuos con respecto a las problemáticas analizadas. De esta manera, la utilidad de las herramientas cualitativas no reside en la estandarización de la información. Más bien al contrario, no se trata de homogeneizar la información, sino de recoger con amplitud, a través del material discursivo elaborado por los sujetos, las distintas dimensiones de la experiencia de los procesos sociales e individuales objeto de estudio. En gran medida, se trata de recopilar en detalle saberes/discursos individuales para construir y hacer inteligible el sentido de lo social. Así, las técnicas cualitativas de investigación social son especialmente útiles para: 1) Reconstruir (en sentido amplio, es decir, haciendo inteligible) acciones y experiencias pasadas de los individuos con el objetivo de analizar procesos de naturaleza social o psicosocial. 2) Para la investigación de representaciones sociales, actitudes hacia colectivos o instituciones sociales, estereotipos, etc.
3) Para estudiar la interacción entre lo psicológico (personal) y conductas sociales y psicosociales específicas (por ejemplo, para el estudio de los determinantes de la adhesión al tratamiento). 4) De manera complementaria al uso de otras técnicas, fundamentalmente el cuestionario, con el objetivo bien de profundizar en la información obtenida a través del mismo, bien de detectar procesos y situaciones susceptibles de ser estudiadas a través de la aplicación posterior del cuestionario. Son numerosas las técnicas que se encuadran dentro de la perspectiva cualitativa. En el presente artículo se analizarán brevemente las características más relevantes de las dos más utilizadas: el grupo de discusión y la entrevista en profundidad.
EL GRUPO DE DISCUSIÓN Podemos definir el grupo de discusión como una situación de interacción grupal donde un número de personas dialoga en torno a los procesos y situaciones que son objeto de investigación. El grupo de discusión está constituido típicamente por entre 6 y 8 personas que cumplen los requisitos establecidos por el investigador a partir de los objetivos previamente formulados. Un grupo con menos de 6 integrantes puede generar información de menor calidad (menos rica), mientras que un grupo con más de 8 puede resultar difícil de moderar. Además de los integrantes del grupo(1), resulta fundamental la figura del moderador o conductor del grupo. Debe tratarse de una persona con un alto nivel de información con respecto a los objetivos de investigación. Además, su labor consiste en introducir, sugerir o dirigir al grupo hacia los temas de interés para la ejecución del proyecto, obteniendo el máximo de información posible y con el mayor nivel de detalle (profundizar). Conviene enfatizar que su tarea es sugerir, dirigir la discusión hacia los ámbitos semánticos de interés para el investigador. Ahora bien, el moderador ha de ser capaz de detectar aquellos temas relevantes que surgen durante el curso de la discusión pero que no estaban previstos o contemplados en el guión/catálogo de temáticas diseñado por el equipo investigador. Precisamente la flexibilidad del grupo de discusión constituye una de sus ventajas más notorias. Y ello en dos sentidos. En primer lugar, tal y como se ha apuntado, el grupo de discusión (como cualquier técnica cualitativa) permite introducir cuestiones de investigación relevantes para hacer inteligible la problemática investigada, pero que no habían sido detectados o resaltados en la formulación de los objetivos. La naturaleza del grupo de discusión permite dar cabida a este tipo de cuestiones durante la ejecución del proceso de campo (algo que, por ejemplo, no es posible en el caso del cuestionario, ya que una vez diseñado y construido no permite modificación alguna durante
(1)Se
abordará la cuestión del muestreo más adelante.
66
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 FORMACION 1246 (75-79).qxp
8/2/08
10:13
Página 77
Sánchez Moreno E. Capítulo 10: La investigación cualitativa en la investigación en salud. Fundamentos y rigor científico
su aplicación). Además, y en segundo lugar, el grupo de discusión se adapta a un amplio número de objetos de investigación, con diferentes personas o participantes y en un amplio rango de contextos sociales. Por otro lado, uno de los elementos básicos en la consideración del grupo de discusión consiste en que esta técnica se basa en la interacción social. De hecho, el diseño, desarrollo y ejecución de un grupo de discusión genera un contexto de interacción grupal. Se trata de un aspecto de especial relevancia. La vida social en general (y en concreto la experiencia cotidiana de los individuos) se desarrolla en términos de interacciones de individuos en el contexto de los grupos sociales a los que pertenecen. De ahí que el grupo de discusión constituya una herramienta especialmente eficaz de la vida social, ya que trata de “reproducir” el contexto interactivo que define y caracteriza la vida de los individuos: si la realidad se desarrolla en términos de interacción dialógica, su estudio será especialmente fructífero si se reproduce dicha interacción dialógica como método de obtención de la información.
LA ENTREVISTA No existe una única forma de entrevistar a una persona. La encuesta (la técnica cuantitativa por definición) utiliza una forma de entrevista, caracterizada por el alto nivel de estandarización de la información que persigue. Tal estandarización lleva a la traducción, en términos matemáticoestadísticos, de las situaciones en torno a las cuales los sujetos que participan en la investigación son interrogados. Las entrevistas cualitativas se definen precisamente por el rasgo contrario: se trata de la profundidad del discurso y sus matices lo que se pretende captar, huyendo de la total estandarización de la información recogida. Evidentemente, cierta estandarización y estructuración de la información es necesaria, y de hecho las entrevistas cualitativas se apoyan en un guión de entrevista. En función de la menor o mayor flexibilidad de dicho guión las entrevistas serán más o menos estructuradas. En términos generales, utilizamos el concepto “entrevista en profundidad” para hacer referencia a una conversación entre dos personas, dirigida y registrada (grabada y transcrita), con el propósito de favorecer la producción de un discurso continuo y con una cierta línea argumental (es decir, no fragmentado y no precodificado) sobre un tema concreto (es decir, el objeto de estudio). De esta definición tentativa se desprenden al menos dos de los elementos característicos de la entrevista en profundidad. 1) En primer lugar, la información generada en una entrevista es una creación conjunta entre el entrevistado y el entrevistador. De ahí la enorme importancia que este último cobra en el proceso investigador. De la actuación del entrevistador dependerá en cierta medida que la información sea útil para establecer conclusiones significativas. En concreto, el entrevistador debe:
– Evitar sesgar el proceso comunicativo, evitando dirigir o sugerir la línea discursiva del entrevistado. Caso contrario, se reduciría la fiabilidad de la información obtenida. – Propiciar una interacción social y comunicativa que lleve al entrevistado a informar adecuadamente. De esta manera, se incrementa la validez de la información generada. Conviene adiestrar de manera adecuada al entrevistador, tanto en los objetivos de la investigación como en técnicas de comunicación, tanto verbal como no verbal. Ha de ser capaz de improvisar cuando aparezcan temas de relevancia no considerados previamente, debiendo profundizar en todo caso en la información que se pretende obtener. De hecho, la entrevista no es un interrogatorio, sino un marco pautado por el guión (véase el siguiente epígrafe) y por las intervenciones del propio entrevistador, a través de consignas (es decir, instrucciones que definen y encaminan el tema) y comentarios (explicaciones, aclaraciones, etc., que subrayan las palabras del entrevistado con el objetivo de dotar de fluidez a la conversación). En este punto es de especial relevancia el adecuado manejo del lenguaje no verbal. 2) En segundo lugar, en una entrevista es fundamental disponer de un buen guión. Su estructura y contenido dependen de las decisiones del equipo investigador. En general, el guión puede ser más o menos estructurado, la entrevista más o menos abierta. En todo caso, un buen guión es fundamental. Debe derivarse directamente de los objetivos formulados para la investigación. Un guión diseñado para una entrevista en profundidad difiere notablemente del guión que constituye un cuestionario estandarizado. En realidad, nuestro guión de entrevista contiene y parte de un conjunto de preguntas teóricas a las cuales hay que dar respuesta. Para ello, de cada pregunta teórica (que debe estar directamente relacionada con algún objetivo de la investigación) deben derivarse un número de preguntas de entrevista, que constituyen más bien lo que podemos denominar intervenciones del entrevistador, cuyo objetivo consiste precisamente en incrementar la fiabilidad y validez de la información generada. En la figura 1 se resume la estructura subyacente a un guión de entrevista en profundidad. 3) Al igual que en el caso del grupo de discusión, conviene no perder de vista que una entrevista en profundidad constituye un contexto interactivo. Del adecuado manejo que de dicho contexto haga el entrevistador (o el moderador de un grupo de discusión) dependerá en gran medida la validez y fiabilidad de la información obtenida, y por tanto también el rigor de nuestras conclusiones. Para tal fin, algunos autores hablan de la utilidad del uso de estratagemas por parte del entrevistador (o del moderador). Las estratagemas son fórmulas verbales, no verbales y gestuales utilizadas por el entrevistador con el objetivo de obtener la máxima información posible en el discurso resultante de una conversación fluida en torno a los objetivos de investigación. En la tabla 1 se recogen algunos 67
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 FORMACION 1246 (75-79).qxp
8/2/08
10:13
Página 78
Sánchez Moreno E. Capítulo 10: La investigación cualitativa en la investigación en salud. Fundamentos y rigor científico
Objetivo de Investigación
Pregunta teórica 2
Pregunta teórica 1
Figura 1. Estructura subyacente a un guión de entrevista.
Pregunta teórica 3
Pregunta Pregunta Pregunta Pregunta Pregunta Pregunta Pregunta Pregunta Pregunta guión guión 1 guión guión guión guión guión guión guión
Tabla 1. Algunas estratagemas en el marco de una entrevista en profundidad Situación/problema en el desarrollo del grupo o la entrevista
En cualquier situación (sugerencia general) En cualquier situación (sugerencia general) El discurso del sujeto no tiene suficiente riqueza o amplitud En cualquier situación (sugerencia general) Silencio del/de los sujeto/s Si el/los sujeto/s genera/n discurso de manera animada
No surgen todos los temas previstos en el guión
ejemplos de estas estratagemas, con algún ejemplo de las situaciones en las que pueden ser útiles. 4) La información generada atendiendo a los criterios hasta ahora mencionados es susceptible de análisis e interpretación desde numerosas perspectivas. El análisis del contenido y el análisis del discurso constituyen procedimientos sistemáticos de análisis semiótico y semántico de la información. En la bibliografía se incluyen referencias útiles para los lectores interesados al respecto. Conviene destacar la existencia de programas informáticos diseñados para el análisis de la información cualitativa.
PROBLEMAS COMUNES AL GRUPO DE DISCUSIÓN Y LA ENTREVISTA EN PROFUNDIDAD: EL MUESTREO La selección de los individuos que van a ser entrevistados o que van a participar en un grupo de discusión implica una labor de muestreo. El término “muestreo” se asocia con frecuencia a la encuesta (una técnica de carácter cuantitativo). Las técnicas de muestreo permitirían obtener datos cuya interpretación no se limita a la muestra manejada, sino también a la población que representa dicha muestra. De esta manera, el muestreo estaría asociado al concepto de representatividad estadística. Ahora bien, también las técnicas cualitativas deben satisfacer criterios de representatividad. En este caso no se trata de una cuestión estadística, ya que la utilización de grupos de discu-
Estratagema sugerida
Mantener doble atención: al discurso y al tiempo Manejar adecuadamente los aspectos emocionales, evitando situaciones embarazosas o violentas Formular una pregunta de amplio espectro, amplia, general. Utilizar la lisonja Trabajar las respuestas (escuchar, seguir y tratar de ampliar las respuestas): escucha en profundidad El entrevistador puede mantenerse neutral, dando libertad al entrevistado. Es preciso evitar, en todo caso, los silencios embarazosos El entrevistador puede mantenerse neutral, sin proponer nuevos temas, dando libertad al entrevistado. Conviene en este caso utilizar comunicación no verbal (gestos, ruidos, asentimientos) que explicitan el interés del entrevistador El entrevistador puede proponer el tema, si bien se recomienda una actitud vigilante que permita al entrevistador reconducir el discurso a partir de algún elemento introducido por el entrevistado
sión o de entrevistas en profundidad no permite encarar con éxito dicha tarea. En el caso de las técnicas cualitativas existen otros dos procedimientos para obtener representatividad, a saber: 1) Muestreo por saturación teórica. Se trata de obtener información con una extensión y profundidad suficiente como para permitir encarar de manera exitosa el análisis de los distintos conceptos y procesos incorporados en los objetivos de la investigación. 2) Muestreo por saturación estructural. Aquí se trata de obtener una representatividad tipológica o sociocultural. Dicho de otra forma, se trata de reflejar, en la estructura de los grupos de discusión o en la selección de las personas entrevistadas, la estructura tipológica de la población objeto de estudio (según determinados criterios, como puedan ser género, nivel de cualificación, etc.). Los individuos concretos seleccionados deben ser individuos informados (es decir, han de tener información que aportar con respecto al objeto de estudio), accesibles y dispuestos o motivados. Como puede apreciarse, la selección final de los individuos no responde a criterios de aleatoriedad o a criterios estadísticos. Es bastante frecuente en este caso utilizar métodos de captación de individuos usando las redes sociales del equipo de investigación o a través de los canales sociales adecuados. De hecho, existen empresas 68
Documento descargado de http://zl.elsevier.es el 15/09/2014. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
05 FORMACION 1246 (75-79).qxp
8/2/08
10:13
Página 79
Sánchez Moreno E. Capítulo 10: La investigación cualitativa en la investigación en salud. Fundamentos y rigor científico
especializadas en la selección y captación de individuos para su participación en el grupo de discusión. En todo caso, es preciso asegurar de manera fehaciente que los individuos no se conocen entre sí (en el caso del grupo de discusión) y que su inclusión en la muestra responde a los criterios de representatividad anteriormente mencionados.
BIBLIOGRAFÍA RECOMENDADA Alonso LE. La mirada cualitativa en Sociología. Madrid: Fundamentos; 1998.
Delgado JM, Gutiérrez J. Métodos y técnicas cualitativas de investigación en Ciencias Sociales. Madrid: Síntesis; 1994. Feldman MS. Strategies for interpreting qualitative data. Londres: SAGE; 1995. García Ferrando M, Ibáñez J, Alvira F. El análisis de la realidad social: métodos y técnicas de investigación. Madrid: Alianza; 1986. Ibáñez J. Más allá de la Sociología. El grupo de discusión, teoría y crítica. Madrid: Siglo XXI; 1979. Pujadas Muñoz JJ. El método biográfico: el uso de las historias de vida en Ciencias Sociales. Madrid: CIS; 1992. Vallés MS. Entrevistas cualitativas. Madrid: CIS; 2002. Vallés MS. Técnicas cualitativas de investigación social. Reflexión metodológica y práctica profesional. Madrid: Síntesis; 1997.
69
formación
ANEXO I
SOCIEMA
La importancia de la investigación en el pregrado de medicina The importance of research in undergraduate medical education Autores: Mauricio Ávila(1), Andrea Rodríguez-Restrepo(2) Filiación: (1) Division of Neurosurgery, University of Arizona, United States (2) Facultad de medicina, Pontificia Universidad Javeriana, Colombia E-mail: avila.mao@gmail.com Citación: Ávila M, Rodríguez-Restrepo A. The importance of research in undergraduate medical education. Medwave 2014 Nov;14(10):e6032 doi: 10.5867/medwave.2014.10.6032 Fecha de envío: 23/10/2014 Fecha de aceptación: 17/11/2014 Fecha de publicación: 21/11/2014 Origen: no solicitado Tipo de revisión: con revisión por tres pares revisores externos, a doble ciego Palabras clave: medical students, medical schools, research, undergraduate medical education
Resumen La información médica en la actualidad fluye a una gran velocidad y en cantidades nunca antes vistas. Los estudiantes de medicina son sometidos a una avalancha de información constante con pocos conocimientos del tema. Creemos que durante el pregrado la investigación en medicina es una posibilidad de cerrar esta brecha de conocimiento. El objetivo del presente estudio es demostrar la importancia de la realización de investigación durante el pregrado de medicina, así como la importancia que esta cobra en otras áreas de la medicina. Realizamos una revisión narrativa de la literatura de la base de datos de MEDLINE mediante términos correspondientes al tema. De forma adicional se discutieron otros temas relevantes para la adecuada realización de proyectos de investigación durante el pregrado. El análisis de los artículos encontrados demostró cómo la investigación es factible y fundamental en el pregrado de medicina para un adecuado desarrollo de los médicos en formación.
Abstract Currently medical information flows at great speed. Medical students are bombarded with a huge amount of this information with little knowledge about the subject. We believe that research performed during medical school will help to reduce the gap between the information available and the comprehension by the student. The goal of the present work is to expound the importance of performing research during the undergraduate medical years and the relevance of research in other fields of medicine. We performed a literature review searching MEDLINE database with terms corresponding with our work’s objective. We also discussed about the adequate performance of research projects during medical school training. The analysis of the articles retrieved, proved that research is feasible and that it is a critical process during the undergraduate period for medical students.
Introducción Science is a way of thinking much more than it is a body of knowledge (Carl Sagan) La ciencia es más una forma de pensar que un cuerpo de conocimientos.
La información científica fluye a una velocidad nunca antes vista. En la actualidad se vive conectado las 24 horas del día con “bombardeos” constantes de información relevante y no relevante sobre múltiples temas. La medicina no escapa a esta tendencia mundial. Se publican decenas de artículos día a día en diferentes revistas y bases de datos, los que continúan alimentando el conocimiento médico. Hoy en día el mundo vive conectado entre sí por medio de internet y a través de múltiples dispositivos electrónicos, lo
70
que hace posible consultar cualquier tipo de información en el momento en que se requiera y donde quiera que se esté. Hoy se encuentran ejemplos de cómo la información digital es constantemente transmitida a los estudiantes de pregrado de medicina, incitándolos a buscar más conocimiento digital e inclusive se dictan clases de manera virtual o en línea [1]. Sin embargo, no es extraño encontrar profesores en las facultades de medicina que aún enseñan, con libros de texto antiguos, temas médicos que ya han sido comprobados como peligrosos o en exceso mórbidos para los pacientes. Estos docentes le transmiten ese tipo de información a sus alumnos, quienes son las nuevas generaciones de médicos. Existe una preocupación constante a nivel mundial por la disminución de los denominados “médicos-investigadores”. Los estudiantes ya no ven una carrera con fuerte énfasis en investigación como algo viable para su futuro profesional. Zemlo et al. [2] demostraron que la cantidad de médicos investigadores se ha visto reducida de forma importante en los últimos años, con disminución aún más significativa en el interés de los estudiantes por continuar realizando investigación en su vida profesional. Estos resultados son concordantes con lo planteado por Rosenberg [3]. En Colombia el problema puede ser aún peor. Un estudio realizado en el año 2002 [4] demostró que este país solamente aporta el 2% de la literatura científica latinoamericana. El problema puede ser más grave si pensamos en los obstáculos propios de Colombia para una adecuada producción científica [5]. Todo lo anterior nos lleva a preguntarnos, ¿debe ser el estudiante un simple consumidor de información? o ¿debe también ser creador de esa información médica? El objetivo de este estudio es demostrar la importancia de la inclusión de la investigación biomédica durante el pregrado en los currículos de las facultades de medicina. Se realizó una revisión narrativa de la literatura indagando sobre el valor que representa realizar investigación como estudiante de medicina, con el fin de dar una justificación con evidencia sobre la importancia y el rol a futuro que representa hacer investigación durante el pregrado de medicina, así como el impacto en el estudiante al desarrollar competencias de investigación para su carrera.
Métodos Para este estudio se realizó una revisión narrativa del tema en la base de datos de MEDLINE a través del buscador PubMed con los siguientes términos: medical, student, scientific y publication. Se utilizaron dichos términos agrupados y en diferentes combinaciones, así como por separado. Se seleccionaron los artículos publicados en los últimos 10 años, eligiendo aquellos que se presentaron en texto completo en español, inglés o francés. Los autores seleccionaron aquellos que fueron relevantes para la discusión de los puntos a tratar: la investigación en medicina, la hipótesis de investigación, tiempo de
investigación, trabajo en equipo y autoría de las publicaciones. Adicionalmente, se incluyeron artículos que hayan sido citados como relevantes al tema de la discusión.
Resultados Se encontraron 23 artículos según los términos de la búsqueda. Posterior a la descarga del texto completo y la selección basada en los criterios establecidos en la metodología, se escogieron 16 artículos para analizar en detalle. Los resultados de los artículos obtenidos se presentan y se discuten a continuación, en las diferentes secciones propuestas por los autores. La investigación en medicina La investigación es un tema de alto impacto en el ámbito educacional. Hoy en día la gran mayoría de los profesionales y estudiantes están en busca de proyectos de investigación, que generen nuevas propuestas, ideas innovadoras y nuevas teorías respecto al entorno que los rodea. La salud y sus profesiones derivadas no se quedan atrás de este auge. En los últimos años ha surgido un interés creciente por realizar investigación en medicina en todos los niveles de educación. Alrededor del mundo cada vez son más los artículos originales, los reportes de caso y los estudios ciegos o doble ciegos que se están realizando por médicos profesores, residentes o asistentes de investigación en medicina, con el fin de aportar nuevos conocimientos en el área, así como dejar sus nombres en lo alto de la pirámide académica como innovadores o simplemente como creadores de nuevas hipótesis. Sin embargo, más allá de las investigaciones realizadas por grandes profesores o investigadores, ¿es el estudiante de medicina un investigador en potencia? Definitivamente sí lo es y no únicamente en potencia, el estudiante de medicina es un investigador desde que inicia su carrera, aunque él no lo sepa en ese momento. El simple hecho de que el estudiante tenga que buscar, indagar y resolver las dudas que le generan cada día las diversas patologías, cumplen con el requisito fundamental de completar una investigación. Cuando finalmente el estudiante realiza una búsqueda de su duda y logra hallar las respuestas a su pregunta original, está haciendo investigación. Aún más, si decide explicarle a un compañero, ¿no es eso difusión del conocimiento? El estudiante de medicina está cumpliendo con los requisitos para considerarse un investigador a lo largo de su carrera. Realizar investigación como estudiante y divulgar los resultados, sobretodo en publicaciones indexadas, influye posteriormente en la contratación docente, la promoción laboral, el salario, el reconocimiento académico y la reputación científica. Realizar investigación puede contribuir a la competitividad del estudiante para entrar a residencias o puestos de trabajo, en muchos casos puede ser hasta el punto diferencial para lograr la aceptación en una carrera de posgrado [6],[7].
71
The first step in applying the scientific method consists in being curious about the world. (Linus Pauling)
en la búsqueda del diagnóstico y tratamiento acertado de cada caso.
El primer paso en la aplicación del método científico consiste en ser curioso sobre lo que sucede en el mundo.
Al realizar un interrogatorio para examinar a un paciente suelen surgir muchas preguntas de los estudiantes o residentes y, aunque suele llegarse a un diagnóstico, muchas de estas interrogantes suelen quedar sin respuesta. Se ha visto que los médicos sólo buscan un tercio de las preguntas que nacen en su práctica cotidiana, quedando muchas de ellas sin una investigación correcta [10]. Precisamente en estas preguntas pueden encontrarse las hipótesis de investigación.
La hipótesis real Toda investigación se inicia con el planteamiento de una hipótesis de estudio. Pero, ¿qué se necesita para esto? Principalmente conocimiento del tema que se quiere estudiar. Cuanto mayor sea el conocimiento que se tenga del tema, las hipótesis serán más precisas o más complejas, lo que permitirá un mejor desarrollo de las ideas con las que se logre probarlas. Ello guiará un camino hacia el conocimiento a partir de la investigación, como dicta el significado del método científico [8]. El método científico no es exclusivo de la investigación, ayuda al diagnóstico y aproximación del paciente. Asimismo, lleva al estudiante a realizar un pensamiento abstracto y crítico, que le da las herramientas para proponer hipótesis en investigación sobre los signos y síntomas de los pacientes, para finalmente plantear posibles soluciones a dichos interrogantes. El estudiante de medicina puede adquirir esta habilidad para plantear hipótesis de formas tan evidentes como en sus rotaciones médicas. Si, por ejemplo, el estudiante realiza un seminario sobre glioblastoma multiforme para una rotación clínica, mientras él esté buscando información al respecto, la recopile, traduzca las ideas más importantes a sus propias palabras y las logre plasmar en una presentación, en este punto se generarán las dudas sobre el tema y los posibles vacíos de conocimiento e información. De esta forma, ya sea porque el estudiante encuentra las interrogantes o porque la información que él está leyendo se lo dice así (el famoso “se necesitan más estudios para conocer esta problemática” de varios artículos), las interrogantes de posibles nuevas investigaciones aparecen. Lo importante aquí es que logre identificar la posible hipótesis de investigación. La construcción de nuevas hipótesis ha sido un gran problema para los estudiantes de medicina, tanto en el pregrado como en posgrado. No es únicamente por no tener la iniciativa de realizar la investigación como tal, sino porque el problema radica en que muchos no conocen el concepto teórico de hipótesis. El estudio de Pawar et al. [9] encontró que solo 58% de los residentes encuestados conocían el concepto de hipótesis de investigación. Podríamos suponer que si el problema es de esta magnitud en posgrado (médicos graduados), es muy probable que el porcentaje sea aún mayor en pregrado. El punto clave es si los estudiantes y residentes no están familiarizados con el concepto de hipótesis y de método científico, no poseerán las bases metodológicas para realizar investigación. Sin embargo muchos de ellos no son conscientes de que, a pesar de no conocer las definiciones o los conceptos claros, estos están siendo utilizados en el día a día en el hospital y en el manejo con el paciente de forma empírica así como
Estos argumentos podrían ser usados como pilar fundamental para lograr transmitir el concepto teórico de hipótesis, soportado en el uso empírico de éste en la práctica médica diaria, para que de esta forma los estudiantes logren aplicarlo a la investigación. De aquí se genera el primer punto de intervención: lograr que los estudiantes sean capaces de identificar y formular una hipótesis de investigación con un significado y método adecuados. ¿Cuándo comenzar? En los diferentes planes de estudio de pregrado de medicina de la mayoría de las facultades, existen materias sobre epidemiología, diseños de investigación y bioestadística, así como otras que proveen al estudiante de diferentes herramientas para la evaluación de las diversas metodologías que se presentan en los artículos científicos y que constituyen el objetivo principal de la mayoría de estos cursos. De forma adicional, al estudiante se le está brindando la materia prima para que él mismo logre formular una pregunta de investigación, realice las observaciones o experimentos y finalmente pueda ser capaz de analizar los resultados. Ahora bien, ¿cuándo es el momento ideal para que el estudiante comience a realizar su propia investigación? ¿debe ser apenas finaliza los cursos relacionados con investigación? ¿o tal vez durante los mismos? Estas interrogantes nos conducen a cuestionarnos sobre la efectividad de los momentos de la carrera en los que dichos cursos son dictados. Tomemos como ejemplo el plan de estudios de la Pontificia Universidad Javeriana [11]. Los estudiantes de pregrado en medicina toman el curso de bioestadística básica en segundo semestre y el siguiente curso de bioestadística avanzada en cuarto semestre. Simultáneamente están viendo anatomía humana, histología, bioquímica y fisiología ¿Qué tan relevante es en estas materias saber el significado de cómo se calcula un riesgo relativo? Otro ejemplo es la búsqueda de artículos e información en las diferentes bases de datos. Según nuestra experiencia, la utilidad de aprender esta habilidad se usa muy poco (en muchos casos ni se usa) en los primeros semestres. Principalmente porque la información necesaria para el estudiante de medicina en esos semestres se encuentra consignada en libros de texto, los cuales abarcan a profundidad el tema necesario. Es algo fuera de lo común que un estudiante tenga que buscar un artículo sobre la histología normal del hígado, para ilustrar un caso.
72
Romanov [12] realizó una encuesta a estudiantes de medicina y de odontología sobre el uso de bases de datos electrónicas como MEDLINE. En ella encontró que la búsqueda y el uso de artículos se incrementaban al final de las carreras tanto en medicina como en odontología. Esto indicaría que para los estudiantes las bases de datos se vuelven mucho más relevantes hacia el final de la carrera. Si un estudiante aprende a usar una base de datos en su primer o segundo año, pero las usa en su práctica diaria clínica en el quinto o sexto, han pasado tres o más años desde que aprendió como se hacen las búsquedas, por lo que es muy probable que el estudiante ya haya olvidado lo que necesitaba. Es frecuente encontrar a estudiantes de quinto año que no saben buscar un artículo médico para hacer una conferencia o para ampliar el conocimiento sobre una patología. Entonces debemos preguntarnos, ¿es necesario que los estudiantes busquen artículos científicos para histología o anatomía apenas aprenden el uso de bases de datos? Consideramos que no debe ser así. Proponemos que los cursos donde enseñan búsqueda de la literatura y la interpretación de artículos científicos deben dictarse mucho más cerca de su verdadera utilización por los estudiantes, principalmente como un bloque de fundamentos de investigación, más que como cursos aislados en los diferentes semestres de la carrera. Esto favorecería la inclusión de todos los conocimientos y su aplicabilidad directa a la práctica médica. Como bien concluye Romanov [12], es cuando los estudiantes están finalizando su formación que utilizan dichas bases. Es necesario encontrar un punto intermedio en la formación del médico en dónde ya se empiecen a utilizar artículos científicos y el estudiante encuentre su utilidad clínica, así aprovechará al máximo los cursos sobre investigación. El bloque de fundamentos de investigación debería estar ubicado hacia el segundo semestre posterior al inicio de la práctica clínica completa del estudiante. Mientras valore la importancia de los artículos científicos y la información que allí se encuentra, comprenderá la importancia que acarrea cada curso sobre temas de investigación. ¿La investigación como iniciativa propia? La investigación en el estudiante de medicina suele ser opcional en países desarrollados como Estados Unidos o Gran Bretaña [13] donde, si el alumno está motivado y decide desarrollar sus hipótesis, puede lograr iniciar un proyecto de investigación. Asimismo si se vincula a algún proyecto que esté siendo realizado por residentes o profesores, podrá lograr el mismo objetivo. En la mayoría de estos casos, el foco principal está en el estudiante y su curiosidad propia para que logre encontrar algún proyecto al cual vincularse y realizarlo. ¿Debe ser así en todos los casos? o por el contrario, ¿la investigación debe estar incluida dentro del plan de estudios universitario como un curso o materia fundamental? En Alemania, por ejemplo, los estudiante de medicina tienen como requisito para obtener el título médico haber realizado investigación durante el pregrado. Las
estadísticas muestran que alrededor del 70% de los estudiantes realizan sus trabajos de investigación durante la carrera o en el internado para conseguir el título de médico [13]. En este mismo estudio se demostró que alrededor de 66% de los estudiantes publicaron sus trabajos de investigación en revistas indexadas [13]. Esto último nos lleva a pensar que las investigaciones realizadas por dichos estudiantes son de buena calidad, ya que lograron conseguir la publicación de sus trabajos en revistas indexadas sorteando el difícil proceso de “revisión por pares” académicos de cada una de las revistas. Si quisiéramos trasladar este modelo a Colombia y realizar investigación de forma “obligatoria” para obtener el título de médico, se requeriría que las universidades tuvieran el presupuesto (económico y no económico) necesario para apoyar los proyectos de investigación expuestos por los estudiantes. A este respecto, encontramos la investigación realizada por Khan et al. [14] que demostró que las actividades de investigación se encontraban limitadas por falta de financiamiento o recursos. Lo que finalmente consigue que los estudiantes estén desinteresados en realizar investigación y limita el entrenamiento necesario para desarrollar proyectos [14]. Es por esto que, para que en países como este se logre incentivar la investigación, las entidades educacionales encargadas y el gobierno deben destinar recursos para que sus estudiantes logren realizar proyectos de investigación como parte de su formación. Por último, deben tener herramientas adecuadas de divulgación de los procesos para la adjudicación de fondos destinados a la investigación, así como de los protocolos o pasos a seguir para la aprobación de dichos fondos. Tiempo de investigación: realidad versus ficción Se ha discutido la investigación como parte de un proceso educativo universitario y no necesariamente como una iniciativa propia. Se genera entonces la incertidumbre de cuánto es el tiempo que debería dedicarse a hacer investigación en el pregrado y cuántos son los años que se requieren para sacar adelante algún proyecto de investigación. Es válido recordar que la investigación, sea básica o clínica, requiere de un tiempo dedicado casi exclusivamente a su realización. Se debe contar la formulación del proyecto, la recolección de los datos, el análisis y finalmente escribir, si es el caso, el artículo para ser publicado. Todos estos factores suman finalmente horas de tiempo necesarias para realizar un trabajo de buena calidad. Aunque se planteen estos tópicos como los que ocupan tiempo, no hay que olvidar que como en cualquier proyecto, la investigación se encontrará también con obstáculos a lo largo de su realización. Éstos incluyen falta de una buena asesoría docente, falta de estudios rutinarios, falta de tiempo por la carga académica, deterioro en las habilidades científicas debido a mayor tiempo ocupado en actividades clínicas y manejo inadecuado de la metodología de proyectos de investigación [15]. Si el estudiante y su grupo de investigación cuentan con un tiempo de investigación limitado, ¿cuáles deben ser sus
73
expectativas reales de sacar adelante un proyecto de este tipo? Los investigadores experimentados pueden saber que es casi imposible completar, escribir y publicar los proyectos de investigación al poco tiempo desde que se finaliza el año de investigación, algunos estudiantes no pueden estar al tanto de esta limitante [7]. El estudio de Cohen et al. [7] concluyó que, de los programas de su estudio que realizaban proyectos de investigación en un año, no era realista esperar que los estudiantes tuvieran la publicación lista antes de su graduación. Una falla en alcanzar los objetivos personales de investigación puede conducir a estrés psicológico y hasta la negación de otros beneficios que ofrezcan los programas con este tipo de proyectos de investigación [7]. Trabajo en equipo Cuando hablamos del estudiante como investigador desde que inicia su carrera y a lo largo de esta, es necesario mencionar que el estudiante no es un investigador aislado. Es de suma importancia que él entienda que la investigación es de un equipo. Los proyectos de investigación se suelen realizar entre más de una persona, por lo cual el trabajo en equipo es parte esencial de los proyectos. Trabajar en grupo conlleva a la repartición y delegación de labores lo que facilita la recolección de información, organización y luego el desarrollo de la misma. Cuando se dividen las tareas y se trabaja en conjunto, es posible lograr mejores resultados y con información más eficiente que cuando esta misma recolección es realizada por una sola persona [16],[17]. Esto también es aplicable a la redacción del texto final de la investigación. Al ser corregida y verificada por los múltiples colaboradores, se logra un mejor texto final y se podría hasta considerar que estaría pasando ya por un primer filtro de “revisión por pares académicos”. Kaufmann et al. [18] encontraron que de 103 publicaciones en el primer semestre de 2009 en el New England Journal Of Medicine, ninguna había sido realizada por un único autor. Estos resultados nos permiten considerar que la mayoría de los trabajos de investigación realizados en la actualidad son en forma de colaboraciones de expertos y trabajo en equipo, más que el esfuerzo de un único individuo. Cualquier persona que haya entrado a un laboratorio de investigación sabrá que hay múltiples personas involucradas en los procesos y en sus diferentes puntos. Esto aplica también en la investigación clínica en donde se encuentran varios profesionales encargados de los cuidados de los pacientes, lo que es en esencia un trabajo en equipo. Es aquí donde es fundamental el papel que cumplen los mentores hacia los estudiantes. El estudio de O’Sullivan et al. [19] demostraron cómo cuando aparece un mentor, los estudiantes se encuentran más dispuestos a continuar con proyectos académicos, incluso con carreras académicas. Es importante destacar que el trabajo en equipo no sólo se refiere a trabajar en conjunto con varias personas para desarrollar una idea que eventualmente se convierte en proyecto. El trabajo en equipo también debe incluir a la entidad educativa donde se realiza dicho proyecto. Las
universidades deben apoyar los proyectos de investigación que realizan sus estudiantes y brindarles los recursos como parte del equipo de trabajo. Esto significa que es necesario hacer funcionar a todos los autores, colaboradores y patrocinadores como una entidad única de trabajo con múltiples miembros, todos destinados a investigar y publicar. El trabajo en equipo es algo que se debe realizar a gran escala en universidades, no sólo a pequeña escala en laboratorios u hospitales. El autor Cuando el estudiante culmina la recolección de datos, el análisis y el escrito final, está lista su investigación para ser publicada. Consideramos que es este el momento más crítico para el joven investigador, el cual se enfrenta ahora con el problema de la autoría del trabajo. Múltiples estudios han demostrado cómo los profesores han abusado de su posición académicamente superior para ser incluidos en los diferentes trabajados de investigación [20],[21],[22],[23]. Kwok acuñó el título para este tipo de fenómeno y lo denominó el “efecto del toro blanco” (whitebull effect o [24] efecto de la vaca sagrada [25]). Este efecto consiste en que el profesor sin haber realizado y cumplido los criterios dictaminados de autoría, aprovecha su posición superior, ya sea como jefe de departamento o del laboratorio, para ser incluido en todos y cada uno de los artículos que sean publicados [24]. Debido a estos inconvenientes para reclamar autoría, el Comité Internacional de Editores de Revistas Médicas [26], desarrolló tres criterios para que una persona sea incluida como autor. Estos son: 1) que haya hecho contribuciones sustanciales al concepto y diseño, a la adquisición de datos o al análisis e interpretación de estos, 2) que haya contribuido a la redacción del artículo o revisión crítica del contenido intelectual y 3) que haya contribuido a la aprobación de la versión final que será llevada a publicación. El seguir estos lineamientos permite definir quién es autor y quién no. Existe un tema aún más delicado en el proceso de autoría y es el del primer autor. Es conocido que el primer autor se considera como aquel que realizó la gran mayoría del trabajo de investigación, trabajó más tiempo que los demás, por lo que por su esfuerzo es “premiado” con ser nombrado como primer autor. Algunos departamentos, facultades y hasta hospitales universitarios, consideran que un estudiante no puede ser considerado como primer autor y debe ser únicamente el profesor de aquel estudiante el responsable de dicho reconocimiento [25]. Esto sin duda repercute de forma negativa sobre los estudiantes ya que al no cumplir con sus objetivos individuales, pueden verse frustrados y decidir abandonar cualquier otro intento de realizar investigación por temor a que se repita dicho fenómeno. Los autores consideran que es absolutamente necesario que estos temas sean discutidos con anterioridad y se cuenten con políticas claras en cada laboratorio sobre los temas de autoría, lo que restaría futuros problemas. Un
74
estudiante motivado y reconocido volverá a trabajar en más proyectos de investigación.
Conclusiones Como resultado de la revisión realizada, se considera que la investigación es un proceso fundamental en el aprendizaje de las ciencias biomédicas. En el entorno médico se ha abandonado la realización de la misma por los estudiantes de pregrado, ya sea por bajo interés o, aún más importante, por los pocos espacios que hay actualmente en los currículos de medicina para estos proyectos. Se vuelve necesario un cambio del enfoque de las materias o cursos que se dictan en pregrado para lograr un curso consolidado de fundamentos de investigación, así como la dedicación de un tiempo fijo durante la carrera de pregrado para lograr la motivación necesaria en el estudiante y que éste emprenda por su propia cuenta (o con un mentor adecuado) un proyecto de investigación y finalmente logre culminarlo. El razonamiento para la proposición de hipótesis, la experimentación, el tiempo dedicado a la misma y el trabajo en equipo son habilidades, casi virtudes, que se hacen necesarias durante el ejercicio médico. Todas estas pueden ser adquiridas de forma casi rutinaria durante la realización de un proyecto de investigación.
Notas Declaración de conflictos de intereses Los autores han completado el formulario de declaración de conflictos de intereses del ICMJE traducido al castellano por Medwave, y declaran no haber recibido financiamiento para la realización del artículo, ni tener intereses comprometidos con la materia del mismo.
Referencias 1. Cook DA, Steinert Y. Online learning for faculty development: a review of the literature. Med Teach. 2013 Nov;35(11):930-7. | CrossRef | PubMed | 2. Zemlo TR, Garrison HH, Partridge NC, Ley TJ. The physician-scientist: career issues and challenges at the year 2000. FASEB J. 2000 Feb;14(2):221-30. | PubMed | Link | 3. Rosenberg LE. MD/PhD programs--a call for an accounting. JAMA. 2008;300(10):1208-9. | CrossRef | PubMed | 4. De Moya-Anegón F, Herrero-Solana V. Visibilidad internacional de la producción científica iberoamericana en biblioteconomía y documentación (1991-2000). Cienc InfBrasília. 2002 sept;31(3):54-65. | Link | 5. Pabón-Péres LA, Oróstegui-Pinilla DC. La investigación médica en pregrado. MedUNAB.2008 May;11(3). | Link | 6. Karani R, Ognibene FP, Fallar R, Gliatto P. Medical students' experiences with authorship in biomedical research: a national survey. Acad Med. 2013 Mar;88(3):364-8. | CrossRef | PubMed |
7. Cohen BL, Friedman E, Zier K. Publications by students doing a year of full-time research: what are realistic expectations? Am J Med. 2008 Jun;121(6):545-8. | CrossRef | PubMed | 8. Stinner A. Scientific method, imagination, and the teaching of physics. Phys Can. 2003;59(6):335-46. | Link | 9. Pawar DB, Gawde SR, Marathe PA. Awareness about medical research among resident doctors in a tertiary care hospital: A cross-sectional survey. Perspect Clin Res. 2012 Apr;3(2):57-61. | CrossRef | PubMed | 10. Ely JW, Osheroff JA, Ebell MH, Bergus GR, Levy BT, Chambliss ML, et al. Analysis of questions asked by family doctors regarding patient care. BMJ. 1999 Aug 7;319(7206):358-61. | CrossRef | PubMed | 11. Facultad de Medicina. Plan de Estudios. Pontificia Universidad Javieriana, 2013. [on line]. | Link | 12. Romanov K, Aarnio M. A survey of the use of electronic scientific information resources among medical and dental students. BMC Med Educ. 2006 May 9;6:28. | CrossRef | PubMed | 13. Cursiefen C, Altunbas A. Contribution of medical student research to the Medline-indexed publications of a German medical faculty. Med Educ. 1998 Jul;32(4):43940. | CrossRef | PubMed | 14. Khan H, Khan S, Iqbal A. Knowledge, attitudes and practices around health research: the perspective of physicians-in-training in Pakistan. BMC Med Educ. 2009 Jul 17;9:46. | CrossRef | PubMed | 15. Cabrera-Samith I, Oróstegui-Pinilla D, Angulo-Bazán Y, Mayta-Tristán P, Rodríguez-Morales AJ. [Scientific journals of medical students in Latin-America]. Rev Med Chil. 2010 Nov;138(11):1451-5. | CrossRef | PubMed | 16. Lerner S, Magrane D, Friedman E. Teaching teamwork in medical education. Mt Sinai J Med. 2009 Aug;76(4):318-29. | CrossRef | PubMed | 17. Salas E, DiazGranados D, Klein C, Burke CS, Stagl KC, Goodwin GF, et al. Does team training improve team performance? A meta-analysis. Hum Factors. 2008 Dec;50(6):903-33. | PubMed | 18. Kaufmann P, Annis C, Griggs RC. The authorship lottery: an impediment to research collaboration? Ann Neurol. 2010 Dec;68(6):782-6. | CrossRef | PubMed | 19. O'Sullivan PS, Niehaus B, Lockspeiser TM, Irby DM. Becoming an academic doctor: perceptions of scholarly careers. Med Educ. 2009 Apr;43(4):335-41. | CrossRef | PubMed | 20. Strange K. Authorship: why not just toss a coin? Am J Physiol Cell Physiol. 2008 Sep;295(3):C567-75. | CrossRef | PubMed | 21. Bennett DM, Taylor DM. Unethical practices in authorship of scientific papers. Emerg Med (Fremantle). 2003 Jun;15(3):263-70. | PubMed | 22. Mussurakis S. Authorship ethics in the radiological sciences. Australas Radiol. 1994 Feb;38(1):2-5. | PubMed | 23. Wager E. Recognition, reward and responsibility: why the authorship of scientific papers matters. Maturitas. 2009 Feb 20;62(2):109-12. | CrossRef | PubMed |
75
24. Kwok LS. The White Bull effect: abusive coauthorship and publication parasitism. J Med Ethics. 2005 Sep;31(9):554-6. | CrossRef | PubMed | 25. Avila M. Bullying in authorship: abusive mentorship and undeserved credit. Medwave. 2014 May 8;14(4):e5950. | CrossRef | PubMed |
26. No authors listed. Uniform requirements for manuscripts submitted to biomedical journals. International Committee of Medical Journal Editors. JAMA. 1997 Mar 19;277(11):927-34. | CrossRef | PubMed |
76
formación
SOCIEMA
ANEXO II
GUÍA PARA ESCRIBIR UN PROTOCOLO: UNA PROPUESTA DE INVESTIGACIÓN RECOMENDACIONES DE LA ORGANIZACIÓN PANAMERICANA DE LA SALUD
El protocolo no podrá exceder las 20 páginas tamaño carta, a espacio simple y aproximadamente 62 caracteres por línea. Cuando se propongan estudios que requieran la aplicación de cuestionarios o guías para la recolección de la información, se deberá anexar una copia de los mismos indicando el nivel de elaboración en que se encuentran, por ejemplo: ensayo para prueba piloto, formulario definitivo, etc. Con la finalidad de orientar al Investigador sobre los elementos que serán considerados, se indica el esquema básico para escribir la propuesta y se describen brevemente sus componentes. Estos elementos son una guía y no necesariamente deben ser aplicados de manera rígida. Su aplicación dependerá del tipo de estudio y del abordaje metodológico que desarrolle cada investigador. ESQUEMA BÁSICO DE UN PROTOCOLO DE INVESTIGACIÓN
TÍTULO DE LA INVESTIGACIÓN RESUMEN PLANTEAMIENTO DEL PROBLEMA (justificación científica) JUSTIFICACIÓN Y USO DE LOS RESULTADOS (objetivos últimos, aplicabilidad) FUNDAMENTO TEÓRICO (argumentación, respuestas posibles, hipótesis) OBJETIVOS DE INVESTIGACIÓN (general y específicos) METODOLOGÍA
Tipo y diseño general del estudio Definiciones operacionales Universo de estudio, selección y tamaño de muestra, unidad de análisis y observación. Criterios de inclusión y exclusión Intervención propuesta (sólo para este tipo de estudios) Procedimientos para la recolección de información, instrumentos a utilizar y métodos para el control de calidad de los datos Procedimientos para garantizar aspectos éticos en las investigaciones con sujetos humanos PLAN DE ANÁLISIS DE LOS RESULTADOS
Métodos y modelos de análisis de los datos según tipo de variables Programas a utilizar para análisis de datos REFERENCIAS BIBLIOGRÁFICAS CRONOGRAMA PRESUPUESTO ANEXOS (Instrumentos de recolección de información. Ampliación de métodos y procedimientos a
utilizar, etc.)
77
ORIENTACIÓN GENERAL DE LOS COMPONENTES DEL ESQUEMA Los esquemas pueden tener sus variaciones de acuerdo a la opción de cada investigador. No obstante, la comunidad científica ha convenido que toda propuesta, debe contener como mínimo: El planteamiento del problema y justificación de la investigación, los objetivos generales y específicos, el capítulo de metodología y el de plan de análisis, y el cronograma y presupuesto. Como guía general se brinda una orientación sobre lo que se espera que los investigadores desarrollen en cada uno de los puntos del esquema. TÍTULO DE LA INVESTIGACIÓN Un buen título debe ser corto, preciso y conciso. Le debe dejar claro al lector (revisor) los objetivos y variables centrales del estudio. Estas se constituyen en las "palabras claves" para su clasificación e indización del proyecto. Si es posible y no lo prolonga, en el título se podría anticipar el diseño. Es importante explicitar la población o universo que será investigado. Ejemplo: Efectos del programa de alojamiento conjunto en el hogar, sobre indicadores de lactancia materna: Ensayo experimental con mujeres primíparas de bajo riesgo atendidas en el Hospital Materno La Esperanza de Ciudad de Guatemala. RESUMEN DE LA INVESTIGACIÓN El resumen debe dar una idea clara al lector, sobre cuál es la pregunta central que la investigación pretende responder y su justificación. Debe explicitar las hipótesis (si aplica) y los objetivos de la investigación. Asimismo, el resumen debe contener un breve recuento de los métodos y procedimientos contenidos en el capítulo metodología. PLANTEAMIENTO DEL PROBLEMA Se constituye en la justificación científica del estudio, es decir, lo que fundamenta la necesidad de realizar una investigación para generar conocimientos que brinden un aporte al conocimiento existente. Requiere escribirse de manera tal, que además de brindar los referentes empíricos que describen la situación, quede muy claro y explícito, los vacíos de conocimiento existente sobre el problema y/o la controversia existente y la evidencia no conclusiva. Más aún, puede haber evidencias muy conclusivas de conocimientos que se consideran inmutables, y el investigador cuestiona el conocimiento acumulado por ciertos antecedentes que pretenden someter a verificación. Es en este punto donde el investigador delimita el objeto de estudio y da a conocer las interrogantes o las grandes preguntas que orientan la investigación. Una secuencia lógica para su elaboración sería: •
Magnitud, frecuencia y distribución. Áreas geográficas afectadas y grupos de población afectados por el problema. Consideraciones étnicas y de género.
•
Causas probables del problema: ¿Cuál es el conocimiento actual sobre el problema y sus causas? ¿Hay consenso? ¿Hay discrepancias? ¿Hay evidencias conclusivas?
78
•
Soluciones posibles: ¿Cuáles han sido las formas de resolver el problema? ¿Qué se ha propuesto? ¿Qué resultados se han obtenido?
•
Preguntas sin respuesta: ¿Qué sigue siendo una interrogante? ¿Qué no se ha logrado conocer, determinar, verificar, probar?
El planteamiento del problema debe brindar un argumento convincente de que los conocimientos disponibles son insuficientes para dar cuenta del problema y sus posibles alternativas de solución, o brindar un argumento convincente de la necesidad de someter a prueba si lo que se conoce y se da como un hecho verdadero, puede no ser tan cierto dados nuevos hallazgos o nuevas situaciones. En este acápite, se debe reflejar que el investigador se ha documentado sobre el problema y ha realizado una exhaustiva revisión bibliográfica sobre el tema. JUSTIFICACIÓN Y USO DE LOS RESULTADOS Describe el tipo de conocimiento que se estima obtener y la finalidad que se persigue en términos de su aplicación. Se indica la estrategia de diseminación y utilización de los hallazgos de la investigación de acuerdo a los potenciales usuarios del conocimiento producido. En la justificación, se responde a lo siguiente: •
¿Cómo se relaciona la investigación con las prioridades de la región y del país?
•
¿Qué conocimiento e información se obtendrá?
•
¿Cuál es la finalidad que se persigue con el conocimiento que brindará el estudio?
•
¿Cómo se diseminarán los resultados?
•
¿Cómo se utilizarán los resultados y quiénes serán los beneficiarios?
La justificación, que puede escribirse como parte del planteamiento del problema o como una sección aparte, debe brindar un argumento convincente de que el conocimiento generado es útil y de aplicabilidad generalizable para el contexto regional. FUNDAMENTO TEÓRICO (Background) Se deriva del planteamiento del problema (presentación de evidencia empírica y pregunta central) y es la argumentación y demostración de que la "pregunta" tiene fundamento (piso), derivando en probable(s) respuesta(s) y/o hipótesis de trabajo. •
Establecimiento de relaciones (identificación de las relaciones entre la variable independiente y variables respuesta) ¿Qué se sabe y cómo lo han explicado? ¿Los resultados son conclusivos? ¿Cuáles son los fundamentos de la pregunta?
•
¿Cómo se explican y argumentan las posibles respuestas a la pregunta? ¿Cuáles son los supuestos? ¿Cuáles son las relaciones? ¿Cuáles serían las hipótesis de trabajo?
79
El fundamento teórico, considerado el "piso" que sustenta la pregunta central del estudio, expone el razonamiento y argumentos del investigador hacia la búsqueda de la evidencia que le dé respuesta a la pregunta y/o hipótesis. Requiere igualmente, una exhaustiva revisión de la bibliografía. OBJETIVOS DE LA INVESTIGACIÓN (General y específicos) Es conveniente definirlos después que haya elaborado el fundamento teórico y se tenga clara la secuencia entre la pregunta central y las posibles respuestas a las preguntas y/o las hipótesis de trabajo. Dicha recomendación se basa en el hecho de que la definición de los objetivos no son más que una operacionalización de las respuestas y/o hipótesis que sugiere el investigador∗. Se constituyen en las actividades intelectuales que el investigador ejecutará en todo el proceso de la investigación. •
Objetivo general: Debe explicitar lo que se espera lograr con el estudio en términos de conocimiento. Debe dar una noción clara de lo que se pretende describir, determinar, identificar, comparar y verificar (en los casos de estudios con hipótesis de trabajo). Ejemplo • Verificar las diferencias en la prolongación de la lactancia materna en mujeres primíparas de bajo riesgo, cuando reciben el programa de alojamiento conjunto a nivel del hogar con respecto a las que no lo reciben.
•
Objetivos específicos: Son la descomposición y secuencia lógica del objetivo general. Son un anticipo del diseño de la investigación. Ejemplos • Estimar la prevalencia de la lactancia materna en mujeres primíparas de bajo riesgo bajo la cobertura del programa de alojamiento conjunto a nivel del hogar y la prevalencia de lactancia materna de las mujeres primíparas que reciben la atención normada por los servicios de salud. •
Determinar la existencia de diferencias estadísticamente significativas en la prevalencia de lactancia materna entre el grupo de mujeres que reciben la atención normada a nivel de los servicios y el grupo que recibe la intervención a nivel del hogar.
•
Identificar los factores protectores, que desde la perspectiva de la mujer, contribuyen a explicar las diferencias en la prevalencia de la lactancia materna según el tipo de atención recibida.
METODOLOGÍA Es la explicación de los procedimientos que se aplicarán para alcanzar los objetivos. En este acápite, se debe describir con detalle la definición operacional de las variables, el tipo y las formas de medirla. Asimismo, debe contemplar el diseño del estudio, las técnicas y procedimientos que va ∗
Se reconoce que no todas las investigaciones tienen formulación de hipótesis para verificación empírica ulterior. No obstante, siempre deben tener claramente explícitos sus objetivos general y específicos.
80
a utilizar para alcanzar los objetivos propuestos. A continuación, se describe lo que se espera que el investigador detalle en la metodología: Definición operacional de las variables Basada en los conceptos que pudieron ser explicitados en fundamento teórico, las variables deben tener una expresión operacional; es decir, que el investigador deje claro al lector qué está entendiendo por cada variable, de qué tipo de variable se trata y cuál sería la manera de resumir sus valores (cuantitativos cuando la variable se resume numéricamente y cualitativos cuando las variables asumen valores no numéricos). La operacionalización es un proceso que variará de acuerdo al tipo de investigación y su diseño. No obstante, las variables deben estar claramente definidas y convenientemente operacionalizadas. Si en el momento de confeccionar el protocolo no se hubiera llegado a ese nivel, es preciso que se explique en detalle el procedimiento mediante el cual se espera llegar a esas definiciones o, si fuera el caso, justificar por qué no se han de emplear variables en la investigación. Serán considerados incompletos aquellos protocolos cuyo nivel de operacionalización sea muy vago, por ejemplo, "se estudiarán las variables pertinentes y relevantes", "se considerarán variables demográficas y sociales", o cuando el enunciado sea tan inespecífico, que haga imposible la apreciación de la pertinencia de las variables y de su operacionalización. Tipo de estudio y diseño general El tipo de estudio y su diseño, se debe seleccionar con base a los objetivos propuestos y la disponibilidad de recursos y además, la aceptabilidad de tipo ético. El investigador debe enunciar con claridad el tipo de estudio que realizará y una explicación detallada de su diseño. En este punto, el investigador debe también enunciar las estratégicas y los mecanismos que va a poner en práctica para reducir o suprimir las amenazas a la validez de los resultados, o sea, los llamados factores confusores (en la selección y asignación de los sujetos, pérdida de casos, control de instrumentos, de los observadores, etc.). Estos aspectos luego pueden ampliarse cuando se traten en detalles en su respectivo acápite. Ejemplo: Se realizará un estudio experimental controlado con dos grupos de mujeres, las que reciben el programa de alojamiento conjunto en el hogar y las que solo reciben la atención normada por los servicios. Se seleccionarán mujeres primíparas de bajo riesgo que hayan sido atendidas en el hospital materno-infantil y recibido por lo menos dos controles pre-natales y que residan en el área de influencia del hospital. Se formarán dos grupos cuya asignación será de forma aleatoria.
81
Universo de estudio, selección y tamaño de muestra, unidad de análisis y observación. Criterios de inclusión y exclusión En este acápite, el investigador debe enunciar y describir el universo del estudio y todo lo relativo a los procedimientos y técnicas para la selección y tamaño de muestra (en caso de que no aplique se debe explicar el por qué). Para muestras bien sea probabilísticas o no probabilísticas (por conveniencia o muestras propositivas), el investigador debe indicar el procedimiento y criterios utilizados y la justificación de la selección y tamaño. Cuando se trata de estudios que seleccionarán muestras no probabilísticas y seleccionarán los sujetos de manera propositiva (conformación de grupos focales, selección de informantes claves, etc.), el investigador debe explicitar los criterios para la selección, el tipo y el tamaño de los grupos, los procedimientos para su conformación, etc. En este punto se debe también señalar, los criterios de inclusión y exclusión de los sujetos o unidades de observación, y los procedimientos para controlar los factores que pueden afectar la validez de los resultados y que están relacionados con la selección y tamaño de la muestra. Intervención propuesta (sólo para este tipo de estudios) Esta sección deberá ser desarrollada para aquellas investigaciones cuyos objetivos y diseño contemplen la evaluación de los resultados de una intervención (programa educativo, vacuna, tratamiento, etc.). Por lo general, se trata de estudios comparativos con diseños experimentales, cuasiexperimentales, antes y después, etc., donde se valoran los resultados atribuibles a la intervención. Se deberá describir la intervención tan detalladamente como sea posible, explicando las actividades en el orden que van a ocurrir. Se debe asegurar que la descripción de la intervención responde a tres preguntas fundamentales: ¿Quién será el responsable de la intervención? ¿Dónde tendrá lugar? ¿Qué actividades se van a realizar y en qué nivel de frecuencia e intensidad? Un gran número de investigaciones con intervención donde están envueltos sujetos humanos, requieren de revisión ética y por ende, el investigador requerirá desarrollar el acápite referido a este aspecto. Procedimientos para la recolección de información, instrumentos a utilizar y métodos para el control y calidad de los datos El investigador debe escribir los procedimientos que utilizará (encuesta a población, entrevistas a profundidad, observación no-practicante, dinámica de grupos focales, análisis de contenido, etc.), cómo y cuándo los aplicará y los instrumentos que utilizará para recopilar la información (cuestionario, guía de entrevista, hoja de registro de observaciones, guía de moderador del grupo focal, guía de análisis de contenido, etc.). Cuando se apliquen procedimientos o técnicas standarizados y/o documentados en la literatura, se puede hacer una breve descripción e indicar la bibliografía donde se brindan los detalles de dichos procedimientos y técnicas.
82
En este acápite, es necesario describir con detalle, los procedimientos que utilizará para controlar los factores que amenazan la validez y confiabilidad de los resultados (control de observadores o responsables de recopilar la información y control de los instrumentos). En el caso de requerirse el uso de datos secundarios, el investigador describirá las fuentes, su contenido y la calidad de los datos que piensa utilizar, de manera que quede claro que las mismas pueden suministrar la información requerida para el estudio. Si utilizara fuentes documentales de tipo histórico, periodístico, etc., deberá indicar también las fuentes y técnicas a utilizarse para recolectar y analizar la información. Se deben anexar al protocolo, los instrumentos que serán utilizados (cuestionarios, guías de entrevistas, guías del moderador, hojas de registro, etc.) indicando en qué etapa de su elaboración se encuentran. Procedimientos para garantizar aspectos éticos en las investigaciones con sujetos humanos Cuando se trate de investigaciones que envuelven sujetos humanos, se deberá explicitar en este acápite los siguientes aspectos: •
Los beneficios y los riegos conocidos o inconvenientes para los sujetos envueltos en el estudio.
•
La descripción precisa de la información a ser entregada a los sujetos del estudio y cuando será comunicada oralmente o por escrito. Ejemplos de dicha información incluye: los objetivos y propósitos del estudio, cualquier procedimiento experimental, cualquier riesgo conocido a corto o largo plazo, posibles molestias; beneficios anticipados de los procedimientos aplicados; duración del estudio; métodos alternativos disponibles para tratamiento si el estudio es la prueba de un tratamiento; la suspensión del estudio cuando se encuentren efectos negativos o suficiente evidencia de efectos positivos que no justifiquen continuar con el estudio y, la libertad que tienen los sujetos de retirarse del estudio en cualquier momento que deseen.
•
En caso que aplique, indicar algún incentivo especial o tratamiento que recibirán los sujetos por su participación en el estudio. En caso de que haya algún tipo de remuneración, especificar el monto, manera de entrega, tiempo y la razón por la cual el pago es requerido.
•
Indicar cómo será mantenida la confidencialidad de la información de los participantes en el estudio.
•
Listar las drogas, vacunas, diagnóstico, procedimiento o instrumento a ser utilizado, independientemente que el mismo sea registrado, no registrado, nuevo o de corriente uso en el país.
También se tiene que dar respuesta a otros aspectos éticos tales como: •
Para estudios donde se obtendrá información personal de los sujetos, indicar cómo la información se mantendrá confidencial.
83
•
Para estudios que envuelve la participación de sujetos en un experimento (ensayos experimentales, cuasi-experimentales, estudios de intervenciones, etc.), se debe proveer información acerca del consentimiento libre e informado de los participantes y la estrategia que se utilizará para obtenerlo.
•
Breve reseña de cómo los hallazgos de la investigación serán reportados y entregados a los sujetos envueltos en el estudio u otros interesados.
•
Indicar y justificar la inclusión según el caso, de niños, ancianos, impedidos físicos y mujeres embarazadas. Justificar la no inclusión en el grupo de estudio, si es el caso, de mujeres (de cualquier edad) o minoría étnica, grupo racial, etc.
•
Cuando sea el caso, indicar cómo se garantizará el adecuado equilibrio de los dos sexos en los grupos de estudio. Asimismo y cuando aplique, indicar cómo las inequidades de género y la condición de discriminación y desventaja de la situación de las mujeres, pueden afectar el control sobre su involucramiento en la investigación.
Cuando se trate de estudios que envuelvan sujetos humanos, un Comité de Ética institucional del país donde se lleve a cabo la investigación, deberá evaluar y avalar que la investigación, preferiblemente, antes de ser sometida al Programa de Subvenciones. Se deberá anexar la nota de consentimiento informado que firmarán los sujetos envueltos en el estudio. Si el CAII lo recomienda, el proyecto pasará al Comité de Ética de la OPS antes de su aprobación definitiva del Director y el PSI solicitará información adicional en caso de que así se requiera. PLAN DE ANÁLISIS DE LOS RESULTADOS Si bien este punto se considera dentro de la metodología, se sugiere que el investigador lo desarrolle como una sección aparte. A continuación, se indica lo que se espera sea desarrollado como plan de análisis. Métodos y modelos de análisis de los datos según tipo de variables De acuerdo a los objetivos propuestos y con base al tipo de variables, el investigador deberá detallar las medidas de resumen de sus variables y cómo serán presentadas (cuantitativas y/o cualitativas), indicando los modelos y técnicas de análisis (estadísticas, no estadísticas o técnicas de análisis de información no numérica, etc.). Es deseable que el investigador presente una tentativa de los principales tabulados de la información (particularmente cuando se trata de variables que se resumen numéricamente), sobre todo, de aquellas claves que servirán de base para la aplicación de los modelos de análisis estadístico. Programas a utilizar para análisis de datos Describir brevemente los "softwares" que serán utilizados y las aplicaciones que realizarán.
84