Manual del INVESTIGADOR NOVEL VOLUMEN 1 Coordinadores Cristina Esquinas López Francisco García Río Autor revisor David Peña Otero
Manual del INVESTIGADOR NOVEL VOLUMEN 1 Coordinadores Cristina Esquinas López Francisco García Río Autor revisor David Peña Otero
ISBN: 978-84-122872-5-7 © 2021 SEPAR Editado y coordinado por RESPIRA-FUNDACIÓN ESPAÑOLA DEL PULMÓN-SEPAR Reservados todos los derechos. Ninguna parte de esta publicación puede ser reproducida ni transmitida en ninguna forma o medio alguno, electrónico o mecánico, incluyendo las fotocopias, grabaciones o cualquier sistema de recuperación de almacenaje de información, sin el permiso escrito del titular del copyright.
ÍNDICE DE AUTORES
COORDINADORES Dra. Cristina Esquinas López Servicio de Neumología. Hospital Universitari Vall d’Hebron, Barcelona. Dr. Francisco García Río Servicio de Neumología. Hospital Universitario La Paz; Facultad de Medicina, Universidad Autónoma de Madrid; IdiPAZ; Madrid. CIBER de enfermedades respiratorias (CIBERES). Instituto de Salud Carlos III, Madrid. AUTOR REVISOR Dr. David Peña Otero Subdirección de Cuidados, Hospital Sierrallana, Servicio Cántabro de Salud; Grupo de Enfermería de los Institutos de Investigación Sanitaria IDIVAL, Santander e IiSGM, Madrid.
VOLUMEN 1 AUTORES Dr. Felip Burgos Rincón Centro Diagnóstico Respiratorio, Servicio de Neumología (ICR) Hospital Clínic; Universidad de Barcelona; IDIBAPS; CIBERES, Barcelona. Dra. Cristina Esquinas López Servicio de Neumología. Hospital Universitari Vall d’Hebron, Barcelona. Dr. Alberto Fernández Villar Servicio de Neumología. Hospital Álvaro Cunqueiro, Vigo. Profesor Asociado de Ciencias de la Salud, Universidad de Santiago de Compostela. Dra. Carmen Fuentelsaz Gallego Hospital Universitari Vall d’Hebron, Barcelona. Dra. Judith Garcia Aymerich Institut de Salut Global (ISGlobal), Centre de Recerca en Epidemiologia Ambiental (CREAL), Barcelona.
Dr. Francisco García Río Servicio de Neumología. Hospital Universitario La Paz; Facultad de Medicina, Universidad Autónoma de Madrid; IdiPAZ; Madrid. CIBER de enfermedades respiratorias (CIBERES). Instituto de Salud Carlos III, Madrid. Máster María Ángeles Gimeno Peribañez Servicio de Neumología. Hospital Universitari Dr. Josep Trueta, Girona. Dra. Elena Gimeno Santos Hospital Clínic de Barcelona. Instituto de Salud Global (ISGlobal) de Barcelona. Facultad de Ciencias de la Salud Blanquerna, Universidad Ramón Llull, Barcelona. Dr. Jordi Giner Donaire Servicio de Neumología y Alergia. Hospital de la Santa Creu i Sant Pau, Barcelona. Dr. José Luis López-Campos Bodineau Unidad Médico-Quirúrgica de Enfermedades Respiratorias. Instituto de Biomedicina de Sevilla (IBiS). Hospital Universitario Virgen del Rocío/Universidad de Sevilla, Sevilla. CIBER de Enfermedades Respiratorias (CIBERES). Instituto de Salud Carlos III, Madrid. Dr. Marc Miravitlles Servicio de Neumología. Hospital de la Vall d´Hebron; Vall d’Hebron Institut de Recerca (VHIR); Centro de Excelencia para el diagnóstico y Tratamiento del DAAT en el Hospital Vall d’Hebron, Barcelona. Dra. Isabel Novoa García Hospital Universitario Vall d’Hebron, Biobanco HUVH, Hospital Infantil i de la Dona. Vall d’Hebron Institut de Recerca (VHIR), Barcelona. Máster Meritxell Peiró i Fàbregas Hospital de la Santa Creu i Sant Pau, Barcelona. Máster Patricia Pérez González Hospital Universitario La Princesa, Madrid. Dr. Luis Puente Maestu Servicio de Neumología. Hospital General Universitario; Instituto de Investigación Sanitaria Gregorio Marañón; Facultad de Medicina de la Universidad Complutense de Madrid, Madrid. Dr. Ignasi Serra Pons Instituto de Salud Global de Barcelona - Campus MAR Barcelona Biomedical Research Park (PRBB), Barcelona Dr. Joan B. Soriano Ortiz Hospital Universitario de la Princesa. Universidad Autónoma de Madrid, Madrid.
VOLUMEN 2 AUTORES Dra. Esther Barreiro Portela Servicio de Neumología, Grupo de Investigación en Desgaste Muscular y Caquexia en Enfermedades Crónicas Respiratorias y Cáncer de Pulmón, Instituto Hospital del Mar de Investigaciones Médicas (IMIM)-Hospital del Mar, Departamento de Ciencias Experimentales y de la Salud (CEXS), Universidad Pompeu Fabra (UPF), Barcelona; CIBERES, Instituto de Salud Carlos III (ISCIII). Dra. María Luz Calle Rosingana Coordinadora del grupo de investigación en Bioinformática y Estadística Médica, Directora del Departamento de Biociencias, Facultad de Ciencia y Tecnología, Universitat de Vic - Universitat Central de Catalunya, Vic (Barcelona). Dra. María Jesús Cruz Carmona Servicio de Neumología, Hospital Universitari Vall d’Hebron, Barcelona. CIBERES. Dr. Joaquín Durán Cantolla Servicio de Investigación, OSI ARABA Hospital Universitario Araba (Vitoria). Instituto de Investigación Sanitaria Bioaraba (Vitoria). Departamento de Medicina, Universidad de País Vasco. Unidad de Trastornos del Sueño. Clínica Eduardo Anitua (Vitoria). CIBERES. Dr. Miguel Ángel Martínez García Jefe de Sección. Hospital Universitario y Politécnico la Fe de Valencia. Dra. María Antonia Ramón Servicio de Neumología, Hospital Universitari Vall d’Hebron, Barcelona. Dra. Rosa Torres Blanch Departamento de Farmacología, Universitat Autònoma de Barcelona. CIBERES.
ÍNDICE GENERAL VOLUMEN 1 MÓDULO 1: BASES DE LA INVESTIGACIÓN 1.1. INTRODUCCIÓN A LA INVESTIGACIÓN. EL MÉTODO CIENTÍFICO ......................................
17
1.2. ÉTICA E INVESTIGACIÓN .................................................................................................................. 23 1.3. REVISIÓN BIBLIOGRÁFICA ............................................................................................................. 37
MÓDULO 2: METODOLOGÍA CIENTÍFICA 2.1. TIPOS DE DISEÑOS: GENERALIDADES ........................................................................................ 61 2.2. ESTUDIOS DESCRIPTIVOS ............................................................................................................. 69 2.3. ESTUDIOS ANALÍTICOS: COHORTES Y CASO-CONTROL ......................................................
77
2.4. ESTUDIOS EXPERIMENTALES Y CUASI EXPERIMENTALES ................................................. 91 2.5. TIPOS DE ERROR. VALIDEZ, SESGOS Y CONFUSIÓN ............................................................. 101 2.6. REVISIONES SISTEMÁTICAS Y METAANÁLISIS ...................................................................... 119 2.7. VALIDACIÓN DE PRUEBAS DIAGNÓSTICAS ............................................................................. 131 2.8. VALIDACIÓN DE CUESTIONARIOS ............................................................................................... 145
MÓDULO 3: PROYECTO DE INVESTIGACIÓN 3.1. PROTOCOLO DE INVESTIGACIÓN: GENERALIDADES ............................................................. 161 3.2. HIPÓTESIS Y OBJETIVO DE ESTUDIO ........................................................................................... 175 3.3. POBLACIÓN DIANA, POBLACIÓN DE ESTUDIO Y MUESTRA. TÉCNICAS DE MUESTREO ...................................................................................................................................... 181 3.4. TAMAÑO DE LA MUESTRA ............................................................................................................... 193 3.5. CREACIÓN Y MEDICIÓN DE VARIABLES. FUENTES DE INFORMACIÓN ............................ 203 3.6. TRABAJO DE CAMPO ......................................................................................................................... 209 3.7. PROCESAMIENTO Y GESTIÓN DE MUESTRAS BIOLÓGICAS. BIOBANCOS ................... 217 3.8. FINANCIACIÓN DE UN PROYECTO. MEMORIA ECONÓMICA ............................................... 225
VOLUMEN 2 MODULO 4 4.1. EXPERIMENTACIÓN ANIMAL- MODELOS ANIMALES 4.2. LEGISLACIÓN Y COMITÉS DE ÉTICA EN EXPERIMENTACIÓN ANIMAL
MODULO 5 5.1. DISEÑO Y GESTIÓN DE LA BASE DE DATOS 5.2. PRINCIPALES MEDIDAS DE FRECUENCIA Y ASOCIACIÓN 5.3. ANÁLISIS DE DATOS DESCRIPTIVOS 5.4. INFERENCIA ESTADÍSTICA 5.5. ANÁLISIS DE LA CONFUSIÓN Y LA INTERACCIÓN 5.6. MODELOS DE REGRESIÓN- ANALISIS MULTIVARIADO 5.7. ANÁLISIS DE CONGLOMERADOS
MODULO 6 6.1. COMUNICACIÓN DE LOS RESULTADOS. 6.2. LA INNOVACIÓN CIENTÍFICA EN BIOMEDICINA 6.3. ARTÍCULO CIENTÍFICO
MODULO 7 7.1. LÍNEAS FUTURAS DE INVESTIGACIÓN: LAS CIENCIAS ÓMICAS EN LA INVESTIGACIÓN CLÍNICA
PRESENTACIÓN Dra. Cristina Esquinas López y Dr. Francisco García Río Coordinadores del Manual del Investigador Novel
Como Sociedad científica, SEPAR mantiene un ineludible compromiso con la investigación en el ámbito de la salud respiratoria y, en la línea de potenciar el acceso a este ámbito de un mayor número de socios se enmarca la elaboración del presente manual. En este sentido, el Área de Enfermería Respiratoria ha reconocido como una de sus prioridades proporcionar herramientas que faciliten el acceso a distintos aspectos necesarios para el desarrollo de un proyecto de investigación. Asumiendo la necesidad de apoyar la emergencia de investigadores noveles, cuya iniciativa e impulso resultará esencial para todos y que constituyen el futuro de nuestra sociedad. Por todo ello, el objetivo de este proyecto ha sido elaborar una herramienta de aprendizaje para profesionales sanitarios que centran su actividad en la enfermedad respiratoria, profesionales de atención primaria, y otras disciplinas y especialidades interesadas en la investigación clínica. El manual se ha planteado siguiendo el orden del proceso de investigación en el que se especifica las fases y la metodología más adecuada para plantear una investigación. Además, se desarrollan los conceptos básicos de estadística para el análisis de datos centrado principalmente en la interpretación de los mismos. Como último paso del proceso de investigación, se proporcionan los conocimientos acerca de la comunicación y la innovación científica. En los últimos años las nuevas herramientas de análisis basadas en la obtención masiva de información molecular han posibilitado la comprensión más integrada del funcionamiento de un sistema biológico. La integración de la información clínica, medioambiental y de los distintos niveles biológicos sin duda será un punto clave en el avance de la investigación y ofrecerá la posibilidad de nuevas alternativas en el manejo de las enfermedades. Así pues, como objetivo final, el presente manual se ha propuesto aproximar a los interesados en la investigación clínica hacia nuevas perspectivas de análisis. Agradecemos a todos los autores la gran implicación que han tenido en la elaboración y adaptación de todo el material, así como a la totalidad del Área de Enfermería Respiratoria de SEPAR, representada por sus sucesivos/as coordinadores/as por el constante apoyo y aliento en la edición del presenta manual. Finalmente, queda a disposición de todos los socios, con la esperanza que pueda servir como material de consulta y referencia para cuestiones puntuales en el desarrollo del mayor número posible de proyectos de investigación.
Modulo 1:
BASES DE LA INVESTIGACIÓN
Responsable: Dr. Felip Burgos Rincón
Manual del Investigador Novel
14
Índice 1.1. Introducción a la investigación. El Método científico
ÍNDICE 1.1. INTRODUCCIÓN A LA INVESTIGACIÓN. EL MÉTODO CIENTÍFICO ......................................
17
INTRODUCCIÓN ..................................................................................................................................
17
MÉTODO CIENTÍFICO ........................................................................................................................
17
Características del método científico Técnicas del método científico Fases del método científico PUNTOS CLAVE ................................................................................................................................... 19 BIBLIOGRAFÍA ..................................................................................................................................... 20 TABLAS Y FIGURAS ...........................................................................................................................
21
1.2. ÉTICA E INVESTIGACIÓN .................................................................................................................. 23 INTRODUCCIÓN .................................................................................................................................. 23 VALOR DE UNA INVESTIGACIÓN CLÍNICA ................................................................................. 23 VALIDEZ CIENTÍFICA .......................................................................................................................... 24 CONSENTIMIENTO INFORMADO ................................................................................................... 26 EVALUACIÓN INDEPENDIENTE ....................................................................................................... 27 BUENA PRÁCTICA CLÍNICA ............................................................................................................ 28 PROTECCIÓN DE LOS DERECHOS DE LOS PACIENTES .......................................................... 28 PUNTOS CLAVE ................................................................................................................................... 29 BIBLIOGRAFÍA ..................................................................................................................................... 30 TABLAS Y FIGURAS ...........................................................................................................................
31
1.3. REVISIÓN BIBLIOGRÁFICA ............................................................................................................. 37 INTRODUCCIÓN .................................................................................................................................. 37 ETAPAS DE BÚSQUEDA BIBLIOGRÁFICA ................................................................................... 37 ELABORACIÓN DE LA ESTRATEGIA DE LA BÚSQUEDA BIBLIOGRÁFICA ......................... 38 BASES DE DATOS ............................................................................................................................... 38 Medline y Embase PubMed PUNTOS CLAVE ................................................................................................................................... 40 BIBLIOGRAFÍA ..................................................................................................................................... 41 TABLAS Y FIGURAS ........................................................................................................................... 42
15
Manual del Investigador Novel
16
1.1. Introducción a la investigación. El Método científico
1.1. INTRODUCCIÓN A LA INVESTIGACIÓN. EL MÉTODO CIENTÍFICO Dr. Marc Miravitlles
INTRODUCCIÓN El profesional sanitario debe tomar múltiples decisiones sobre la atención a sus pacientes, para lo cual necesita disponer de información de diferente naturaleza: cuál puede ser la causa del problema del paciente concreto, cuál es su pronóstico, qué estrategia diagnóstica es la más adecuada, qué tratamiento es más eficaz en su situación, qué información y recomendaciones puede proporcionarle para mejorar su estado de salud, etc. Además de tomar en consideración factores como las necesidades y preferencias de los pacientes o las prioridades y recursos que tiene a su alcance, el profesional debe basar sus decisiones en información (evidencia) válida sobre los efectos de las distintas alternativas de actuación. La principal fuente de estas evidencias es la investigación clínica y epidemiológica. La toma de decisiones debe basarse en evidencias científicas explícitas y contrastables empíricamente, procedentes de la investigación rigurosa, que conduzcan a la obtención de pruebas más objetivas (medicina y cuidados basados en la evidencia).
MÉTODO CIENTÍFICO El objetivo de cualquier ciencia es adquirir conocimientos desde una perspectiva que intenta no solo abordar acontecimientos y situaciones aisladas, sino también comprender fenómenos desde una óptica más generalizada. El problema es elegir un método adecuado que permita conocer la realidad, entendiendo como tal la referida a un determinado problema. La aplicación formal de los procedimientos sistemáticos que componen el método científico es el proceso que el investigador sigue para comprender, explicar, predecir o controlar fenómenos. Según el Diccionario Actual de la Lengua Española, denominamos método el «modo ordenado de proceder para llegar a un resultado o fin determinado, especialmente para descubrir la verdad y sistematizar los conocimientos». El método científico (del griego: μετά, ‘hacia, a lo largo’, y οδός, ‘camino’; y del latín scientia, ‘conocimiento’; así pues, ‘camino hacia el conocimiento’) es un método de investigación usado principalmente en la producción de conocimiento en las ciencias. El método científico está basado en dos pilares, la reproducibilidad, es decir, la capacidad de repetir un determinado experimento en cualquier lugar y por cualquier persona, y la refutabilidad, es decir, toda propo17
Manual del Investigador Novel
sición científica tiene que ser susceptible de ser refutada. Esto implica que si se diseñan experimentos y dan resultados distintos a los predichos, estos negarían la hipótesis puesta a prueba. La investigación se inicia a partir de la identificación de un problema o de la generación de una buena idea y definiendo la pregunta concreta a la que el estudio pretende responder (pregunta PICO, Tabla 1.1.1), expresada habitualmente en forma de hipótesis de trabajo o de objetivo específico. El diseño de la investigación implica, en una primera fase, la selección del tipo de estudio más adecuado para responder a la pregunta planteada y la construcción de su estructura básica. Posteriormente se concretarán los aspectos relacionados con la población de estudio, como los criterios de selección de los participantes: cómo se identificarán y seleccionarán, el número necesario y el modo de calcularlo si fuera preciso, y la técnica que se utilizará para formar los grupos de estudio. También deben identificarse las variables importantes del estudio: cuál será la variable de respuesta principal, qué otras variables será necesario medir, qué instrumentos de medida habrá que utilizar, etc. También deberá planificarse con detenimiento la fase de recogida de datos y la estrategia que se seguirá para su análisis. Dado que la utilidad de una investigación depende en gran medida de que sus resultados sean aplicados en la práctica, es fundamental la correcta difusión del trabajo realizado en el ámbito adecuado y su inclusión en las bases de datos internacionales para que pueda ser identificado, localizado y evaluado por los profesionales sanitarios. Características del método científico • Es un método teórico. • Es sistemático: sentido de orden y disciplina que busca garantizar un nivel aceptable de reproducibilidad y validez. • Es a la vez inductivo y deductivo. • Tiene una base empírica: emplea la observación directa para obtener los datos objetivos necesarios que documenten el conocimiento obtenido. • Emplea el examen crítico: el científico somete sus resultados a la prueba empírica, se halla sujeto a revisión y sus resultados no son nunca definitivos. • Es circular: interacción continua entre experiencia y teoría. La teoría alimenta la experiencia y ésta a la teoría, con el objetivo de entrar en un proceso de retroalimentación que permita la acumulación de conocimiento. • Su objetivo es controlar los factores que no están directamente relacionados con las variables en cuestión pero que pueden influir sobre ella. Técnicas del método científico Las técnicas pueden ser el razonamiento inductivo y el razonamiento deductivo. La diferencia entre uno y otro radica en la dirección del razonamiento para llegar a las conclusiones. Tanto el método inductivo como el deductivo son estrategias de razonamiento lógico. Se diferencian en que el inductivo utiliza premisas particulares para llegar a una conclusión general, mientras que el deductivo usa principios generales para llegar a una conclusión específica. Ambos métodos son importantes en la producción de conocimiento. Durante una investigación científica, es posible que se utilice uno u otro o una combinación de ambos, en función del campo de estudio (Tabla 1.1.2).
18
1.1. Introducción a la investigación. El Método científico
En la actualidad, el método utilizado en las ciencias experimentales es el llamado método hipotético-deductivo. Fases del método científico Las etapas que integran el método científico son (Figura 1.1.1): 1. Observación y evaluación de la evidencia científica 2. Definición y planteamiento del problema: pregunta para la cual no encontramos respuesta. Es necesario que sea resoluble y debe ser formulado en términos adecuados. 3. Formulación de la hipótesis: la hipótesis es una predicción a priori. Las hipótesis se pueden formular como objetivos o resultados que se quieren conseguir. Para aceptar o rechazar la hipótesis (o conseguir el objetivo) se elige un determinado diseño de estudio. 4. Recogida y análisis de datos: comprobación empírica tras recogida de datos. Es la etapa más específica de cada técnica concreta del método científico. 5. Conclusiones y generalización de los resultados: Si los datos avalan la hipótesis, esta será confirmada. En caso contrario, se concluirá que en las circunstancias contempladas la hipótesis no ha sido confirmada y/o se volverá a la segunda etapa y se propondrá una nueva y coherente solución al problema. 6. Nuevas predicciones: esta etapa es añadida por algunos autores y contempla nuevos problemas que surgirían de los resultados obtenidos.
PUNTOS CLAVE • El método científico es el estudio empírico controlado, crítico y sistemático de hipótesis que intentan explicar presuntas relaciones entre varios fenómenos. • Proceso objetivo, sistemático y controlado. • Etapas: 1) definición del problema; 2) formulación de hipótesis; 3) recogida y análisis de datos; 4) confirmación o rechazo de hipótesis; 5) resultados; 6) conclusiones; 7) generación de nuevas preguntas de investigación a partir de los resultados y conclusiones obtenidas.
19
Manual del Investigador Novel
BIBLIOGRAFÍA Argimon JM, Jiménez J. Métodos de investigación clínica y epidemiológica. 1ª ed. Madrid, Harcourt, 1999. Gordis L. Epidemiology. Philadelphia, Elsevier, 4ª ed. 2009. Szklo M, Nieto Nafria JM. Epidemiologia Intermedia: Conceptos y aplicaciones. 1ª ed. Madrid, Díaz Santos, 2003.
20
1.1. Introducción a la investigación. El Método científico
TABLAS Y FIGURAS Tabla 1.1.1. Componentes y estructura de la pregunta PICO
P
I
C
O
Paciente
Intervención
Comparación de la intervención
Resultado
Usuaria, ciudadana, o problema de interés –grupo de edad, estadio de la patología
Prueba, tratamiento, agente etiológico o causa, factor pronóstico
Si es adecuado es la alternativa a la intervención
Lo que se espera que produzca que sea clínicamente relevante
Tabla 1.1.2. Características de los métodos inductivo y deductivo Método inductivo
Método deductivo
Definición
Es una forma de razonar partiendo de una serie de observaciones particulares que permiten la producción de leyes y conclusiones generales.
Es una forma razonar y explicar la realidad que parte de leyes o teorías generales para analizar casos particulares.
Características
• Se basa en la observación de hechos y fenómenos.
• Establece conclusiones a partir de generalizaciones.
• Generaliza a partir de sus observaciones.
• Es útil cuando no se pueden observar las causas de un fenómeno.
• Sus conclusiones son probables.
• Sus conclusiones son rigurosas y válidas.
• Tiene el objetivo de generar nuevo conocimiento.
Dirección del razonamiento
De lo particular a lo general.
• No genera por sí mismo nuevo conocimiento, ya que parte de verificar conocimiento previo. De lo general a lo particular.
21
Manual del Investigador Novel
Figura 1.1.1.
4
OBSERVACIÓN
DEFINIR PREGUNTA
4
4
CONCLUSIONES
MÉTODO CIENTÍFICO
4 4
EXPERIMENTACIÓN
22
FORMULAR HIPÓTESIS
1.2. Ética e Investigación
1.2. ÉTICA E INVESTIGACIÓN Dr. Luis Puente Maestu
INTRODUCCIÓN Las principales fuentes de orientación ética para la realización de investigaciones clínicas son tres: la Declaración de Helsinki,1 el Informe Belmont, cuyo título oficial es «Principios éticos y pautas para la protección de los seres humanos en la investigación»,2 y las normas del Consejo para las Organizaciones Internacionales de Ciencias Médicas (CIOMS).3 Estos documentos se desarrollaron en respuesta a acontecimientos específicos, como los experimentos con humanos en la Alemania nazi, los estudios de la historia natural de la sífilis de Tuskegee,4 (Figura 1.2.1) y de la hepatitis de Willowbrook,5 así como para abordar la aplicación de la declaración de Helsinki en los países en vías de desarrollo, en particular para ensayos a gran escala de vacunas y medicamentos, especialmente para el SIDA. Los cuatro principios éticos contenidos en el informe Belmont proporcionan un buen marco filosófico para aplicar la ética a la investigación. Estos principios son: beneficencia, no maleficencia, justicia y respeto a la autonomía de las personas. A estos cuatro principios podemos añadir la evaluación independiente y las normas de buena práctica clínica (Tabla 1.2.1). Beneficencia: Este principio requiere que haya un beneficio para el paciente. Sin embargo, en investigación esto no es invariablemente posible. Primero porque si no existiesen dudas no sería necesario investigar. Y segundo, porque el participante en el grupo control puede recibir un placebo (que supone dejar sin tratamiento la enfermedad que se investiga o que deba ser administrado por vías dolorosas o peligrosas), pero incluso si se usa un comparador activo hay que hacerle las mismas pruebas –a veces invasivas y no requeridas en la práctica clínica habitual– que al grupo de tratamiento. Por otro lado, casi nunca hay beneficio individual en los estudios observacionales (que a veces requieren mediciones muy invasivas). Desde el punto de vista ético, las compensaciones económicas a los participantes y en nuestro medio, donde se reconoce el derecho a la salud, la asistencia sanitaria prestada a los sujetos de investigaciones no pueden considerarse un beneficio. Por tanto, en la práctica el principio de beneficencia se califica por el valor y la validez científica de la investigación (Tablas 1.2.1 y 1.2.2).
VALOR DE UNA INVESTIGACIÓN CLÍNICA Representa un juicio sobre la importancia social, científica o clínica de la investigación. La investigación en humanos debe conducir a mejorar la salud o el bienestar de la población, a realizar un estudio prelimi23
Manual del Investigador Novel
nar para desarrollar una intervención o a probar una hipótesis que pueda generar información importante acerca de la estructura o la función de los sistemas biológicos humanos, aunque tal información no tenga ramificaciones prácticas inmediatas. Si se investiga una nueva prueba, ésta debe aportar ventajas (ser más precisa, más barata o asequible, aportar más información). Algunos ejemplos de investigación clínica sin valor científico ni social incluyen la investigación clínica que duplica o repite sustancial o totalmente resultados comprobados –no confirma un estudio en un área polémica, pero confirma resultados bien aceptados– resultados no generalizables, una hipótesis banal o validaciones de pruebas diagnósticas que, aunque válidas, no pueden jamás llevarse a cabo en forma práctica. Hay que tener en cuenta que muchos individuos con enfermedades graves o mortales para las que no hay tratamientos eficaces están ansiosos, comprensiblemente, por tener acceso a nuevos tratamientos y están dispuestos a cambiar certeza sobre el beneficio por presteza en el acceso. La mayoría de las agencias reguladoras disponen de procedimientos especiales para medicamentos excepcionales definidos como tales por uno de estos dos supuestos: enfermedades graves o mortales, o existencia de evidencia preliminar sugestiva de un avance sustancial sobre los tratamientos disponibles. Otras veces, la solución es el ensayo clínico individual en el contexto del uso compasivo.
VALIDEZ CIENTÍFICA Una investigación que podría ser fundamental puede estar mal diseñada o producir resultados científicamente poco fiables, sesgados o inválidos debido a una metodología deficiente, una pobre estandarización de las mediciones o la inexperiencia o el desconocimiento del protocolo por parte de los investigadores. Si la investigación no tiene validez científica, nunca beneficiará a nadie y se perderán, como mínimo, los recursos materiales y económicos empleados en ella. Por tanto, es un requisito, no solo práctico sino también ético, que los objetivos estén bien definidos y sean factibles, lo que implica que el diseño del estudio, el tamaño de la muestra, la precisión y calidad de las mediciones y la composición y capacidad del equipo de investigadores para llevar a cabo el estudio sean adecuados. No maleficencia: se corresponde con el principio hipocrático de primun non nocere y se suele interpretar como que la investigación no tenga efectos indeseables (Tabla 1.2.1). La investigación en sujetos humanos puede implicar considerables riesgos, a veces inciertos, en particular en las primeras etapas. Respecto a este principio, existen opiniones kantianas según las cuales no es ético que los riesgos sean sobrellevados por los individuos participantes y el beneficio lo reciban terceros (la sociedad en su conjunto). Sin embargo este principio también puede interpretarse a la luz de la disposición al altruismo de muchos individuos y de códigos éticos que valoran la abnegación voluntaria en pos del bien de otros como algo positivo. De hecho, el avance de la ciencia y de la sanidad se fundamenta en muchos de estos gestos altruistas. En este caso, el principio de “no maleficencia” se aplica asegurándose de que la relación riesgo-beneficio sea favorable, de la minimización de riesgos y de la compensación de los perjuicios (Tabla 1.2.2). Balance riesgo-beneficio: una investigación sólo se considera ética cuando los beneficios potenciales son proporcionales o exceden a los riesgos asumidos, teniendo en cuenta que los riesgos potenciales los asumen sujetos individuales mientras que los beneficios potenciales son para la sociedad. La evaluación de la “proporcionalidad” y de la “extralimitación” carecen de una fórmula matemática, pero eso no significa que tales juicios sean casuales o volubles, al contrario, pues aunque tengan un componente subjetivo deben, por un lado, integrar los conocimientos sobre la probabilidad, naturaleza y consecuencias a largo plazo de los efectos secundarios y complicaciones tanto del producto en estudio como del comparador y de las mediciones necesarias que no constituyan práctica habitual, y por el otro, evaluar la gravedad de la enfermedad y de la existencia de alternativas al tratamiento o de métodos más seguros para medir las variables del estudio. 24
1.2. Ética e Investigación
Minimización de riesgos: consiste en tomar todas las precauciones de seguridad posibles y razonables. Esto obliga a valorar la necesidad de las mediciones con riesgo, asegurarse que los investigadores tengan experiencia en los procedimientos y técnicas requeridas y dispongan de los medios y la preparación adecuados para resolver los acontecimientos adversos y las complicaciones. También obliga a excluir a las mujeres embarazadas de los estudios no directamente orientados a los problemas médicos relacionados con el embarazo o el feto. Además, es una obligación ética interrumpir el estudio si se detectase que la frecuencia o la gravedad de acontecimientos adversos son inaceptables. Otra medida para minimizar los riesgos en estudios intervencionistas son los análisis intermedios, que servirán para detectar diferencias significativas de riesgo o beneficio entre las distintas ramas del ensayo que aconsejasen interrumpir el estudio antes de llegar al tamaño muestral predeterminado por el equipo de investigación (por ejemplo, si en el análisis intermedio de un tratamiento se demuestra que la mortalidad de los que lo reciben es menor que la de los integrantes del grupo de comparación y que este último presenta menos efectos adversos, en la mayoría de las circunstancias no sería ético continuar la investigación hasta completar el tamaño muestral predeterminado). Compensación de perjuicios: Obliga a prestar atención sanitaria para resolver o paliar las posibles complicaciones de la investigación y a disponer de un seguro que preste dicha atención y compense al sujeto de los perjuicios económicos de las secuelas. Justicia o equidad requiere que las cargas y los beneficios de la investigación se distribuyan equitativamente (Tabla 1.2.1). Este es otro principio interpretable desde distintos puntos de vista, pues en sociedades complejas hay intereses públicos y privados, diferencias sociales que derivan del esfuerzo individual o colectivo de grupos sociales y otras que derivan del infortunio, pero que afectan a la posibilidad de ser reclutado o de tener acceso al tratamiento una vez demostrada su eficacia. Si se seleccionan grupos específicos de sujetos, hay que asegurarse de que no lo sean por razones relacionadas con la pregunta científica de la investigación. Este principio se suele aplicar verificando la equidad del riesgo y la equidad del beneficio (Tabla 1.2.2). Equidad del riesgo: Hay que asegurarse que no se seleccionen sujetos porque sean “convenientes”, como las “carteras” de pacientes que participan en todos los ensayos o personas cuya capacidad de protegerse a sí mismos sea reducida, aun cuando se tenga acceso a otras personas o sea lo mismo para satisfacer los requisitos científicos de la investigación reclutar entre grupos menos vulnerables. Un ejemplo de estos casos sería desplazar estudios a países donde la carencia de asistencia sanitaria empuja a los sujetos a participar o donde la ausencia de legislación o medios efectivos para aplicarla facilita la inclusión de sujetos. Sería otro caso reclutar, por decisión de otros, a sujetos legalmente o temporalmente incapaces cuando podría reclutarse a sujetos con plenas facultades. Equidad del beneficio: implica que se ofrezca a todos los grupos la oportunidad de participar en la investigación, salvo que existan buenas razones científicas o legales que restrinjan su elegibilidad. Es el caso de investigaciones con potencial de beneficios sustanciales para los sujetos y en las que sólo participan grupos favorecidos por razones económicas, étnicas, de sexo o amistad. Esta inequidad ha dado lugar a conflictos con grupos de presión de pacientes con enfermedades como el cáncer de mama y el SIDA que exigieran –y en algunos casos consiguieran– que se legislase para ser incluidos obligatoriamente en los estudios si cumplían los criterios de inclusión y lo pedían. Sin embargo, no es injusto restringir la participación en un protocolo de investigación clínica a algunos grupos si la investigación los expusiera a riesgos significativamente mayores o a beneficios significativamente menores, aunque estuviesen dispuestos a participar. Otro forma de inequidad en el beneficio (y en el riesgo) ocurre cuando se reclutan sujetos que no tienen posibilidades de beneficiarse si la investigación proporciona un resultado positivo (por ejemplo, desarrollo de productos sanitarios mayoritariamente en países o grupos sociales o étnicos que por sus condiciones nunca o excepcionalmente tendrán acceso a ellos).
25
Manual del Investigador Novel
La equidad de beneficio también requiere que la compensación a los investigadores sea justa y que en las investigaciones no se utilicen recursos públicos o privados sin el conocimiento y aprobación de las personas responsables de gestionarlos (por ejemplo, hacer pruebas no incluidas en la práctica habitual sin autorización, implicar el uso de recursos humanos para la realización de pruebas extraordinarias o inducir a la prescripción de fármacos financiados por los pacientes o por sistemas de salud públicos o privados). Otro aspecto a considerar es si representa una justa compensación de la compañía que ha desarrollado el producto y sus obligaciones a la hora de facilitar estudios que comparen su producto con otro disponible o nuevo, o de indagar los beneficios y riesgos para pacientes que pertenecen a grupos minoritarios o no, pero sin interés comercial. Finalmente, el principio de equidad exige que las investigaciones en las que hayan participado sujetos –que, no lo olvidemos, han aceptado riesgos altruistamente– se publiquen, o, por lo menos, que sus resultados se hagan públicos (produzcan un beneficio social). Autonomía: Este principio se centra en el derecho a hacer elecciones voluntarias y con independencia y se asocia con el respeto a la intimidad y la libre elección y aceptación de la responsabilidad de las elecciones propias (Tabla 1.2.1). Este principio es un complemento necesario de los principios de beneficencia y no maleficencia, ya que garantiza que la voluntad de participar en investigaciones con posibles riesgos y pocos o ningún beneficio individual sea consciente y asumida (generosa) de acuerdo con la ética de la persona que esté dispuesta a someterse a una investigación. Este principio se traduce en que el sujeto otorgue su consentimiento informado para participar en cualquier investigación y en el respeto tanto hacia los participantes como hacia los que declinan participar (Tabla 1.2.2).
CONSENTIMIENTO INFORMADO Su finalidad es garantizar que los individuos participan en la investigación clínica de manera consciente y sólo cuando ésta sea compatible con sus valores, intereses y preferencias. Los requisitos específicos del consentimiento informado incluyen la provisión de información sobre la finalidad, los riesgos, los beneficios y las alternativas si no se participa en la investigación, la comprensión por parte del sujeto de esta información y de su propia situación clínica, y la toma de una decisión libre, no forzada, sobre si participar o no (Tabla 1.2.3). Existen algunas excepciones a la necesidad de consentimiento informado, como son la incapacidad legal o las situaciones de urgencia. En estos casos, y cuando las condiciones del sujeto lo permitan (y en el caso de menores cuando tenga doce o más años), deberá dar además su consentimiento para participar en el ensayo, después de haberle proporcionado toda la información pertinente adaptada a su nivel de entendimiento. En el caso excepcional en que por la urgencia de la aplicación del tratamiento no fuera posible disponer del consentimiento del sujeto o de su representante legal en el momento de su inclusión en el ensayo clínico, el sujeto o su representante legal será informado en cuanto sea posible y otorgará su consentimiento para continuar en el ensayo si procediera. Esta interpretación del principio de autonomía se basa en la consideración de que éticamente es aceptable aplicar un tratamiento a un sujeto por decisión de los profesionales sanitarios si el sujeto no puede decidir por sí mismo y está en juego su salud o su vida. En las investigaciones en que se den estos dos últimos supuestos, debe hacerse constar la descripción de la situación en el protocolo del ensayo clínico y debe haber sido aprobado por el correspondiente Comité Ético de Investigación Clínica (CEIC). Además, únicamente procederá cuando tenga un específico interés terapéutico particular para el paciente (y, por supuesto, cuando se cumplan los principios de beneficencia y no maleficencia). Otra excepción al consentimiento es el caso de estudios retrospectivos de grandes grupos de sujetos que no podrían llevarse a cabo si hubiera que pedirles su consentimiento para usar su información. En los casos de este tipo, aunque no se violase ningún principio ético, podría violarse la legislación vigente si los datos no se mencio-
26
1.2. Ética e Investigación
naran de manera anónima. Normalmente, la legislación suele exigir que el paciente firme un consentimiento escrito por cuestiones legales (existencia de prueba escrita) y para evitar omisiones, pero éticamente ni el consentimiento escrito imprescindible (puede ser verbal) ni la obtención de la firma sin haber informado adecuadamente al sujeto bien verbalmente o por escrito satisface los principios éticos. Respeto a los participantes y a los que declinan participar: Los requisitos éticos para la investigación clínica no concluyen cuando los individuos firman el formulario de consentimiento informado y se inscriben en la investigación. Los sujetos deben ser tratados con respeto tanto mientras participan en el estudio como después. El respeto incluye, en primer lugar, permitir que el sujeto cambie de opinión, decida que la investigación no concuerda con sus intereses o preferencias y se retire sin ninguna penalización. En segundo lugar, ya que se recopilará información sustancial sobre los sujetos inscritos, su privacidad debe ser respetada administrando la información de acuerdo con la confidencialidad, que en España está regulada principalmente por la Ley Orgánica 3/2018, de 5 de diciembre, de Protección de Datos Personales y garantía de los derechos digitales6 y por su reglamento (RD 1720/2007).7 En tercer lugar, durante el curso de la investigación clínica se pueden obtener datos nuevos, como la información acerca de los riesgos y beneficios de las intervenciones utilizadas. El respeto requiere que a los sujetos inscritos se les proporcione esta nueva información. Por ejemplo, cuando los documentos de consentimiento informado se modifican para incluir riesgos o beneficios adicionales descubiertos en el curso de la investigación, los sujetos inscritos también deben ser informados de estos nuevos datos. En cuarto lugar, en reconocimiento a la contribución de los sujetos a la investigación clínica, debe haber algún mecanismo para informarles de los resultados y de lo que se aprendió de la investigación clínica si así lo desean. En quinto lugar, el bienestar del sujeto debe vigilarse cuidadosamente a lo largo de su participación por si experimenta reacciones adversas o suceden eventos adversos severos, a fin de proporcionarle un tratamiento apropiado y, si es necesario, retirarlo de la investigación. Esta responsabilidad ética puede prolongarse después del estudio si los acontecimientos adversos se relacionan con la investigación y dejan secuelas duraderas.
EVALUACIÓN INDEPENDIENTE Aún los investigadores mejor intencionados tienen múltiples intereses legítimos: realizar una buena investigación, completar la investigación rápidamente, proteger a los sujetos de la investigación, obtener financiación, avanzar en sus carreras profesionales, ganar dinero con su trabajo, etc. (Tablas 1.2.1 y 1.2.4). Estos intereses pueden distorsionar involuntariamente sus juicios en lo referente al diseño y realización de la investigación, al análisis de los datos, así como su adherencia a los requisitos éticos. Una manera común de reducir al mínimo el impacto potencial de ese tipo de prejuicios es la evaluación independiente haciendo que la investigación clínica sea revisada por peritos apropiados que no tengan conflicto de interés con el estudio, por legos que representen a los ciudadanos no involucrados en investigación y por juristas que interpreten su adecuación a la legalidad vigente, que tengan autoridad para aprobar, enmendar o, en casos extremos, cancelar la investigación. Una segunda razón para la evaluación independiente es la responsabilidad social. La investigación clínica impone riesgos a los sujetos en beneficio de la sociedad. La evaluación independiente del cumplimiento de los requisitos éticos de un estudio o investigación intenta garantizar a la sociedad que las personas inscritas en los ensayos serán tratadas éticamente y no sólo como meros medios, de forma que todos los miembros de la sociedad pueden confiar que no se van a beneficiar de investigaciones que violen los derechos humanos, y aquellos que participan en una investigación clínica, que serán tratados éticamente. En España, la evaluación independiente de la ética de los proyectos de investigación se hace a través de los comités de ética en la investigación clínica (CEIC).7-8
27
Manual del Investigador Novel
BUENA PRÁCTICA CLÍNICA Las normas de buena práctica clínica son un conjunto de procedimientos que deben seguirse en los estudios con seres humanos (Tabla 1.2.1) para intentar asegurar que se hayan efectuado siguiendo un protocolo científicamente adecuado, respetando los derechos éticos y legales de los participantes y garantizando la veracidad de los datos y resultados obtenidos (Tabla 1.2.2). Dichas normas están reguladas por lo establecido en las normas de buena práctica para ensayos clínicos con medicamentos de la Comunidad Europea,9 que a su vez está armonizadas con las de los EE.UU. y Japón.9 Científicamente adecuado: Precisar qué se entiende por “científico” es extraordinariamente complejo, por lo que las normas se limitan a exigir que los objetivos estén claramente definidos, el diseño permita una comparación válida con un grupo de control, la selección de pacientes asegure que los sujetos padecen el proceso que se pretende estudiar, el método de asignación a las diferentes modalidades de tratamiento asegure que los grupos sean comparables, se hayan tomado las medidas necesarias para reducir al máximo los sesgos, se disponga de métodos adecuados y bien definidos para registrar la respuesta de los pacientes y los resultados del ensayo se analicen adecuadamente. Protección de los derechos de los pacientes: Cuando se trata de productos o sustancias cuya seguridad y eficacia todavía no haya sido demostrada (como ocurre con los productos en fase de investigación clínica), la protección de los pacientes que serán tratados con ellos exige una atención todavía más cuidadosa. Las normas de buenas prácticas clínicas obligan a que en el manual de la investigación se incluya, por un lado, una información detallada y actualizada sobre el producto a investigar, sus riesgos y los beneficios esperables, y por el otro, justificantes de que los investigadores tienen la cualificación adecuada, disponen de recursos apropiados, pueden proporcionar asistencia clínica a los sujetos del ensayo, están en correspondencia con el CEIC, conocen y cumplen el protocolo, han seguido los procedimientos de aleatorización y de enmascaramiento, han obtenido de forma correcta el consentimiento informado de todos los participantes del estudio,7-8 han registrado todas las visitas en la historia clínica así como todas las variables relevantes, han registrado y comunicado correctamente los acontecimientos adversos7-8 y conocen las actualizaciones de seguridad producidas después de empezar el estudio. Si el estudio ya hubiese finalizado o se hubiese suspendido anticipadamente, deberá incluirse un informe final de los investigadores. Las normas de buena práctica clínica también obligan a los monitores y promotores. Sin embargo, está fuera del alcance de esta obra describirlas en detalle. Los interesados podrán encontrarlas en otra literatura.8 Protección contra el fraude en la investigación biosanitaria: El delito más específico de la investigación es el fraude. Todos los que participan en un ensayo clínico (promotor, monitor, investigador y el propio paciente) pueden cometer este delito. Existe una amplia bibliografía de los fraudes que los investigadores pueden cometer.10 Debe mencionarse que, en estos casos, las sanciones pueden ser muy importantes, e incluso pueden llegar a la suspensión profesional. En el caso del paciente, el fraude tiene características especiales, y aunque puede engañar voluntariamente al proporcionar la información que se le requiere, el fallo más frecuente es el de la inobservancia de la prescripción, que, aunque no constituye un delito, puede influir decisivamente en los resultados de un ensayo clínico. El investigador está obligado a registrar con toda exactitud la prescripción que efectúa a cada paciente, incluido en el marco de un ensayo clínico, y además debe efectuar un recuento de las unidades que éste debe devolverle una vez terminado el período de tratamiento. Aunque la finalidad de estos registros estriba, lógicamente, en comprobar el grado de cumplimiento de la prescripción, por desgracia parece ser que en la práctica este método exagera ampliamente el grado de cumplimiento.11 Aun así, sigue exigiéndose porque se trata del procedimiento más simple de los disponibles para
28
1.2. Ética e Investigación
dicha finalidad, en todo caso mucho más simple que añadir marcadores biológicos a las muestras, efectuar determinaciones de niveles plasmáticos o utilizar dispensadores que registren electrónicamente cada apertura de frasco u otro contenedor de la medicación que efectúe el paciente. Además, el investigador debe devolver al promotor todas las muestras que no hayan sido utilizadas, una medida que tiene por objeto asegurar que los productos en fase de desarrollo clínico sean administrados exclusivamente a pacientes incluidos en ensayos clínicos. El promotor debe llevar una contabilidad minuciosa de la distribución de las muestras del producto en ensayo clínico. Para ello, debe disponer de un documento, firmado por el farmacéutico del hospital o el investigador principal, en el que se reconozca la recepción de las mismas. Esta obligación está condicionada históricamente: en 1960, al producirse la tragedia de la talidomida, la Administración de Alimentos y Medicamentos de los Estados Unidos sólo tenía constancia de que unos 50 investigadores estaban utilizando este fármaco. Posteriormente se comprobó que en realidad lo habían recibido 1.248 médicos y que se había administrado a más de 20.000 pacientes. Aunque en dicho país sólo se produjeron 17 casos de focomelia (en Alemania se registraron más de 4.000), el hecho determinó el desarrollo de una estricta normativa en materia de ensayos clínicos que empieza con la solicitud a las agencias reguladoras de autorización para investigar con un nuevo medicamento o producto sanitario.12
PUNTOS CLAVE • La ética de un estudio de investigación depende del respeto de una serie de principios universales, como son el de beneficencia, no maleficencia, justicia/equidad y autonomía, que todo investigador debe conocer, interiorizar y acatar. • Para garantizar estos principios, es necesario también que comités que incluyan a personas expertas, legos y juristas revisen la investigación y la aprueben y que los implicados en la investigación conozcan el conjunto de procedimientos que tratan de asegurar que estos principios se siguen y que quede registro para su posible verificación por parte de las personas autorizadas. • Estas reglas se conocen como normas de buena práctica clínica y son requisitos legales en la mayoría de países.
29
Manual del Investigador Novel
BIBLIOGRAFÍA 1. Declaración de Helsinki de la Asociación Médica Mundial (AMM) - Principios éticos para las investigaciones médicas en seres humanos. Disponible en: http://www.wma net/es/30publications/10policies/ b3/. 2. “Principios éticos y pautas para la protección de los seres humanos en la investigación” (Informe Belmont). Disponible en: http://www bioeticayderecho ub edu/archivos/norm/InformeBelmont.pdf. 3. Council for International Organizations of Medical Sciences. Pautas Éticas Disponible en: http://www recerca uab es/ceeah/docs/Resum%20CIOMS pdf. 4. Katz RV, Kegeles SS, Kressin NR, Green BL, Wang MQ, James SA, Russell SL, Claudio C. The Tuskegee Legacy Project: willingness of minorities to participate in biomedical research. J Health Care Poor Underserved. 2006;17:698-715. 5. Krugman S. The Willowbrook hepatitis studies revisited: ethical aspects. Rev Infect Dis. 1986;8:157-162. 6. Gobierno de España. Ley Orgánica 3/2018, de 5 de diciembre, de Protección de Datos de Carácter Personal y garantía de los derechos digitales: 2018. 7. Gobierno de España. Ley 14/2007, de 3 de julio, de Investigación biomédica. 8. Gobierno de España. Real Decreto 223/2004, de 6 de febrero, por el que se regulan los ensayos clínicos con medicamentos. 9. Normas de Buena Práctica Clínica: Guía Tripartita armonizada de la ICH. Disponible en: http://www aemps gob es/industria/inspeccionBPC/docs/guia-BPC_octubre-2008 pdf. 10. Shapiro MF, Charrow RP. Scientific misconduct in investigational drug trials. N Engl J Med. 1985;312(11):731-736. 11. Pullar T, Kumar S, Tindall H, Feely M. Time to stop counting the tablets? Clin Pharmacol Ther. 1989;46(2):163-168. 12. Kashyap UN, Gupta V, Raghunandan HV.Comparison of Drug Approval Process in United States & Europe. J. Pharm. Sci.& Res. 2013;5(6):131-136.
30
1.2. Ética e Investigación
TABLAS Y FIGURAS Tabla 1.2.1. Principios éticos de la investigación en humanos Beneficencia No maleficencia Justicia o equidad
Este principio requiere que haya un beneficio para el paciente. La investigación no debe tener efectos indeseables. Las cargas y los beneficios de la investigación se deben distribuir equitativamente.
Autonomía
Derecho a hacer elecciones voluntarias y con independencia y se asocia con el respeto a la intimidad, la libre elección y la aceptación de la responsabilidad de las elecciones propias.
Evaluación independiente
La investigación clínica debe ser revisada por Comités de Ética en la Investigación Clínica (CEIC) que deben estar integrados por peritos apropiados sin conflicto de intereses respecto al estudio, legos que representen a los ciudadanos no involucrados en investigación y juristas que interpreten su adecuación a la legalidad vigente.
Buena práctica clínica
Las normas de buena práctica clínica son un conjunto de procedimientos, de obligado cumplimiento por imperativo legal, que deben seguirse en los estudios con seres humanos para intentar garantizar que se hayan efectuado siguiendo un protocolo científicamente adecuado, respetando los derechos éticos y legales de los participantes y garantizando la veracidad de los datos y resultados obtenidos.
31
Manual del Investigador Novel
Tabla 1.2.2. Evaluación de los principios éticos Valor de una investigación clínica. Representa un juicio sobre la importancia social, científica o clínica de la investigación. Beneficencia
Validez científica. Para ser válida, una investigación debe estar bien diseñada y seguir una metodología adecuada para producir resultados científicamente fiables, válidos y sin sesgos. Balance riesgo-beneficio. Los beneficios potenciales deben ser proporcionales o exceder los riesgos, teniendo en cuenta que los riesgos potenciales los asumen sujetos individuales mientras que los beneficios potenciales son para la sociedad.
No maleficencia
Minimización de riesgos. Consiste en tomar todas las precauciones razonablemente posibles de seguridad. Compensación de perjuicios. Obliga a prestar atención médica para resolver o paliar las posibles complicaciones de la investigación. Muchas veces requiere un seguro que se haga cargo de dicha asistencia y compense los perjuicios económicos. Equidad del riesgo. Hay que asegurarse de que no se seleccionen sujetos porque sean “convenientes”, sino porque se adaptan a la población objeto de estudio. Evitar grupos vulnerables si la investigación no va dirigida a ellos. Equidad del beneficio. Implica:
Justicia o equidad
• Que se ofrezca a todos los grupos la oportunidad de participar en la investigación, salvo que existan buenas razones científicas o legales que restringiesen su elegibilidad. • Que la compensación a los investigadores y a las entidades que han desarrollado el producto sea justa. • Que toda investigación en la que se haya sometido a riesgo a personas individuales se haga pública, incluso cuando los resultados son negativos. • Que los propietarios de productos sanitarios o fármacos faciliten la comparación con otros productos disponibles o nuevos y en todos los grupos en los que se va a usar el medicamento o producto.
Autonomía
Consentimiento informado. Su finalidad es asegurar que los individuos participen en la investigación clínica de manera consciente y sólo cuando ésta sea compatible con sus valores, intereses y preferencias. Respeto a los participantes y a los que declinan participar. Los sujetos deben ser tratados con respeto tanto mientras participan en el estudio como después.
32
1.2. Ética e Investigación
Tabla 1.2.3. Contenido de la hoja de información para el posible participante en una investigación ASPECTO
DESARROLLO SUGERIDO DE ACUERDO CON LA LEGISLACIÓN VIGENTE
Versión de la hoja de información
Identificación inequívoca de la versión.
Título del estudio
Debe coincidir con el del protocolo.
Identificación promotor e investigador
Nombres completos tanto del investigador como del promotor/es.
Propósito del estudio
Relatar, en lenguaje no técnico y de manera simple, los objetivos genéricos del estudio, su importancia y la razón por la que se necesita la participación de la persona.
Carácter voluntario de la participación
Debe constar específicamente que la participación es voluntaria, así como la posibilidad de retirarse del estudio en cualquier momento, sin que por ello se altere la relación clínico-enfermo ni se produzca perjuicio en su tratamiento.
Cómo se llevará a cabo la investigación
Debe explicarse de un modo sencillo los aspectos principales de la metodología (asignación al azar, probabilidad de ser asignado a uno otro brazo, cuántos participantes se piensa reclutar, por qué se ofrece participar al sujeto, en qué consiste la intervención.
Por qué se ofrece participar a la persona en concreto
Por qué se ofrece participar al sujeto (porque cumple las características requeridas para la investigación), por eje., es EPOC, asmático, reagudizador, mujer, mayor, etc.
En qué consiste la participación, incluyendo referencia al placebo, si procede
Explicar los procedimientos que se aplicarán al participante en la investigación: características de los medicamentos asignados a cada uno de los grupos (con referencia al placebo, si procede), realización de exploraciones complementarias, visitas, utilización de muestras o resultados de pruebas ya realizadas, consulta de datos personales, entrevistas, etc. Detallar en qué número, con qué periodicidad, si es posible que las visitas caigan en fechas conflictivas o si tendrá que hacerse los procedimientos.
Riesgos
Relatar los posibles riesgos físicos o de otro tipo, molestias o inconvenientes a los que el sujeto de investigación está expuesto por participar en el estudio. Explicar brevemente la experiencia previa que existe con el fármaco o producto.
Beneficios de la participación
Si no hay beneficio para el participante, dejarlo claro.
Qué ocurre durante el embarazo y la lactancia
Detallar si las mujeres embarazadas y durante el período de lactancia pueden participar en el ensayo y que se debe hacer para evitar el embarazo.
Qué alternativas hay al tratamiento del estudio
Describir tratamientos aceptados para la enfermedad, factor de riesgo o problema de salud a estudio diferentes del que se pretende estudiar en esta investigación.
33
Manual del Investigador Novel
Tabla 1.2.3. Contenido de la hoja de información para el posible participante en una investigación (Continuación) ASPECTO
DESARROLLO SUGERIDO DE ACUERDO CON LA LEGISLACIÓN VIGENTE
Cómo se recibirá la información obtenida del estudio
Explicar al paciente que, si lo desea, se le facilitará un resumen de los resultados. También podrá recibir los resultados de las pruebas que se le practiquen si así lo solicita. Estos resultados pueden no tener aplicación clínica ni una interpretación clara, por lo que, si quiere disponer de ellos, deberían ser comentados con el profesional sanitario del estudio.
Publicación de los resultados del estudio
Los resultados de este estudio serán publicados en publicaciones científicas para su difusión, pero no se transmitirá ningún dato que pueda llevar a la identificación de los participantes.
Cómo se protegerá la confidencialidad de los datos
Hay que hacer una mención específica de los grupos de personas que tendrán acceso a los datos y a la Ley Orgánica 15/1999, de 13 de diciembre, de protección de datos de carácter personal y a su reglamento (RD 1720/2007). Derechos ARCO: En todo momento el participante podrá acceder a sus datos, corregirlos o cancelarlos.
Qué ocurrirá con las muestras obtenidas
Explicar en qué forma serán guardados las muestras del paciente y los datos asociados, (anónimos, codificados, identificados o identificables); el nombre del responsable de la custodia de las muestras; cómo se almacenarán; qué se hará con ellas al terminar estudio; si las muestras se van a conservar, hay que decir que sólo será para estudios relacionados con el presente y especificar el responsable, lugar y forma en que quedarán identificados y, si se prevé que las podrán usar otros grupos, hay que identificarlos. En caso de estudios genéticos, la Ley 14/2007 de investigación biomédica sólo permite conservarlas más de 5 años de forma anónima, salvo que sea de interés asistencial para el paciente. Se deberá especificar que todos los estudios en que se vayan a usar las muestras almacenadas serán aprobados por un CEIC y cumplirán los requisitos legales y éticos de la investigación.
Intereses económicos del estudio
Si los investigadores o los centros donde se lleve a cabo la investigación serán remunerados o no. Si al paciente se le reintegrarán los gastos consecuencia de la participación en el estudio o no. Debe quedar claro que no se le remunerará por participar, sino que solo se le abonarán los gastos que le cause participar, como comidas o desplazamientos. Si es posible que se deriven productos comerciales o patentes, aclarar que el participante no recibirá beneficios económicos.
Qué ocurrirá si la participación provoca alguna consecuencia negativa
La posibilidad de daños derivados de la participación está cubierta por el promotor mediante la suscripción de un seguro de responsabilidad civil contratado con la compañía ..….…. con número de póliza…..…. En todo caso, se pondrán todos los medios necesarios para eliminar o minimizar los daños provocados por la participación. Cualquier información nueva sobre los medicamentos/productos/pruebas en investigación descubierta durante la realización del estudio que pueda influir en la decisión del paciente de seguir participando en el estudio le será comunicada a la mayor brevedad para que pueda decidir sobre su continuación o abandono.
Quién puede dar más información
Nombres del investigador responsable del ensayo y de informar al sujeto y contestar a sus dudas y preguntas, y modo de contactar con él en caso de urgencia. 34
1.2. Ética e Investigación
Tabla 1.2.4. Lista de comprobación de requisitos éticos A D
I
NA
1. JUSTIFICACIÓN DEL ENSAYO......................................................... [ ] [ ] [ ] (en función de la fase de desarrollo del fármaco, patología en estudio, etc.)
[]
2. DEFINICIÓN DEL OBJETIVO DEL ESTUDIO ...................................... [ ] [ ] (objetivos principal y secundarios, hipótesis "a priori", etc.)
[]
[]
3. CRITERIOS DE SELECCIÓN DE LOS PACIENTES ............................. [ ] [ ] (criterios de inclusión/exclusión)
[]
[]
4. DEFINICIÓN DEL TRATAMIENTO ....................................................... [ ] [ ] [ ] [ ] (control adecuado, tratamiento reproducible, tratamientos asociados, cumplimiento, etc.) 5. ALEATORIZACIÓN .................................................................................. [ ] [ ] (asignación aleatoria ciega, estratificación, descripción del método, etc.)
[]
[]
6. ENMASCARAMIENTO ............................................................................ [ ] [ ] (necesario, simple o doble ciego, doble enmascaramiento u otros, eficaz)
[]
[]
7. VARIABLE PRINCIPAL DE VALORACIÓN ......................................... [ ] [ ] (objetiva, clínicamente relevante)
[]
[]
8. CRITERIOS DE EVALUACIÓN DE LA RESPUESTA........................... [ ] [ ] [ ] (objetivos-subjetivos, sensibles, específicos, validados, e hito/fracaso, seguimiento)
[]
9. PÉRDIDAS ................................................................................................. [ ] [ ] (antes y después de la aleatorización, retiradas, abandonos, etc.)
[]
[]
10. DISEÑO ESTADÍSTICO ......................................................................... [ ] [ ] [ ] [ ] (predeterminación de la muestra, diferencia relevante, errores alfa y beta, % de pérdidas, test estadísticos, etc.) 11. ACONTECIMIENTOS ADVERSOS ....................................................... [ ] [ ] [ ] (hoja de recogida, algoritmo de causalidad, notificación a los CEIC y AA.SS.)
[]
12. CUMPLIMIENTO DE LAS NORMAS DE BUENA PRÁCTICA CLÍNICA [ ] [ ]
[]
13. ADECUACIÓN DEL PLACEBO ........................................................... [ ] [ ]
[]
[]
14. SELECCIÓN EQUITATIVA DE LA MUESTRA ................................... [ ] [ ]
[]
[]
15. COMPENSACIÓN POR DAÑOS / SEGURO DE RIESGOS ................. [ ] [ ]
[]
[]
16. MINIMIZACIÓN DE RIESGOS ............................................................. [ ] [ ] [ ] (relación riesgo/beneficio, riesgo no superior o mayor que el mínimo, etc.)
[]
[]
17. HOJA DE INFORMACIÓN PARA LOS SUJETOS ............................... [ ] [ ] [ ] [ ] (contenido según R.D.: objetivo, método, beneficios y riesgos, alternativas, voluntariedad, etc.; fácil comprensión) 18. OBTENCIÓN DEL CONSENTIMIENTO INFORMADO ..................... [ ] [ ] (oral, escrito, por sustitución -notificación al M. Fiscal, si procede-)
[]
[]
19. EVALUACIÓN ECONÓMICA ............................................................... [ ] [ ] [ ] [ ] (tipo de análisis: coste-beneficio, coste-utilidad, etc., costes directos y/o indirectos, etc.) 20. COMPETENCIA DEL EQUIPO INVESTIGADOR ............................... [ ] [ ] [ ] [ ] (experiencia en investigación, otros estudios en marcha, obligaciones asistenciales, etc.) 35
Manual del Investigador Novel
Figura 1.2.1.
36
1.3. Revisión bibliográfica
1.3. REVISIÓN BIBLIOGRÁFICA Dr. Felip Burgos Rincón
INTRODUCCIÓN La información es una herramienta fundamental para los profesionales de todos los ámbitos, y en particular para los del campo de las ciencias de la salud. Estar al día y conocer los avances de las distintas disciplinas es necesario no solamente para la investigación, sino también para el ejercicio de la profesión. Por ello, conocer las principales fuentes de información y cómo realizar búsquedas bibliográficas se ha convertido en una parte importante de la formación del colectivo sanitario. En la actualidad, las búsquedas bibliográficas son más fáciles de realizar, ya que pueden realizarse desde casa, por ejemplo, y su resultado es más completo gracias a la introducción de las citas bibliográficas en bases de datos. Los motores de búsqueda de los ordenadores exploran rápidamente las bases de datos a partir de los parámetros que el usuario le indica. Algunas bases de datos se encuentran disponibles en forma gratuita y otras a través del pago de una cuota anual. De todas las bases de datos de referencias bibliográficas del campo biosanitario, Medline es la más completa y compleja y está disponible en forma gratuita a través de Internet. No hay que considerar completa una búsqueda bibliográfica realizada solamente en Medline, pues existen otras muchas bases de datos. El inconveniente es que muchas citas se encuentran en más de una de ellas, por lo que al realizar la búsqueda en varias de ellas se encuentran artículos repetidos. Actualmente se están publicando libros de texto en formato digital en internet, muchos de cuyos capítulos se encuentran ligados por hipervínculos a las citas de revistas de publicación periódica. Algunas asociaciones y sociedades sanitarias también publican consensos, guías clínicas y recomendaciones a los pacientes en formato digital. Para aprender sobre búsqueda bibliográfica, lo mejor es utilizar Medline, porque es de uso gratuito y una de las bases de datos más completas y complejas, pero sin olvidar las demás posibilidades que se citarán a continuación.
ETAPAS DE BÚSQUEDA BIBLIOGRÁFICA La búsqueda bibliográfica es un proceso cuyo objetivo es identificar y localizar bibliografía sobre un determinado tema. Este proceso se divide en varias etapas: • Determinar el objetivo de la búsqueda y la necesidad de información. • Identificar los conceptos sobre los que se desea obtener información y hacer una relación de los términos que los van a representar. Utilizar diccionarios terminológicos, sinónimos, abreviaturas y términos relacionados. 37
Manual del Investigador Novel
• Seleccionar la fuente de información a consultar. • Plantear la estrategia de búsqueda.
ELABORACIÓN DE LA ESTRATEGIA DE LA BÚSQUEDA BIBLIOGRÁFICA En la estrategia de búsqueda, es necesario efectuar operaciones lógicas que permitan combinar los distintos términos de la búsqueda. • Operador de intersección (Y / AND) (Figura 1.3.1) Recupera documentos que contienen dos o más términos simultáneamente. Es decir, si buscamos A AND B, pedimos únicamente los documentos que contienen el término A y el B. • Operador sumatorio o de suma lógica (O / OR) (Figura 1.3.2) Recupera documentos que contienen cualquiera de los términos de búsqueda. En A OR B se piden documentos que tienen el término A, el B o los dos. • Operador de exclusión (NOR / NOT) (Figura 1.3.3) Elimina los documentos que contengan el término que figura tras él. En A NOT B se piden documentos que tengan el término A pero no el B.
BASES DE DATOS • Generalistas (Figura 1.3.4) • Especializadas (Figura 1.3.5) Bases de datos En primer lugar, veremos las dos bases de datos principales para obtener información en el ámbito sanitario: Medline y Embase. A continuación, el portal Pubmed, con unas pautas básicas para realizar las búsquedas. Por último, la base de datos IME, la principal en cuanto a volumen de referencias en español. Medline es una base de datos desarrollada por la National Library of Medicine en el ámbito de las ciencias de la salud. Incluye referencias desde 1948, y su gran interés y uso se debe a su cobertura internacional, aunque está más centrada en el ámbito anglosajón (actualmente también cubre otras lenguas, aunque solo los resúmenes) y a su carácter gratuito a través del portal PubMed, disponible en: http://www.ncbi.nlm.nih. gov/pubmed. El MeSH (Medical Subject Heading) es el tesauro de Medline (lenguaje controlado). Se compone de los términos MeSH o descriptores que se asignan a cada artículo para conocer los temas de los que trata. A través de estos términos podemos localizar referencias de una manera más precisa. La traducción del MeSH, realizada por el BIREME, ha dado lugar al DeCS (descriptores en ciencias de la salud) disponible en: http://decs.bvs.br/E/homepagee.htm. Embase (disponible en: http://www.embase.com) es la otra gran base de datos de ciencias de la salud. Corresponde al repertorio Excerpta Medica y contiene referencias desde 1974. Destaca en la información sobre investigación farmacológica, farmacología y toxicología, farmacia y farmacoeconomía. El acceso a Embase es de pago y se gestiona a través de Elsevier.
38
1.3. Revisión bibliográfica
PubMed (disponible en: https://www.ncbi.nlm.nih.gov/pubmed) es el portal de Internet desarrollado por el Centro Nacional para la Información Biotecnológica de Estados Unidos. Creado en 1997, PubMed permite el acceso a Medline y a otras bases de datos desarrolladas por la Biblioteca Nacional de Medicina de Estados Unidos (Figura 1.3.6). La búsqueda en PubMed se puede realizar de distintas maneras, pero aquí vamos a ver cómo se puede hacer desde la opción de búsqueda avanzada, a modo de introducción en su uso. Para acceder a la búsqueda avanzada desde la página de inicio de PubMed, pinchamos en la opción Advanced, debajo de la caja principal de búsqueda (Figura 1.3.7). La pantalla de la búsqueda avanzada se divide en tres partes: primeramente, encontramos la caja de búsqueda, después, Builder, donde iremos elaborando la estrategia de búsqueda, y por último, History, donde aparecerá el historial de búsqueda. En Builder, como ya se ha indicado, se irá elaborando la estrategia de búsqueda, es decir, se introducirán los términos por los que queremos buscar, se indicarán los campos donde se buscarán los términos y se combinarán por medio de los operadores booleanos que seleccionemos. Antes de introducir los términos, hay que haber pensado la estrategia de búsqueda que se va a elaborar. Para conocer los términos MeSH del tesauro y, sobre todo, si no nos manejamos muy bien con el inglés, hay dos páginas donde consultando términos en español se indica si son términos MeSH y su forma en inglés disponible en HONselect (http://www.hon.ch/HONselect/index_sp.html) (Figura 1.3.8). Se debe seleccionar la palabra clave para que localice el término en inglés (Figura 1.3.9). En la pantalla de English encontramos las posibles traducciones, entre ellas COPD (Figura 1.3.10). Búsqueda en PUBMED. Una vez hemos seleccionados los términos y pensado cómo los vamos a combinar, los vamos incorporando en PubMed de la siguiente manera: En la caja de Builder introducimos el término, y en el menú desplegable de la izquierda seleccionamos el campo donde queremos que busque. Por ejemplo, si el término seleccionado es un término MeSH, podemos seleccionar directamente la opción MeSH Terms. Imaginemos que queremos conocer la bibliografía de los estudios de búsqueda de casos en EPOC con utilización de la espirometría que se han desarrollado en las oficinas de farmacia (Figura 1.3.11). El caso es que no nos discrimina suficientemente (2.803 artículos) (Figura 1.3.12). Sin embargo, puede ser un término que no esté en el MeSH, o que directamente queramos buscar por lenguaje libre, y entonces tendremos que buscar en campos de texto libre como Title / Abstract. Debemos poner un filtro en que aparezca la palabra Pharmacy en el resumen (encontramos 25 citas) (Figura 1.3.13) y añadiendo el filtro de los últimos 5 años (14 referencias) (Figura 1.3.14). Llegados a este punto, se puede guardar o enviar a nuestro correo electrónico o gestor bibliográfico, e incluso, si observamos los abstracts, podemos manejar de forma eficiente la información (Figura 1.3.15; Figura 1.3.16 y Figura 1.3.17). También se puede hacer uso de la búsqueda avanzada de PubMed para localizar a un autor concreto en un área concreta (Figura 1.3.18). Finalmente, otra opción muy interesante es darse de alta como usuario del MyNCBI (es muy fácil), lo que permite guardar el historial de búsquedas, así como la propia bibliografía y el sistema de alertas semanales o mensuales en My NCBI, que nos enviará información a nuestro correo electrónico cuando aparezca un manuscrito con las características que hayamos definido (Figura 1.3.19 y Figura 1.3.20). A modo de conclusión, algunas ideas y recomendaciones que nos pueden ayudar a hacer la búsqueda bibliográfica. En las primeras búsquedas bibliográficas, para elaborar la estrategia de búsqueda se recomienda hacer una tabla con los términos que vamos a utilizar. Esa tabla se dividirá en columnas, y en cada columna se pondrán los términos agrupados según los conceptos que van a representar. Los términos que están en la misma columna se combinarán con OR / O, porque van a actuar como sinónimos, cuasi sinónimos, o bien van a hacer referencia al mismo concepto. Y después, las distintas columnas se combinarán entre sí con 39
Manual del Investigador Novel
AND / Y. Se utiliza como ejemplo de búsqueda sobre acreditación de formación continuada (Tabla 1.3.1) resultando la siguiente ecuación de estrategia de búsqueda: “education, continuing” OR “education, medical, continuing” OR “education, nursing, continuing”) AND (“accreditation*”).
PUNTOS CLAVE • Es importante revisar la bibliografía citada por los artículos que hemos seleccionado porque se ajustan a nuestro tema. • Si tenemos localizado un artículo o artículos que se ajustan al perfil de nuestra búsqueda, revisar los descriptores o palabras claves (key words) que se le han asignado y utilizarlos en nuestra estrategia de búsqueda. • En la estrategia de búsqueda se recomienda combinar términos del lenguaje libre con lenguaje controlado (descriptores de los tesauros). • Intentar mantener un equilibrio entre precisión y exhaustividad. Sobre todo en las primeras búsquedas que hagamos sobre el tema, se recomienda que no sean demasiado precisas, ya que artículos que en principio no se ajustan completamente a nuestro tema pueden ayudarnos y llevarnos a otros que son de nuestro interés. • Antes de empezar a utilizar una base de datos, es importante leer la ayuda y conocer cómo funciona el sistema de búsqueda. • No perder de vista cómo se estructura una base de datos. Ésta se compone de registros, que representan un ítem, por ejemplo un artículo, y cada registro tiene varios campos, por ejemplo autor, título y materia. Nosotros vamos a buscar en esos campos, y esta estructura hay que tenerla en cuenta cuando identifiquemos los conceptos de la búsqueda y cuando elaboremos la estrategia de búsqueda. • Si hacemos una búsqueda en una base de datos y no obtenemos muy buenos resultados, se recomienda el uso de buscadores especializados en contenido científico. Por ejemplo, Google Academic (http://scholar. google.es) o Researchgate (http://www.researchgate.net). En ellos, si hacemos la búsqueda en inglés obtendremos más resultados, pero también se puede hacer directamente en español. • Para gestionar las referencias bibliográficas de los artículos que vamos seleccionando, es interesante utilizar los programas gestores de referencias bibliográficas, por ejemplo EndNote Web, Mendeley, gestor de referencias sociales. En relación con las referencias bibliográficas, los estilos de cita más utilizados en el ámbito de las ciencias de la salud son: Estilo Vancouver (http://www.fisterra.com/recursos web/mbe/ vancouver.asp) y Normas de la APA (American Psychological Associations) (http://www.apastyle.orgl). • Para aprender a hacer búsquedas bibliográficas, es fundamental practicar, ya que haciendo búsqueda es como se mejora y se pierde el respeto a afrontar la recuperación de información.
40
1.3. Revisión bibliográfica
BIBLIOGRAFÍA Falagas ME, Ntziora F, Makris GC, Malietzis GA, Rafailidis PI. Do PubMed and Google searches help medical students and young doctors reach the correct diagnosis? A pilot study. Eur J Intern Med. 2009;20(8):788790. Waffenschmidt S, Janzen T, Hausner E, Kaiser T. Simple search techniques in PubMed are potentially suitable for evaluating the completeness of systematic reviews. J Clin Epidemiol. 2013;66(6):660-665. Schmelzer M. The importance of the literature search Gastroenterol. Gastroenterology Nursing. 2008;31(2):151-153. Shultz SM, Dell EY, Bodan CL. Are we there yet? When is a literature review complete? Am J Nurs. 2009;109(9):78-79. Arranz-Lázaro M. Cómo hacer una búsqueda bibliográfica. Arch Prev Riesgos Labor. 1998;3:118-121. Bahaadinbeigy K, Yogesan K, Wootton R. MEDLINE versus EMBASE and CINAHL for telemedicine searches. Telemed J E Health. 2010;16(8):916-919. Steele SE. Bibliographic citation management software as a tool for building knowledge. J Wound Ostomy Continence Nurs. 2008;35(5):463-466. Smith CM, Baker B. Technology in nursing scholarship: use of citation reference managers. Int J Ment Health Nurs. 2007;16(3):156-160. Gehanno J, Rollin L, Darmoni S. Is the coverage of google scholar enough to be used alone for syste
41
Manual del Investigador Novel
TABLAS Y FIGURAS Tabla 1.3.1. Ejemplo de búsqueda sobre acreditación de formación continuada Formación Continuada
AND
education continuing
accreditation*
OR education, medical, continuing OR education, nursing, continuing
Figura 1.3.1.
Acreditación
Figura 1.3.2.
Figura 1.3.3.
42
1.3. Revisión bibliográfica
Figura 1.3.4.
Figura 1.3.5.
Figura 1.3.6.
Figura 1.3.7.
43
Manual del Investigador Novel
Figura 1.3.8.
44
1.3. Revisión bibliográfica
Figura 1.3.9.
Figura 1.3.10.
45
Manual del Investigador Novel
Figura 1.3.11.
Figura 1.3.12.
46
1.3. Revisión bibliográfica
Figura 1.3.13.
47
Manual del Investigador Novel
Figura 1.3.14.
48
1.3. Revisión bibliográfica
Figura 1.3.15.
49
Manual del Investigador Novel
Figura 1.3.16.
50
1.3. Revisión bibliográfica
Figura 1.3.17.
Figura 1.3.18.
51
Manual del Investigador Novel
Figura 1.3.19.
52
1.3. Revisión bibliográfica
Figura 1.3.20.
53
Manual del Investigador Novel
54
Modulo 2:
METODOLOGÍA CIENTÍFICA
Responsable: Dr. Joan Soriano
Manual del Investigador Novel
56
2.1. Índice Tipos de diseños: Generalidades
ÍNDICE 2.1. TIPOS DE DISEÑOS: GENERALIDADES ........................................................................................ 61 INTRODUCCIÓN .................................................................................................................................. 61 DISEÑO DE UN ESTUDIO ................................................................................................................. 61 Ejemplos PUNTOS CLAVE ................................................................................................................................... 63 BIBLIOGRAFÍA ..................................................................................................................................... 64 TABLAS Y FIGURAS ........................................................................................................................... 65 2.2. ESTUDIOS DESCRIPTIVOS ............................................................................................................. 69 INTRODUCCIÓN .................................................................................................................................. 69 CARACTERÍSTICAS GENERALES ................................................................................................... 69 ESTUDIOS ECOLÓGICOS ................................................................................................................. Estudios descriptivos de mapas Estudios de series temporales
71
ESTUDIOS DE BASE INDIVIDUAL ................................................................................................. 72 Series de casos Estudios transversales PUNTOS CLAVE ................................................................................................................................... 74 BIBLIOGRAFÍA ..................................................................................................................................... 75 TABLAS Y FIGURAS ........................................................................................................................... 76 2.3. ESTUDIOS ANALÍTICOS: COHORTES Y CASO-CONTROL ......................................................
77
INTRODUCCIÓN ..................................................................................................................................
77
ESTUDIOS DE COHORTE .................................................................................................................. Proceso de un estudio de cohorte Ventajas de un estudio de cohorte Inconvenientes de un estudio de cohorte Análisis
77
ESTUDIOS DE CASOS Y CONTROLES .......................................................................................... 80 Tipos de estudio de casos y controles Proceso de un estudio de casos y controles Ventajas de los estudios de casos y controles Inconvenientes de los estudios de casos y controles Análisis INTERPRETACIÓN ............................................................................................................................... 82 PUNTOS CLAVE ................................................................................................................................... 83 57
Manual del Investigador Novel
BIBLIOGRAFÍA ..................................................................................................................................... 84 TABLAS Y FIGURAS ........................................................................................................................... 86 2.4. ESTUDIOS EXPERIMENTALES Y CUASI EXPERIMENTALES ................................................. 91 INTRODUCCIÓN .................................................................................................................................. 91 ESTUDIOS EXPERIMENTALES ........................................................................................................ 91 Características Ventajas y limitaciones ESTUDIOS CUASI EXPERIMENTALES .......................................................................................... 94 Características Ventajas y limitaciones PRINCIPALES SESGOS EN LOS ESTUDIOS EXPERIMENTALES Y CUASI EXPERIMENTALES ................................................................................................................ 95 ENSAYO CLÍNICO CON MEDICAMENTOS ................................................................................... 96 CONSIDERACIONES ÉTICAS DE LOS ESTUDIOS EXPERIMENTALES ................................ 96 PUNTOS CLAVE ................................................................................................................................... 97 BIBLIOGRAFÍA ..................................................................................................................................... 98 TABLAS Y FIGURAS ........................................................................................................................... 99 2.5. TIPOS DE ERROR. VALIDEZ, SESGOS Y CONFUSIÓN ............................................................. 101 EL ERROR EN INVESTIGACIÓN ....................................................................................................... 101 ERROR ALEATORIO. PRECISIÓN .................................................................................................... 101 Definición, causas y efectos del error aleatorio Evaluación del error aleatorio ERROR SISTEMÁTICO. VALIDEZ .................................................................................................... 102 Sesgo de selección. Definición, causas y efectos Sesgo de información. Definición, causas y efectos Confusión. Definición, causas y efectos Evaluación del error sistemático (sesgo de selección, sesgo de información y confusión). Análisis de sensibilidad VALIDEZ EXTERNA. GENERALIZACIÓN ........................................................................................ 105 REDUCIR LOS ERRORES ALEATORIOS Y SISTEMÁTICOS .................................................... 105 Evitar o reducir el error aleatorio Evitar o reducir el sesgo de selección Evitar o reducir el sesgo de información Evitar o reducir la confusión EQUÍVOCOS Y DUDAS FRECUENTES EN TORNO A LOS ERRORES EN INVESTIGACIÓN .................................................................................................................................. 108 CONSIDERACIONES FINALES ......................................................................................................... 109 PUNTOS CLAVE ................................................................................................................................... 109 BIBLIOGRAFÍA ..................................................................................................................................... 110 TABLAS Y FIGURAS ........................................................................................................................... 111
58
2.1. Índice Tipos de diseños: Generalidades
2.6. REVISIONES SISTEMÁTICAS Y METAANÁLISIS ...................................................................... 119 INTRODUCCIÓN .................................................................................................................................. 119 PROTOCOLO DE LA REVISIÓN SISTEMÁTICA ........................................................................... 119 DEFINICIÓN DE LA PREGUNTA DE REVISIÓN ............................................................................ 120 CRITERIOS DE INCLUSIÓN Y EXCLUSIÓN ................................................................................. 120 BÚSQUEDA BIBLIOGRÁFICA ......................................................................................................... 121 PROCESO DE REVISIÓN ................................................................................................................... 122 Equipo de revisión Estudios excluidos PROCESO DE EXTRACCIÓN DE DATOS ....................................................................................... 123 EVALUACIÓN DEL RIESGO DE SESGOS ...................................................................................... 123 ANÁLISIS DE RESULTADOS ............................................................................................................ 124 Metaánalisis Metasíntesis EVALUACIÓN DE LA CALIDAD DE LA EVIDENCIA ...................................................................... 125 REDACCIÓN DE RESULTADOS ....................................................................................................... 125 LIMITACIONES DE LOS RESULTADOS ......................................................................................... 125 REVISANDO UNA REVISIÓN .......................................................................................................... 125 PUNTOS CLAVE ................................................................................................................................... 126 BIBLIOGRAFÍA ..................................................................................................................................... 127 TABLAS Y FIGURAS ........................................................................................................................... 128 2.7. VALIDACIÓN DE PRUEBAS DIAGNÓSTICAS ............................................................................. 131 INTRODUCCIÓN .................................................................................................................................. 131 FASES DE UN ESTUDIO DE EVALUACIÓN DE PRUEBAS DIAGNÓSTICAS ....................... 131 ELEMENTOS CLAVE PARA AUMENTAR LA CALIDAD DE LOS ESTUDIOS DE VALIDACIÓN DIAGNÓSTICA .................................................................................................... 132 Estructura básica Pasos a seguir en los estudios VALIDEZ, FIABILIDAD Y PRECISIÓN DE LOS ESTUDIOS DE PRUEBAS DIAGNÓSTICAS .................................................................................................................................. 133 Validez Fiabilidad Precisión CONTROL DE CALIDAD DE LOS ESTUDIOS DE PRUEBAS DIAGNÓSTICAS .................... 136 PUNTOS CLAVE ................................................................................................................................... 136 BIBLIOGRAFÍA ..................................................................................................................................... 137 TABLAS Y FIGURAS ........................................................................................................................... 138
59
Manual del Investigador Novel
2.8. VALIDACIÓN DE CUESTIONARIOS ............................................................................................... 145 INTRODUCCIÓN .................................................................................................................................. 145 ELABORACIÓN DE UN CUESTIONARIO ....................................................................................... 146 VALIDACIÓN DEL CUESTIONARIO ................................................................................................ 147 Fiabilidad Validez RESPUESTA AL CAMBIO .................................................................................................................. 150 Cambio homogéneo Cambio heterogéneo CUESTIONES A CONSIDERAR ........................................................................................................ 151 PUNTOS CLAVE ................................................................................................................................... 152 BIBLIOGRAFÍA ..................................................................................................................................... 153 TABLAS Y FIGURAS ........................................................................................................................... 154
60
2.1. Tipos de diseños: Generalidades
2.1. TIPOS DE DISEÑOS: GENERALIDADES Dra. Elena Gimeno
INTRODUCCIÓN En este capítulo se presentan los tipos de diseño en investigación y sus generalidades. En capítulos posteriores se describirán las características de cada uno de ellos de manera más detallada. El diseño de un proyecto de investigación se define como el conjunto de procedimientos, métodos y técnicas para la selección de sujetos, evaluación de las variables del estudio, recogida de datos y análisis para la interpretación de resultados.
DISEÑO DE UN ESTUDIO En investigación existen diferentes tipos de diseños de estudios. La elección del diseño más adecuado va a depender de la pregunta de investigación que se quiera responder (objetivo principal), de la frecuencia de la condición clínica o enfermedad a estudiar, de la consideración de los aspectos éticos, así como de los recursos económicos, de infraestructura y de tiempo del equipo investigador. Los factores a tener en cuenta para el diseño de un estudio se pueden clasificar según diferentes criterios: • • • • •
Naturaleza de los datos: cuantitativo o cualitativo. Propósito del estudio: descriptivo o analítico. Asignación de la exposición: experimental u observacional. Temporalidad del seguimiento: transversal o longitudinal. Relación cronológica del inicio del estudio y aparición del fenómeno de estudio: prospectivo o retrospectivo. • Unidad de estudio: individuo o grupo de individuos.
En la tabla 2.1.1 se describen de manera general las características de cada uno de los criterios de clasificación para el diseño de un estudio. La tigura 2.1.1 presenta un algoritmo de clasificación de los estudios teniendo en cuenta algunos de los criterios anteriormente descritos. Este algoritmo no presenta una clasificación universalmente aceptada (ya que puede variar en función de los criterios que se usen), pero puede ayudar a encuadrar la pregunta de investigación y decidir el diseño de estudio más adecuado.
61
Manual del Investigador Novel
Otra de las características a tener en cuenta y que está relacionada con un tipo de diseño u otro es la evidencia científica que los resultados de un estudio proporcionarán. La Figura 2.1.2 esquematiza de manera general la jerarquía de evidencia científica que cada tipo de estudio aporta. Como se mencionó anteriormente, la estructura del diseño de nuestro estudio combinará las diferentes características o criterios que aparecen en la tabla y en el algoritmo. A continuación, se presentan algunos ejemplos de estudios, ya publicados, con el objetivo de analizar los criterios de clasificación vistos en este capítulo. Ejemplos Ejemplo 1. Garcia-Aymerich J, Gómez FP, Benet M, et al. PAC-COPD Study Group. Identification and prospective validation of clinically relevant chronic obstructive pulmonary disease (COPD) subtypes. Thorax. 2011;66:430-437. Este estudio recoge datos demográficos, clínicos, funcionales, etc. (estudio cuantitativo) de 342 pacientes con enfermedad pulmonar obstructiva crónica (EPOC) durante su primer ingreso por agudización en 9 hospitales terciarios de 3 comunidades autónomas españolas, sin hacer ningún tipo de intervención (estudio observacional), con el objetivo de: 1) identificar los subtipos de los pacientes que ingresan por primera vez por agudización de la EPOC (analítico transversal) y 2) validar los subtipos identificados durante un seguimiento de 4 años (analítico longitudinal prospectivo) con variables clínicamente relevantes, como hospitalización y mortalidad (relación causa-efecto: estudio de cohorte). Ejemplo 2. McKeever T, Harrison TW, Hubbard R, Shaw D. Inhaled corticosteroids and the risk of pneumonia in people with asthma: a case-control study. Chest. 2013;144:1788-1794. En una cohorte de pacientes con diagnóstico de asma se identificó a los pacientes que hubieran sido diagnosticados de neumonía (casos) y a pacientes de la misma edad y sexo que no hubieran tenido diagnóstico de neumonía (controles) (estudio cuantitativo) con el objetivo de estudiar la asociación (estudio analítico) de neumonía y el uso de corticoides inhalados en pacientes con asma (estudio observacional, longitudinal, relación efecto-causa: estudio de casos-controles). Ejemplo 3. Miravitlles M, Soriano JB, García-Río F, et al. Prevalence of COPD in Spain: impact of undiagnosed COPD on quality of life and daily life activities. Thorax. 2009;64:863-868. En este estudio se recogen datos demográficos y clínico-funcionales (cuantitativo) mediante envío de un cuestionario (transversal) a una muestra poblacional de más de 4.200 sujetos de edades comprendidas entre 40 y 80 años de 10 ciudades de España (descriptivo) para estimar la prevalencia de EPOC (transversal: prevalencia). Ejemplo 4. Ehlken N, Lichtblau M, Klose H, et al. Exercise training improves peak oxygen consumption and haemodynamics in patients with severe pulmonary arterial hypertension and inoperable chronic thrombo-embolic pulmonary hypertension: a prospective, randomized, controlled trial. Eur Heart J. 2016;37:3544. En este estudio se selecciona una muestra de 87 pacientes con hipertensión arterial pulmonar con el objetivo de estudiar los efectos de 15 semanas de entrenamiento físico en parámetros clínicos como el pico en el consumo de oxígeno y en la hemodinámica (estudio cuantitativo analítico). Los pacientes son asignados aleatoriamente a grupo intervención (entrenamiento físico) o grupo control (tratamiento habitual), y son 62
2.1. Tipos de diseños: Generalidades
evaluados antes y después de la intervención (estudio prospectivo, experimental, aleatorizado y con grupo control: ensayo clínico controlado aleatorizado – ECA). Ejemplo 5. Dobbels F, De Jong C, Drost E, et al. The PROactive innovative conceptual framework on physical activity. Eur Respir J. 2014;44:1223-1233. Este estudio es un ejemplo de diseño cualitativo, ya que aunque los autores aportan información numérica sobre las características de los sujetos de estudio (edad, función pulmonar, prueba de la marcha, etc.), los resultados principales son básicamente narrativos: un marco conceptual y anotaciones extraídas de entrevistas y grupos focales con pacientes con EPOC para conocer su experiencia de actividad física.
PUNTOS CLAVE • La pregunta de investigación y, por lo tanto, el objetivo principal del estudio constituye los factores que determinarán en mayor medida la selección del diseño más adecuado. • Los diferentes tipos de estudios se distribuyen de manera jerárquica en función de la evidencia científica que generan. En humanos, la mayor evidencia la proporcionarán los ensayos controlados aleatorizados (ECA), mientras que las series de casos son los que menor evidencia producen. • Los estudios cualitativos recogen información narrativa (no numérica) basada en percepciones, opiniones y explicaciones, mientras que los estudios cuantitativos recogen información que puede ser medida o registrada numéricamente. • Los estudios descriptivos se centran en el estudio de características generales, distribución de la población y descripción de la historia natural de una enfermedad. Los estudios analíticos permiten estudiar la relación causal entre la exposición (o intervención) y el efecto (o resultado). • En los estudios observacionales no existe manipulación por parte del investigador, quien se limita a observar lo que ocurre. Sin embargo, en los estudios experimentales se manipula el factor de estudio para evaluar el efecto. • Los estudios transversales recogen la información en un momento temporal determinado (ideales para estudiar prevalencia). Los estudios longitudinales recogen los datos después de un periodo de seguimiento (ideales para estudiar causalidad). • En los estudios prospectivos, el evento de interés se producirá después del inicio del estudio, mientras que en los estudios retrospectivos el evento de interés ya se produjo (los datos se pueden recoger mediante revisión de archivos históricos).
63
Manual del Investigador Novel
BIBLIOGRAFÍA Argimón Pallás JM, Jiménez Villa J. Métodos de investigación clínica y epidemiológica. Madrid, Elsevier, 4ª ed., 2013. Garcia-Aymerich J, Soriano JB. “Aspectos epidemiológicos en neumología”. En: Casán P, García Río F, Gea J (editores). Fisiología y biología respiratorias. Madrid, ERGON, 2007, p. 689-701. Chatburn RL. Handbook for respiratory care research. Cleveland, Mandu Press, 1ª ed. 2002.
64
2.1. Tipos de diseños: Generalidades
TABLAS Y FIGURAS Tabla 2.1.1. Criterios de clasificación para el diseño de un estudio Naturaleza de los datos Cualitativo
Cuantitativo
Recoge información narrativa extraída de entrevista no estructurada, observación del participante, análisis documental, grupos focales, etc. Estudia las percepciones, opiniones y explicaciones en un grupo de sujetos de interés en situaciones o contextos dinámicos. Análisis inductivo (desarrollo de teorías).
Recoge información que puede ser medida numéricamente. Estudia la asociación o relación entre variables cuantificables a través de una muestra representativa en contextos más controlados. Análisis deductivo (análisis de la teoría).
Propósito del estudio Descriptivo
Analítico
Permite estudiar características generales y distribución poblacional, así como describir la historia natural de las enfermedades. Útil para generar hipótesis etiológicas que deberían contrastarse con estudios analíticos. Muchas veces clasificados como observacionales por su naturaleza implícita de no manipulación del factor de estudio.
Permite evaluar una relación causal entre un factor, exposición o intervención y el efecto o resultado. Útil para confirmar hipótesis etiológicas.
Asignación del factor de estudio Observacional
Experimental
No existe manipulación del factor de estudio por parte del investigador, este simplemente se limita a observar, medir y analizar las variables de estudio en los sujetos de interés. Permite probar hipótesis y estudiar relaciones causales.
Manipulación (asignación) del factor de estudio por parte del investigador, mediante aleatorización y según un protocolo previamente establecido. Si la asignación no es aleatorizada será un diseño cuasi-experimental. En general, se usa para evaluar el efecto de una intervención.
Temporalidad del seguimiento Transversal
Longitudinal
Los datos se obtienen en un momento temporal determinado (cross-sectional). Se mide a la vez la frecuencia de la exposición y la enfermedad de interés, y por ello no permiten establecer relación causa-efecto. Ideal para estudiar (describir) la prevalencia de una enfermedad o una característica clínica, y para generar hipótesis causales que deberían contrastarse con estudios longitudinales.
Los datos se obtienen después de un periodo de seguimiento (follow-up). Se establece una secuencia temporal entre las variables medidas lo que permite estudiar causalidad. Si la dirección temporal va de la causa hacia el desenlace (efecto) será un estudio experimental o uno de cohortes. Si la dirección temporal va desde el desenlace (efecto) hacia la causa será un estudio de casos y controles.
Relación cronológica del inicio del estudio y la aparición del fenómeno Prospectivo
Retrospectivo
El desenlace o evento de interés se produce después del inicio del estudio. Los datos de las variables de interés se recogen a medida que van sucediendo.
El desenlace o evento de interés se ha producido antes del inicio del estudio. Los datos se recogen mediante revisión de archivos o de historia clínica, o a través de entrevista sobre los eventos sucedidos.
Unidad de estudio Individuo
Grupo de individuos (ecológicos)
La información se recoge de manera individual.
La información se recoge de manera agregada según criterios previamente establecidos, por ejemplo, geográficos o temporales. 65
Figura 2.1.1. Algoritmo de clasificación de los tipos de diseño de estudio
Manual del Investigador Novel
66
2.1. Tipos de diseños: Generalidades
Figura 2.1.2. Jerarquía de evidencia científica según el tipo de estudio
67
Manual del Investigador Novel
68
2.2. Estudios descriptivos
2.2. ESTUDIOS DESCRIPTIVOS Dr. José Luis López-Campos Bodineau
INTRODUCCIÓN Las principales fuentes de orientación ética para la realización de investigaciones clínicas son tres: la DeclarA pesar de la extendida creencia de que los estudios descriptivos pueden tener un menor interés, esta opinión no se corresponde con la realidad. Los estudios descriptivos permiten tener una primera aproximación a un problema de salud, detectar de manera rápida un nuevo evento clínico, comparar situaciones entre áreas geográficas o momentos temporales y, además, son la principal fuente de generación de hipótesis para ulteriores estudios. Se trata, por tanto, de diseños sencillos, pero que pueden tener un gran poder de información. En concreto, la epidemiología descriptiva permite responder preguntas relevantes sobre la distribución de las enfermedades en el espacio y el tiempo y determinar los factores asociados a esta distribución. De esta manera, los estudios descriptivos aportan información sobre las poblaciones que desarrollan una determinada enfermedad o un efecto clínico, su frecuencia en comparación con otras poblaciones, cómo varía esta frecuencia en el tiempo o entre localizaciones geográficas y los factores de riesgo asociados. Por este motivo, es necesario conocer bien los estudios descriptivos y saber diseñarlos, ejecutarlos y analizarlos adecuadamente. Sus dos grandes ventajas son posibilitar la síntesis de información compleja y extensa y la generación de hipótesis. Se trata, por tanto, de diseños denominados observacionales o no experimentales, puesto que su objetivo es describir una situación clínica concreta en un contexto temporal y geográfico sin intervenir de ninguna manera en la población observada.
CARACTERÍSTICAS GENERALES Para llevar a cabo un estudio descriptivo, es necesario realizar una serie de pasos que nos ayudarán a definir el objetivo de nuestro trabajo y que deben tenerse en cuenta en la metodología. En su diseño deberemos definir: la enfermedad a estudiar, la población diana, las variables que vamos a registrar y la elección de la fuente de información. Problema de salud a estudiar. En el diseño del estudio descriptivo es necesario identificar y definir bien la enfermedad que va a ser objeto de estudio. Este paso es crucial para interpretar los resultados y compararlos con otros estudios previos. En este punto, además de identificar la enfermedad en concreto, es necesario definir bien los criterios diagnósticos. Un ejemplo cercano está representado por los estudios epidemiológicos sobre enfermedad pulmonar obstructiva crónica (EPOC). Aunque el concepto de la enfermedad está claro, 69
Manual del Investigador Novel
los criterios diagnósticos para definir un caso en un estudio epidemiológico pueden variar, ya que pueden utilizarse el cociente fijo FEV1/FVC de la espirometría o bien su límite inferior de la normalidad, y puede hacerse con la espirometría, la pre o la post-broncodilatación. Según se elija unos u otros, la prevalencia de la enfermedad cambiará.1 Población diana. Aunque siempre es interesante conocer cómo se comporta la población respecto a una determinada enfermedad o factor de riesgo, la población a estudio no tiene por qué ser la población general. En ocasiones interesará estudiar una población concreta. Por ejemplo, el cáncer de pulmón en mujeres, o en población no fumadora, o en un determinado rango de edad. Esta población debe quedar perfectamente identificada en el diseño del trabajo. Variables a registrar. Es importante definir previamente qué información se va a registrar de cada caso. Para ello, no sólo es importante seleccionar las variables, sino que también hay que concretar dos aspectos relevantes: • Cómo se van a definir estas variables. Por ejemplo, si queremos estudiar la distribución de pacientes con frecuentes agudizaciones, no sólo tendremos que elegir el número de agudizaciones como variable, también tendremos que definir qué vamos a considerar una agudización y qué vamos a considerar como agudizador frecuente. Otro ejemplo podría ser el nivel socioeconómico, cuya definición y estratificación deberemos definir en la metodología. Situaciones parecidas se pueden dar en la categorización de la gravedad de una enfermedad, la intensidad de la exposición a un factor de riesgo o los valores de una determinación analítica. • Cómo se van a registrar. En este sentido, deberemos definir si se va a registrar como una variable continua o categórica. Para las variables cualitativas está claro que se deben registrar como categóricas, pero deberemos definir las categorías que vamos a emplear. En ocasiones será sencillo (por ejemplo, hombre o mujer), pero en otras será más complicado (por ejemplo, nivel de estudios o situación socioeconómica). En cuanto a las variables cuantitativas, podremos registrarlas como números o categorizarlas; en este último caso también deberemos definir las categorías. Esta decisión es de especial relevancia, ya que dependiendo de si usamos la variable cuantitativa cruda o categorizada realizaremos después el análisis estadístico de los datos en la misma línea. Elección de la fuente de información. En nuestro caso, la fuente de información será por lo general la historia clínica del paciente o bien datos almacenados en bases de datos sanitarias. Aquí es importante tener presente dos aspectos: • La fuente de la información. En función de la variable que queramos medir, deberemos recurrir al historial médico, al de enfermería o a otros registros. Por ejemplo, si vamos a registrar la temperatura corporal de los pacientes durante una hospitalización, no tendría mucha validez si extrajéramos este dato de la historia médica, puesto que allí se recoge de manera inconstante. Sin embargo, el historial de enfermería la recoge sistemáticamente. • Si la información que vamos a usar se puede extraer directamente como dato primario del origen o si, por el contrario, la información tiene que ser procesada antes de su análisis. Por ejemplo, podemos analizar los niveles de potasio en suero, que es un dato primario de la historia clínica; sin embargo si queremos estudiar el uso de un índice compuesto, tendremos que calcularlo a partir de los datos de la historia. En este último caso, será necesario definir muy bien en la metodología cómo tratan los datos y de qué fuente provienen. Clasificación. Los estudios descriptivos se han clasificado de distintas formas. En este capítulo hablaremos de dos grandes tipos de estudio en función de la unidad de análisis. Si la unidad de análisis son personas, 70
2.2. Estudios descriptivos
hablaremos de estudio de base individual. Si, por el contrario, se analizan datos de grupos de poblaciones, también llamados datos agregados, entonces hablaremos de estudios ecológicos.
ESTUDIOS ECOLÓGICOS Los estudios ecológicos usan datos agregados de grupos poblacionales. Su función es describir la distribución de las enfermedades en una población, durante un período de tiempo concreto y en un ámbito geográfico definido. De esta manera, pueden dar información sobre la frecuencia de la enfermedad o del fenómeno a estudiar y cuáles son los factores asociados. Este tipo de estudio permite, además, identificar aumentos en el tiempo o el espacio de una agregación de casos o eventos que son de una ayuda considerable al planificar políticas de salud. Hasta hace unas décadas, estos estudios eran difíciles de llevar a cabo, puesto que no existían muchas fuentes de información de donde extraer los datos. Con la informatización de los datos y la disponibilidad a través de internet, se ha conseguido que estos datos estén disponibles para los investigadores interesados en responder preguntas de investigación. Por lo general, las bases de datos de salud suelen estar abiertas siempre que se cumplan los requisitos éticos, incluyendo la confidencialidad de los datos, y que se utilicen para el fin de investigación definido. Entre sus ventajas destaca que son relativamente rápidos de realizar, siempre que se tenga la información adecuada. Además, son bastante económicos, ya que, al tener acceso a la información, realmente el principal recurso necesario para llevarlos a cabo es tiempo para hacer un análisis correcto. Su principal limitación es que sirven para plantear hipótesis, pero generalmente no para verificarlas. Otra limitación metodológica se deriva de la comparación entre estudios. Debido a que son estudios de datos agregados, puede ser erróneo comparar datos de áreas geográficas o momentos temporales distintos, puesto que la estructura de la población que se estudia puede influir en los resultados. Por ejemplo, podríamos detectar una mayor mortalidad por EPOC en un país en comparación con otro, pero si el primer país tuviera una población más envejecida, entonces las diferencias podrían deberse a esta diferencia y no a un porcentaje de mortalidad por EPOC distinto. Para corregir esto, los estudios ecológicos ajustan sus valores a la población de estudio. De esta manera, las denominadas tasas crudas se transforman en tasas ajustadas a la población de esa zona y en ese momento. Es lo que se llama estandarización o ajuste de tasas. Las formas de estandarización de tasas quedan fuera de los objetivos de este capítulo, pero básicamente existen dos métodos, denominados método directo e indirecto. Una consideración metodológica que limita estos estudios es que asumen que toda la población está expuesta en la misma medida a los factores de riesgo en estudio, por lo que sus resultados no deben aplicarse a un caso concreto, puesto que incurriríamos en la denominada falacia ecológica. Para entender la falacia ecológica, es importante recordar que los estudios ecológicos nos dan información agregada de la población en estudio, pero no de los individuos concretos. La falacia ecológica se produce cuando queremos extrapolar los resultados de un grupo a un individuo concreto o bien cuando queremos extrapolar los resultados de un individuo o grupo de individuos al grupo completo. Los estudios ecológicos se pueden clasificar en dos grandes grupos: estudios descriptivos de mapas y estudios de series temporales. Estudios descriptivos de mapas Los estudios de mapas estudian un determinado parámetro epidemiológico, como puede ser la incidencia, la prevalencia o la mortalidad, buscando patrones según su distribución entre diversas áreas geográficas. Estas áreas pueden ser de cualquier tamaño: localidades, provincias, países o continentes. Generalmente se hace un mapa de calor en el que se colorea cada ámbito geográfico en mayor o menor intensidad de color 71
Manual del Investigador Novel
según el mayor o menor valor del parámetro estudiado. La generación de estos mapas siempre ha necesitado una gran cantidad de tiempo, puesto que tradicionalmente se han hecho de manera manual con software no específico. En los últimos años han comenzado a aparecer aplicaciones específicamente diseñadas para el tratamiento de los datos y su distribución geográfica. Estas aplicaciones generan los mapas necesarios una vez se han introducido los datos. Entre ellas figuran aplicaciones independientes, aplicaciones que se integran en los paquetes de ofimática más comunes del mercado y aplicaciones online a través de páginas web específicas. La figura 2.2.1 es un ejemplo de este tipo de mapas realizado por una aplicación online de acceso gratuito. Estudios de series temporales Los estudios de series o tendencias temporales describen la evolución de un problema de salud en el tiempo. En este tipo de estudio, es el tiempo y no el espacio lo que se analiza para apreciar los cambios del problema de salud. La principal limitación es que si la información es considerable y la variabilidad de los datos también, entonces puede ser difícil ver un patrón. Para esto existen métodos estadísticos que simplifican la información y muestran una tendencia única. El método más conocido es la denominada regresión de joinpoint.2 Este análisis de regresión identifica puntos de inflexión (denominados joinpoints) en la curva de evolución temporal, con el objeto de identificar los años en que se produjeron cambios significativos en la pendiente lineal de la tendencia temporal. Este enfoque tiene dos ventajas principales: identifica el momento en que hay cambios en la tendencia y estima la magnitud del aumento o de la disminución observada en cada intervalo mediante el cálculo del denominado porcentaje de cambio anual entre dos joinpoints. Actualmente existe software gratuito que hace este tipo de análisis. En la figura 2.2.2 se presenta un ejemplo de estudio de serie temporal con análisis de regresión de joinpoint.
ESTUDIOS DE BASE INDIVIDUAL Series de casos Los estudios de series de casos, o incluso de un caso concreto, son los estudios más simples. La descripción de uno o varios casos clínicos con características clínicas relevantes constituye la base de la investigación biomédica, sus orígenes, y tiene una gran relevancia clínica. A pesar de que su valor epidemiológico es escaso por no tener una muestra representativa ni contar con un grupo control, al compartir con colegas una presentación clínica peculiar, junto con la actitud diagnóstica o terapéutica llevada a cabo su valor clínico y docente es indudable. Además, este tipo de estudios también cumple la función de establecer hipótesis clínicamente relevantes que más adelante deberán confirmarse con otro tipo de estudio. Por ejemplo, en 1935 dos médicos de Baltimore, Louis Hamman y Arnold Rich, publicaron una serie de 4 casos clínicos, la mayoría de pacientes de raza negra, entre los 20 y los 30 años de edad, que desarrollaban un cuadro clínico de un fracaso respiratorio agudo acompañado de infiltrados pulmonares y con un pronóstico ominoso.3 Esta descripción inicial dio lugar al estudio de la patología intersticial pulmonar con un cuadro que en su día se denominó como pulmón de Hamman-Rich y que actualmente se ha asociado con la neumonía intersticial aguda. Entre sus ventajas figuran que son fáciles, económicos y rápidos de realizar, tienen sentido clínico, permiten llamar la atención sobre un hecho clínico poco habitual y sirven para generar hipótesis. Estudios transversales Los estudios transversales, también llamados estudios de prevalencia, tienen por objetivo evaluar la presencia de una enfermedad y de los factores de riesgo asociados en un mismo momento temporal y en una población bien definida. Como resultado obtenemos la prevalencia de una determinada enfermedad o factor de riesgo en esa población definida. 72
2.2. Estudios descriptivos
Ventajas Entre sus ventajas figuran que proporciona información fiable y estática, una fotografía, para la planificación sanitaria, ya que permite identificar grupos más vulnerables a un determinado problema de salud y además describe las enfermedades y las relaciona con la distribución de sus factores de riesgo en la población. Además, proporciona información basal para estudios de seguimiento y puede dar información sobre el impacto de una determinada intervención terapéutica en la población al repetir el estudio tras esta intervención. Finalmente, otra ventaja es su coste relativamente bajo en comparación con los estudios de seguimiento. Limitaciones El diseño de los estudios transversales, por otro lado, tiene algunos retos metodológicos. En primer lugar, por lo general resulta difícil estudiar toda la población diana, por lo que suelen tener una primera fase de selección de una muestra sobre la que se hace el estudio. El reto está en asegurar que esta muestra seleccionada es representativa de la población completa. Para conseguirlo, es necesario hacer algún tipo de muestreo bien definido y definir bien los criterios de inclusión y exclusión en el estudio. Los tipos de muestreos, sus ventajas e inconvenientes quedan fuera de los objetivos de este capítulo, pero este aspecto es importante para darle validez a los resultados. Es vital que las personas estudiadas sigan este proceso de muestreo para evitar sesgos en la selección de la muestra que la haga no representativa de la población a estudio. En este sentido, se han descrito diversos tipos de sesgos de selección que deben ser tenidos en cuenta, como el del voluntario sano, el de los no respondedores o el de supervivencia. En segundo lugar, es importante recordar que la información es estática en el tiempo, es una fotografía de la situación. Por tanto, al medir simultáneamente la presencia o no de enfermedad y sus factores de riesgo no tenemos noción de la dirección temporal de la asociación. En otras palabras, no sabemos si fue antes la enfermedad o el factor de riesgo. En tercer lugar, generalmente se asume que la enfermedad a estudio está representada por una variable dicotómica (tiene o no tiene la enfermedad), pero esto no siempre es así. Análisis El análisis de los estudios transversales nos aporta un resultado más inmediato, la prevalencia, entendida como número de sujetos que tienen la enfermedad entre el número de sujetos estudiados. Para estudiar su relación con un factor de riesgo determinado, podemos calcular la prevalencia entre los expuestos a ese factor de riesgo y entre los no expuestos. Esto nos permite estimar cómo de frecuente es la enfermedad entre expuesto y no expuesto mediante el cálculo de la razón de prevalencia, que es el cociente de ambas. Como alternativa a esta aproximación, un estudio de prevalencia se puede analizar como un estudio de casos-control y calcular la odds ratio de prevalencia, como se verá en el capítulo de los estudios de casos-control.
73
Manual del Investigador Novel
PUNTOS CLAVE • Los estudios descriptivos permiten tener una primera aproximación a un problema de salud, comparar situaciones entre áreas geográficas o momentos temporales y disponer de una fuente de generación de hipótesis. • Los estudios ecológicos usan datos agregados de grupos poblacionales con objeto de describir la distribución de las enfermedades en una población, durante un período de tiempo concreto y en un ámbito geográfico definido. • A pesar de que su valor epidemiológico es escaso por no tener una muestra representativa ni contar con un grupo control, los estudios de series de casos constituyen la base de la investigación biomédica y sus orígenes y tienen una gran relevancia clínica. • Los estudios transversales, también llamados estudios de prevalencia, tienen por objetivo evaluar la presencia de una enfermedad y de los factores de riesgo asociados en un mismo momento temporal.
74
2.2. Estudios descriptivos
BIBLIOGRAFÍA 1. Tilert T, Dillon C, Paulose-Ram R, Hnizdo E, Doney B. Estimating the U.S. prevalence of chronic obstructive pulmonary disease using pre- and post-bronchodilator spirometry: the National Health and Nutrition Examination Survey (NHANES) 2007-2010. Respir Res. 2013;14:103. 2. Kim HJ, Fay MP, Feuer EJ, Midthune DN. Permutation tests for joinpoint regression with applications to cancer rates. Stat Med. 2000;19(3):335-351. 3. Hamman L, Rich AR. Fulminating Diffuse Interstitial Fibrosis of the Lungs. Trans Am Clin Climatol Assoc. 1935;51:154-163. 4. López-Campos JL, Tan W, Soriano JB. Global burden of COPD. Respirology. 2015. 5. López-Campos JL, Ruiz-Ramos M, Soriano JB. COPD mortality rates in Andalusia, Spain, 1975-2010: a joinpoint regression analysis. Int J Tuberc Lung Dis. 2013;17(1):131-136.
75
Manual del Investigador Novel
TABLAS Y FIGURAS Figura 2.2.1. Ejemplo de estudio ecológico de mapas. La figura muestra la distribución de la mortalidad por EPOC en el mundo
Reproducido de López-Campos JL, et al. Respirology. 2015(4).
Figura 2.2.2. Ejemplo de estudio de serie temporal. La gráfica representa un análisis de regresión de joinpoint sobre la mortalidad por EPOC en Andalucía en hombres (A) y mujeres (B)
SMR: tasa de mortalidad estandarizada. TMR: tasa de mortalidad estandarizada y truncada para las edades entre 40 y 70 años. Reproducido de López-Campos JL, et al. Int J Tuberc Lung Dis. 2012(5).
76
2.3. Estudios analíticos: cohortes y caso-control
2.3. ESTUDIOS ANALÍTICOS: COHORTES Y CASO-CONTROL Dr. Joan B. Soriano Ortiz Dra. Patricia Pérez
INTRODUCCIÓN Gran parte de la investigación biomédica es de tipo observacional. Al contrario de los ensayos clínicos, en que la calidad se da por supuesta, en la investigación observacional la calidad es a menudo insuficiente, lo que dificulta la evaluación de sus puntos fuertes y débiles para la generalización de un estudio y su aplicación traslacional a los pacientes y a la salud general. Dentro de la sistemática de los diseños de estudio en investigación, los estudios observacionales no descriptivos y analíticos, que permiten probar hipótesis y estudiar causalidades, se clasifican en: • Estudios de cohorte: Siguen a lo largo del tiempo a un grupo de sujetos (cohorte) inicialmente libres de enfermedad midiendo en el momento de su exposición al factor de interés y estudiando la aparición posterior de la enfermedad. • Estudios de casos y controles, también llamados de caso-control: Comparan determinadas características (exposiciones) entre personas con la enfermedad (casos) y personas libres de la enfermedad (controles). A continuación se repasan sucintamente las características y usos de cada uno.
ESTUDIOS DE COHORTE También denominados estudios de seguimiento, de proyección o de incidencia. La palabra cohorte deriva del latín cohors, que era una unidad táctica del ejército romano formada por 480 hombres o legionarios, que marchaban juntos a la batalla. Diez cohortes, numeradas del I al X, constituían una legión romana. Durante el gobierno del emperador Augusto, el ejército romano totalizó 28 legiones. Es de interés repasar las distintas unidades: contubernio, 8 hombres; centuria, 10 contubernios (80 hombres); manípulo, 2 centurias (160 hombres); cohorte, 6 centurias (480 hombres); legión, 10 cohortes más 120 jinetes (5.240 hombres). Una vez entraban en una cohorte, liderada por seis centuriones, los soldados romanos podían cambiar de posición según su jerarquía y experiencia dentro de su cohorte, hasta que se licenciaban o morían.
77
Manual del Investigador Novel
Este mismo concepto se aplica a la cohorte en investigación clínica: un individuo sano o sin enfermedad/ evento de interés es reclutado en una cohorte y aporta información hasta que, voluntariamente, involuntariamente o por fallecimiento, abandona la cohorte. En investigación epidemiológica y clínica, un estudio de cohortes es un estudio epidemiológico, observacional, analítico y longitudinal, prospectivo en el que compara la frecuencia de una enfermedad (o de un determinado desenlace) entre muestras de una población o entre dos o más poblaciones, una de las cuales está sometida a un determinado factor de exposición o factor de riesgo al que no está expuesta la otra. Los individuos que componen los grupos de estudio se seleccionan en función de la presencia de una determinada característica o exposición. Estos individuos no tienen la enfermedad de interés y son seguidos durante un cierto periodo de tiempo para observar la frecuencia con que la enfermedad aparece en cada uno de los grupos. Los estudios de cohorte tienen por objetivo medir causalidad entre los factores de riesgo y la enfermedad a estudiar. Proceso de un estudio de cohorte El proceso para realizar un estudio de cohorte incluye las siguientes etapas: • Seleccionar una muestra de estudio de individuos sanos de una población. El concepto sano se entiende en su acepción más amplia, y significa que antes de iniciar el periodo de seguimiento los participantes no han experimentado la enfermedad o evento de interés. • Medir variables de exposición en la muestra, si el factor de riesgo está ausente o presente. • Seguir la cohorte. • Medir las variables de resultado, es decir, la presencia o ausencia de enfermedad. • Analizar mediante la estadística adecuada. Ventajas de un estudio de cohorte Un diseño de estudio de cohorte permite: 1. Estudiar factores de exposición extraños. 2. Visualizar los múltiples efectos (riesgos y beneficios) que una exposición pueda tener. 3. Observar simultáneamente los efectos de varias exposiciones (siempre y cuando esta posibilidad sea planteada desde el principio del estudio). 4. Posibilitar la muestra de la secuencia temporal entre exposición y desenlace. 5. Permitir la estimación de incidencia y riesgo relativo. 6. Establecer claramente la secuencia de sucesos de interés, como es la de exposición-enfermedad. 7. Evitar el sesgo de supervivencia. 8. Tener mejor control sobre la selección de sujetos. 9. Tener mayor control de las medidas. 10. Tener movimiento. Inconvenientes de un estudio de cohorte Sin embargo, también deben considerarse sus potenciales limitaciones: 1. A menudo requiere grandes tamaños muestrales. 2. No es eficiente en eventos raros o con largos períodos de latencia (tiempo transcurrido desde la exposición al evento). 78
2.3. Estudios analíticos: cohortes y caso-control
3. Su ejecución puede requerir mucho tiempo y dinero. 4. No es útil para enfermedades raras (pues no hay suficientes sujetos). 5. Son estudios caros por la cantidad de personas y el tiempo de seguimiento necesarios, así como por los esfuerzos que han de llevarse a cabo para que la calidad del seguimiento minimice las pérdidas entre las poblaciones que se siguen, manteniéndolas en un nivel aceptable. 6. No se dispone de resultados hasta después de transcurrido mucho tiempo. 7. Sólo evalúan la relación entre el evento del estudio y la exposición a ciertos factores definidos y/o cuantificados al inicio del estudio. Los estudios de seguimiento son los estudios prospectivos clásicos, caracterizados por el hecho de que el planteamiento del estudio y la medición de la exposición (o no exposición) se producen con anterioridad al desarrollo de la enfermedad. A pesar de que se trata de estudios muy costosos, pues requieren grandes recursos económicos y de tiempo, y de gran solidez, ya que la probabilidad de que estén sesgados es menor, hay que cuidar extremadamente los aspectos del diseño y evitar sesgos, especialmente de clasificación y el de los trabajadores sanos, entre otros. Como alternativa, existe otro tipo de estudios de cohortes, el estudio de las cohortes retrospectivas, en que la investigación se plantea después de haberse producido la enfermedad, para lo cual tanto la presencia de exposición como el desenlace deben proceder de registros históricos o clínicos de alta fiabilidad en los que se hayan registrado con precisión en el momento de producirse. En función de la existencia de medidas repetidas, se distinguen dos tipos de estudios de cohorte: estudios longitudinales y estudios sin medidas repetidas. El estudio de cohorte perfecto no existe, y quizás sea literalmente imposible de conseguir.1 En una enfermedad crónica, asociada al envejecimiento y al tabaco, como la EPOC,2 o con aspectos ambientales, como el asma, sería quizás una versión ampliada al ámbito respiratorio del Estudio de Framingham3 lo que nos permitiera hacer lo que los cardiólogos ya han hecho. Además, se debe tener en cuenta el conocimiento (o la falta de conocimiento) de la genética y el origen precoz de las enfermedades de aparición tardía. Desde este punto de vista, un tanto ingenuo, el estudio de cohortes para explorar la historia natural de una enfermedad debe tener las siguientes características: ser grande; comenzar antes del nacimiento; incluir el seguimiento de por vida; incluir unos pocos cientos de páginas de formularios de encuestas, pruebas de función pulmonar estandarizadas y muchas otras, mediciones de biomarcadores (incluyendo imágenes) y medidas de exposición directa y, por supuesto, la genética y todas las “ómicas” (por ejemplo, la genómica, la proteómica, la metabolómica). Obviamente, no es una tarea fácil. Una alternativa podría ser la puesta en común de los resultados de estudios de historia natural individuales. Utilizando un enfoque metaanalítico, podría ser una solución parcial, positiva, como se ha propuesto en cohortes de nacimiento que estudian asma y atopia, y se está explorando actualmente para la función pulmonar y la EPOC. Como consecuencia, el estudio de cohortes ideal para investigar la historia natural de las enfermedades respiratorias crónicas podría consistir en múltiples estudios, cada uno de los cuales se dirigiría a responder una pregunta científica específica. Existen cohortes de muy diversos orígenes y modelos a seguir. Una cohorte puede representar desde una muestra de la población general en un lugar determinado geográficamente (p. ej., la cohorte de Framingham mencionada anteriormente) hasta un grupo de trabajadores pertenecientes a una industria o un grupo de pacientes con una exposición (p. ej., hipertensos tratados). Algunas cohortes seleccionan a individuos de los que se espera un alto grado de colaboración para minimizar las pérdidas y aumentar la calidad de los datos recogidos. Es el caso de la cohorte de enfermeras de la Universidad de Harvard o la cohorte de voluntarios de la Sociedad Americana del Cáncer. Existen cohortes que fueron establecidas hace años y cuyos miembros son objeto de un seguimiento regular. Aunque en su día fueron diseñadas para un estudio concreto, normal79
Manual del Investigador Novel
mente con el paso del tiempo sus usos se van ampliando y llegan a ser una valiosa fuente de datos para múltiples enfermedades. Otras cohortes que se han utilizado son las llamadas históricas (p. ej., supervivientes a la bomba atómica de Hiroshima). En SEPAR, las cohortes ya establecidas y de gran utilidad incluyen, entre otros, los trabajadores de tareas de rescate del Prestige4 y la cohorte de pacientes CHAIN.5 Análisis La medida de asociación usada normalmente en los estudios de cohorte es el riesgo relativo (RR). Tal como se aprecia en la tabla 2.3.1, el análisis para un estudio de cohorte permite calcular la incidencia en cada grupo y el riesgo relativo en los expuestos en comparación con los no expuestos, de modo que riesgo relativo = (a/a+b)/(c/c+d).6 Si los tiempos de seguimiento son desiguales, sea por abandono, fallecimiento por una causa diferente al evento de estudio, finalización del periodo de estudio establecido en el protocolo u otros, una forma de compensarlo es realizar análisis basados en tiempo-persona o en el promedio de tiempo durante el que se ha seguido a los sujetos de la cohorte. Esto posibilita calcular la tasa de incidencia por una unidad de tiempo determinado, de modo que riesgo relativo = (a/tpe) / (c/tpne), donde tpe es el tiempo-persona de seguimiento de los sujetos expuestos y tpne es el tiempo-persona de seguimiento de los sujetos no expuestos.7 (Tabla 2.3.2)
ESTUDIO DE CASOS Y CONTROLES Un estudio de casos y controles es un estudio epidemiológico, observacional, analítico, con seguimiento retrospectivo, en el cual los sujetos se seleccionan en función de que tengan (casos) o no tengan (controles) una determinada enfermedad o, en general, un determinado evento. Una vez seleccionados los individuos de cada grupo, se investiga si estuvieron expuestos o no a una característica de interés y se compara la proporción de expuestos en el grupo de casos con la del grupo de control. Tipos de estudio de casos y controles Estudio de casos y controles retrospectivos: Todos los casos han sido diagnosticados antes del inicio del estudio. Estudio de casos y controles prospectivos: Los casos son diagnosticados con posterioridad al inicio del estudio, y así pueden incluirse los nuevos casos detectados durante un cierto tiempo establecido previamente. Estudio de casos y controles de base poblacional: Combina elementos del estudio de cohorte y de casos y controles. Se sigue a un grupo de individuos hasta que aparezca la enfermedad de interés, de igual forma que en el estudio de cohortes. Estos casos se comparan con un grupo control, cuyos componentes pertenecen a la misma población. Una vez obtenidos todos los casos y controles, se analiza el tipo de exposición previa o actual, como en un estudio de casos y controles. Este tipo de estudio es recomendable para enfermedades raras, puesto que un sujeto inicialmente identificado como control podría desarrollar el evento de interés durante el tiempo de seguimiento y ser seleccionado como caso, lo que pone en peligro el valor estadístico del estudio. Estudio de casos y controles anidados: Es un estudio caso-control en el cual tanto los casos como los controles son tomados de la población que participa en un estudio de cohortes. Como los datos de esta población se obtienen a lo largo del tiempo, se reduce la posibilidad de sesgos de selección e información, que son comunes en los diseños caso-control. Es decir, no se genera sesgo porque el sujeto puede pasar de control a caso si desarrolla el evento de estudio. 80
2.3. Estudios analíticos: cohortes y caso-control
Proceso de un estudio de casos y controles El proceso empieza seleccionando una muestra de población con la enfermedad o problema de estudio. A estos individuos se les llama casos. A continuación se selecciona una muestra de la población de riesgo que no presenta enfermedad, que será el grupo control. Finalmente, se miden las variables predictoras, que son los factores de riesgo. Ventajas de los estudios de casos y controles Los diseños de estudio de casos y controles: 1. Estudian eventos raros o enfermedades y también enfermedades con un largo periodo de latencia; además, pueden ser un estudio preliminar para conocer la asociación entre un factor de riesgo y una determinada enfermedad. 2. Permiten estudiar muestras relativamente pequeñas. 3. Requieren tiempos cortos de ejecución en comparación con los estudios de cohortes prospectivos. 4. Son relativamente baratos comparados con los estudios de cohortes (aunque los de diseño de base poblacional suelen ser más caros). 5. Determinan la odds ratio. 6. Evalúan muchos factores de riesgo para una enfermedad o suceso. Inconvenientes de los estudios de casos y controles De nuevo, también deben considerarse sus potenciales limitaciones: 1. 1Son ineficientes para el estudio de efectos de exposición raros, para los que es preferible considerar un estudio de cohorte. 2. No establecen la secuencia de eventos de interés, lo que dificulta la recogida de información fiable sobre el estado de la exposición del sujeto al evento de estudio en el tiempo. 3. Pueden incurrir en posibles errores de selección de casos y controles por la dificultad para conseguir un grupo de comparación adecuado que cumpla los criterios de Hill.8-9 Este sesgo es menor en el diseño de base poblacional. 4. Pueden dar posibles sesgos de supervivencia. 5. Sólo pueden estudiar una variable de resultado (enfermedad). 6. No proporcionan estimadores de prevalencia, incidencia o riesgo atribuible. (En el diseño de base poblacional sí se puede estimar la incidencia.) 7. Son inapropiados cuando el resultado de interés no se conoce al comienzo del estudio o cuando el resultado es una variable continua. Algunos ejemplos de estudios de casos y controles son: el estudio de las causas de las epidemias por aceite de colza y síndrome del aceite tóxico,10 el asma de soja en Barcelona,11 las neumonías y el síndrome Ardistyl.12 Análisis La medida de asociación usada normalmente en los estudios de caso-control es la razón de probabilidades, habitualmente denominada odds ratio (OR) (Tabla 2.3.1). Un estudio de caso-control no permite calcular ni la incidencia ni el RR, pero sí permite calcular la odds ratio como medida de asociación, de la siguiente manera: 1º odds entre los expuestos = a/b; 2º odds ratio entre los no expuestos = c/d; y 3º odds ratio = (a/b)/ (c/d)= ad/bc. Esta medida, en el caso concreto de los estudios “anidados”, es siempre un estimador válido del riesgo relativo que se habría obtenido en un estudio de cohortes. Mas allá de la deducción matemática de esta propiedad de las OR, varios estudios han demostrado esto empíricamente. De lo cual se deduce que 81
Manual del Investigador Novel
los resultados en un estudio de casos y controles “anidados” son virtualmente los mismos que los obtenidos en el correspondiente estudio de cohortes. Finalmente, debe mencionarse la iniciativa STROBE13 (siglas de Strengthening the Reporting of Observational Studies in Epidemiology, en español Fortalecimiento de la Presentación de estudios observacionales en epidemiología), que tanto para los estudios de cohorte o de casos y controles, como para el resto de estudios observacionales pretende incrementar la calidad de su realización, informe e interpretación. STROBE ha desarrollado recomendaciones sobre lo que debería incluirse en un informe preciso y completo de un estudio observacional en las tres grandes modalidades de estudio: de cohortes, de casos y controles y transversales. Se desarrolló un listado de 22 elementos (la declaración STROBE) que se relacionan con el título, resumen, introducción, métodos, resultados y discusión de los artículos. Por ejemplo, la obtención de muestra de estudio final debe poder reconstruirse con un diagrama de flujo de participantes (Figura 2.3.1), semejante al estándar CONSORT de un ensayo clínico. En particular, 18 puntos son comunes a los tres diseños de estudio y cuatro son específicos para la cohorte, casos y controles, o estudios transversales.14 Se estima que la declaración STROBE contribuye a mejorar la calidad de los informes de los estudios observacionales. STROBE también está disponible en castellano.15
INTERPRETACIÓN Los investigadores clínicos que tengan capacidad para integrar información de diferentes disciplinas y puedan realizar o interpretar los resultados de estudios epidemiológicos con diseño de cohortes o caso-control, entre otros, y que también puedan interactuar con otros investigadores básicos y clínicos, junto con matemáticos y bioinformáticos, tendrán ventajas añadidas al aplicar su investigación a todos los niveles. Sólo se necesita una receta de éxito para superar con creces estos nuevos desafíos: monitorizar las tendencias de las enfermedades y sus determinantes mediante la epidemiología llamada de “suela de zapato”,16-17 es decir, la epidemiología clásica, quizás complementada por Big Data y otras nuevas tecnologías,18 como la inteligencia artificial. La implementación de herramientas como las descritas recientemente será de gran ayuda.19-21 Esta nueva frontera en la investigación médica será probablemente más eficiente y potencialmente más precisa. El uso de información de las historias clínicas, en papel o en versión digital, combinadas con el texto de los informes de radiología, bioquímica, función pulmonar u otras variables fisiológicas, no es ni sencillo ni directo.20-21 Superar estos desafíos conjugando algoritmos de inteligencia artificial y aprendizaje de máquinas (machine learning), con el reconocimiento del texto libre con la tecnología de procesamiento de lenguaje natural (NLP por sus siglas en inglés) dará una verdadera “nueva vida” a los datos recogidos en las historias clínicas, que el sistema de atención médica recopila por defecto, y las oportunidades que surgen de su reutilización pueden ser más que atractivas.22-24 Para concluir, la tabla 2.3.3 resume las ventajas e inconvenientes de los estudios de casos y controles frente a los estudios de cohortes.
82
2.3. Estudios analíticos: cohortes y caso-control
PUNTOS CLAVE • Los estudios de cohorte y los de casos y controles constituyen dos tipos de estudios observacionales, no descriptivos y analíticos. • Ambos diseños de estudio son similares a pesar de usar métodos y estrategias analíticas diferentes. • La diferencia fundamental entre estos dos tipos de estudios radica en el método de selección de los sujetos de estudio, que en los primeros se basa en el grado de exposición, y en los segundos, en el evento de interés. • Estos estudios representan una alternativa válida a los estudios experimentales. No obstante, debido a su mayor complejidad y a su mayor vulnerabilidad a los diferentes sesgos, se requiere un conocimiento avanzado en el campo de la metodología y el análisis epidemiológico para poder utilizarlos sin que lleven a resultados erróneos o de difícil interpretación. • Los estudios observacionales, de cohorte y de casos y controles son fundamentales para generar hipótesis de causalidad, que idealmente deben confirmarse en ensayos clínicos controlados.
83
Manual del Investigador Novel
BIBLIOGRAFÍA 1. Kohansal R, Soriano JB, Agusti A. Investigating the natural history of lung function: facts, pitfalls, and opportunities. Chest. 2009;135:1330-1341. 2. Mannino DM, Watt G, Hole D, et al. The natural history of chronic obstructive pulmonary disease. Eur Respir J. 2006;27:627-643. 3. Kannel WB, Feinleib M, McNamara PM, et al. An investigation of coronary heart disease in families: the Framingham offspring study. Am J Epidemiol. 1979;110:281-290. 4. Zock JP, Rodríguez-Trigo G, Pozo-Rodríguez F, Barberà JA. Health effects of oil spills: lessons from the Prestige. Am J Respir Crit Care Med. 2011;184:1094-1096. 5. López-Campos JL, Peces-Barba G, Soler-Cataluña JJ, Soriano JB, De Lucas Ramos P, De-Torres JP, Marín JM, Casanova C (en nombre del grupo de estudio CHAIN). Chronic obstructive pulmonary disease history assessment in Spain: a multidimensional chronic obstructive pulmonary disease evaluation. Study methods and organization. Arch Bronconeumol. 2012;48:453-459. 6. De Stavola BL, Nitsch D, Silva ID, et al. Statistical issues in life course epidemiology. Am J Epidemiol. 2006;163:84-96. 7. LAZCANO-PONCE E, FERNANDEZ E, SALAZAR-MARTINEZ E, HERNANDEZ-AVILA M. Estudios de cohorte. Metodología, sesgos y aplicación. Salud pública Méx [online]. 2000, vol. 42, n.3, pp. 230-241. ISSN 0036-3634. http://dx.doi.org/10.1590/S0036-36342000000300010. 8. Hill AB. “The Environment and Disease: Association or Causation?”, en Proceedings of the Royal Society of Medicine, 1965;58:295-300. 9. Delgado M, Llorca J, Doménech JM. Investigación científica: Fundamentos metodológicos y estadísticos. Barcelona, Signo; 5ª ed., 2012. 10. Posada de la Paz M, Philen RM, Borda AI. Toxic oil syndrome: the perspective after 20 years. Epidemiol Rev. 2001;23:231-247. 11. Sunyer J, Antó JM, Rodrigo MJ, Morell F. Case-control study of serum immunoglobulin-E antibodies reactive with soybean in epidemic asthma. Lancet. 1989;1:179-182. 12. Solé A, Cordero PJ, Morales P, Martínez ME, Vera F, Moya C. Epidemic outbreak of interstitial lung disease in aerographics textile workers -the “Ardystil syndrome”: a first year follow up. Thorax. 1996;51:9495. 13. Vandenbroucke JP, Von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ, Poole C, Schlesselman JJ, Egger M; STROBE initiative Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): explanation and elaboration. Ann Intern Med. 2007;147:163-194. 14. http://www.strobe-statement.org/index.php?id=available-checklists [acceso el 21 de dic. de 15]. 15. Von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; Iniciativa STROBE. Declaración de la Iniciativa STROBE (Strengthening the Reporting of Observational studies in Epidemiology): directrices para la comunicación de estudios observacionales. Gac Sanit. 2008;22:144-150. 16. Koo D, Thacker SB. In Snow’s Footsteps: Commentary on Shoe-Leather and Applied Epidemiology. Am J Epidemiol. 2010;172:737-739. 17. Tong SY. Genomic polish for shoe-leather epidemiology. Nat Rev Microbiol. 2013;11(1):8. 18. Gené Badia J, Gallo de Puelles P, De Lecuona I. Big data y seguridad de la información. Aten Primaria. 2018;50(1):3-5. 19. Johnston IG, Hoffmann T, Greenbury SF, Cominetti O, Jallow M, Kwiatkowski D, Barahona M, Jones NS, Casals-Pascual C. Precision identification of high-risk phenotypes and progression pathways in severe malaria without requiring longitudinal data. NPJ Digit Med. 2019;10:2:63. 20. Divita G, Carter M, Redd A, Zeng Q, Gupta K, Trautner B, Samore M, Gundlapalli A. Scaling-up NLP Pipelines to Process Large Corpora of Clinical Notes. Methods Inf Med. 2015;54(6):548-552.
84
2.3. Estudios analíticos: cohortes y caso-control
21. MacRae J, Darlow B, McBain L, Jones O, Stubbe M, Turner N, Dowell A. Accessing primary care Big Data: the development of a software algorithm to explore the rich content of consultation records. BMJ Open. 2015;5(8):e008160. 22. Hernández-Medrano I, Carrasco G. El profesional de la salud ante el mundo del Big Data. Rev Calid Asist. 2016;31(5):250-253.
85
Manual del Investigador Novel
TABLAS Y FIGURAS Tabla 2.3.1. Tabla de 2x2 y su análisis Enfermos
No enfermos
Expuestos
a
b
a+b
No expuestos
c
d
Prueb
a+b
b+d
N
Análisis para un estudio de cohorte: Permite calcular la incidencia en cada grupo y el riesgo relativo en los expuestos respecto a los no expuestos Riesgo relativo = (a/a+b)/(c/c+d) Incidencia en el grupo de expuestos: a/(a+b) Incidencia en el grupo de no expuestos: c/(c+d) Diferencia de incidencia acumulada: a/(a+b) – c/(c+d) (Si la exposición es protectora, se calcula al revés: c/(c+d) - a/(a+b) ) Análisis para un estudio caso-control: No permite calcular la incidencia ni el RR, pero sí permite calcular la odds ratio como medida de asociación. Odds entre los expuestos = a/b Odds entre los no expuestos = c/d Odds ratio = (a/b)/(c/d) = ad/bc
86
2.3. Estudios analíticos: cohortes y caso-control
Tabla 2.3.2. Principales diseños de estudios en Epidemiología
Ensayos clínicos
Temporalidad
Estudiar los factores de riesgo de una enfermedad Evaluar las intervenciones terapéuticas Identificar las causas de epidemias
Estudiar factores de riesgo de las enfermedades Establecer tasas de incidencia Estudiar la historia natural de las enfermedades Establecer pronóstico
Individuo
Individuo/grupo
Individuo
Individuo
Prospectivos
Retrospectivos
Retrospectivos
Prospectivos o retrospectivos
“Libres” de sesgos mayormente
Económicos, rápidos y sencillos Permiten estudiar diferentes exposiciones y enfermedades al mismo tiempo Habitualmente representan a la población general
Económicos, rápidos y sencillos Permiten estudiar diversas exposiciones de una enfermedad Útiles para enfermedades raras
Conceptualmente sencillos Permiten estudiar todos los efectos asociados a una exposición
No permiten probar hipótesis No permiten hacer inferencias etiológicas causales (¿un factor es causa o efecto?) Sólo identifican casos prevalentes (no incidentes) de enfermedad
Sólo permiten estudiar un efecto asociado a una o más exposiciones Susceptibles de error de medida (evaluación retrospectiva de los factores de exposición) y de sesgo de selección
Costosos y lentos (requieren largos períodos) Poco útiles para enfermedades raras o con largos períodos de latencia
Medical Research Council Working Party. Long term domiciliary oxygen therapy in chronic hypoxic cor pulmonale complicating chronic bronchitis and emphysema. Lancet 1981;1):681-6.
Teran-Santos J, Jimenez-Gomez A, Cordero-Guevara J. The association between sleep apnea and the risk of traffic accidents. Cooperative Group Burgos-Santander. N Engl J Med 1999;340:847-51.
Doll R, Peto R. Mortality in relation to smoking: 20 years’ observations on male British doctors. Br Med J 1976;2:1525-36.
Sobradillo V, Miravitlles M, Jimenez CA, Gabriel R, Viejo JL, Masa JF, Fernandez-Fau L, Villasante C. [Epidemiological study of chronic obstructive pulmonary disease in Spain (IBERPOC): prevalence of chronic respiratory symptoms and airflow limitation] Arch Bronconeumol Objetivo: Estudiar la efectividad de la oxigenotera- 1999;35:159-66.
Ejemplo
Estudios de cohorte
Investigar la prevalencia de enfermedades Estudiar la relación de las enfermedades con exposiciones “fijas” de los individuos (sexo, raza…) Generar hipótesis
Ventajas
Inconvenientes
Estudios de casos y controles
Comparar tratamientos (preventivos o terapéuticos)
Usos
Unidad de análisis
Estudios transversales
Objetivo: Estudiar la relación entre el hábito Objetivo: Estudiar la tabáquico y la mortalidad. relación entre apnea del Diseño y sujetos: Cohorte pia crónica do sueño y accidentes de de más de 34000 hombres Objetivo: Estudiar la miciliaria en pacientes tráfico. que respondieron en 1951 prevalencia de síntomas respiratorios crónicos. Diseño y sujetos: Casos un cuestionario sobre respiratorios crónicos y Diseño y sujetos: Ensayo y controles. Casos: 102 tabaco y fueron seguidos limitación crónica al fl ujo clínico. Pacientes (n=87) con conductores visitados en durante 20 años. bronquitis crónica o enfisema aéreo en España. urgencias tras accidentes Resultados: La razón de Diseño y sujetos: Estudio con obstrucción irreversible de tráfico. Controles: 152 riesgo de morir en los transversal en 7 áreas del flujo aéreo, insuficiencia sujetos seleccionados al fumadores respecto a españolas. Selección de una respiratoria e insuficiencia azar a partir de atención muestra aleatoria poblacional primaria de la misma zona los no fumadores de la cardíaca congestiva, misma edad fue de 2. Las de más de 4000 sujetos entre aleatorizados a grupo geográfica, apareados por causas de muerte asocia40 y 69 años a partir del censo. sexo y edad. tratamiento (oxígeno das al tabaco fuer Resultados: Se encontraron las Resultados: Los sujetos domicilario mínimo 15h/d) on enfermedad cardíaca, siguientes prevalencias: o control (no oxígeno). con índice de cáncer de pulmón, síntomas respiratorios crónicos Resultados: Tras 5 años de apnea-hipopnea igual o enfermedad pulmonar 48% (IC 95%:46.4-49.5), seguimiento, murieron el mayor a 10 mostraron una obstructiva crónica y bronquitis crónica 4.8% (4.145% de los sujetos en el grupo razón de odds de 6.3 (IC enfermedades vasculares. 5.4), asma 4.9% (4.2-5.5), tratamiento y el 67% en el 95%: 2.4-16.2) de tener un limitación crónica al fl ujo grupo control. No se accidente de tráfico, observaron diferencias en los aéreo 10.6 (9.6-11.5). Excepto independiente de días de estancia hospitalaria o el asma, todos los trastornos confusores como ingesta fueron más frecuentes en de ausencia laboral. de alcohol, consumo de hombres que en mujeres y en fármacos u otros. fumadores o exfumadores que en no-fumadores. Se encontraron diferencias geográficas importantes entre áreas. 87
Manual del Investigador Novel
Tabla 2.3.3. Pros y contras de los estudios de casos y controles frente a los de cohortes Características
Casos y controles
Cohortes
Conocer historia natural enfermedad
Mal
Bien
Planificación
Mejor en prospectivos
Bien
Incidencia
No (sí en híbridos)
Sí
Cálculo de riesgos
Parcial
Todos
Valoración de exposición
Tras efecto
Mejor, sobre todo si hay cambios en el tiempo
Multiefectividad
No
Sí
Sesgos
Muchos
Pocos
Influencia de la mortalidad
Difícil de estudiar
Más fácil
Control de calidad de la información
Más difícil
Más fácil
Exposiciones raras
No
Sí
Enfermedades raras
Sí
No
Coste
Variable (menor que las cohortes prospectivas)
Variable (en general más caros)
Tiempo
Menor que las cohortes prospectivas
Mayor en las cohortes prospectivas
Reproducibilidad
Alta
Escasa (prospectivos)
Intervención
No
Sí, aunque discreta
Cantidad de personal
Depende
Depende
Pérdidas
No
Sí
Riesgo de obsoleto
Bajo
Mayor
Como exploratorios
Sí
No
Asociaciones débiles entre exposición y respuesta
No
Sí
Comprensibilidad
Baja
Alta
88
2.3. Estudios analíticos: cohortes y caso-control
Figura 2.3.1. Ejemplo de diagrama de flujo STROBE (adaptado de referencia 12)
89
Manual del Investigador Novel
90
2.4. Estudios experimentales y cuasi experimentales
2.4. ESTUDIOS EXPERIMENTALES Y CUASI EXPERIMENTALES Dra. Carmen Fuentelsaz Gallego
INTRODUCCIÓN Los estudios experimentales, también llamados estudios de intervención, son estudios de tipo analítico que permiten conocer la relación entre la variable independiente (la intervención que se realiza) y la o las dependientes (las principales variables de resultado, que son las que se verán afectadas por la intervención). La principal diferencia entre ambos tipos es que en los estudios experimentales se realiza una intervención, mientras que en los estudios observacionales sólo se observan determinadas características de los sujetos de estudio (Figura 2.4.1). En los estudios experimentales hay, al menos, una intervención (o manipulación), puede haber un grupo control y uno experimental, y una asignación aleatoria a ambos grupos. Son realmente experimentales cuando hay una intervención, grupo control y experimental y asignación aleatoria a ambos grupos. Se consideran cuasi experimentales cuando no hay grupo control y experimental o, en caso de que los haya, cuando la asignación a ambos grupos no se realiza de forma aleatoria.
ESTUDIOS EXPERIMENTALES Características Los estudios experimentales (también llamados ensayos clínicos) son de tipo prospectivo, es decir, se hace un seguimiento de los sujetos de estudio para ver el efecto de la intervención.1-3 Por tanto, el objetivo de estos estudios es conocer si una intervención es más eficaz o efectiva que otra. Esto es, cuando se plantea una hipótesis de superioridad, pero también se pueden plantear hipótesis de no inferioridad o de equivalencia.4 El esquema de un estudio experimental se presenta en la figura 2.4.2. Como cualquier otro tipo de estudio, se inicia definiendo las características de la población de referencia mediante los criterios de selección, es decir, los criterios de inclusión y los de exclusión, que deben estar claramente determinados. En estos estudios, los criterios de selección suelen ser muy estrictos, sobre todo en los ensayos clínicos con medicamentos, lo que puede perjudicar su validez externa. 91
Manual del Investigador Novel
Si la población de referencia es demasiado grande, por lo que no es pertinente estudiarla toda, se seleccionará una muestra de sujetos, que serán los que realmente se estudiarán. Para ello, se debe estimar el tamaño de muestra necesario para poder valorar el efecto de la intervención en la variable principal de resultado y se debe determinar la técnica de muestreo a utilizar. Cabe señalar la diferencia entre la técnica de muestreo aleatoria y la asignación aleatoria a los grupos control y experimental, ya que a veces son términos que se confunden. La técnica de muestreo es la que se utiliza para seleccionar la muestra de la población de referencia. En los estudios experimentales no se suele utilizar una técnica de muestreo aleatoria (aunque sería lo ideal), y generalmente se utiliza un muestreo consecutivo, incluyendo a los sujetos a medida que van ingresando en el hospital o acuden a la consulta. La asignación es la forma en que se decide si los sujetos de estudio se incluyen en el grupo control o en el grupo experimental. Esta asignación debe ser aleatoria, es decir, al azar, de forma que cualquier sujeto tenga la misma probabilidad de formar parte del grupo control que del grupo experimental. Lo más habitual es utilizar programas estadísticos para hacer la asignación, mediante la generación de números aleatorios. Con la asignación aleatoria se consigue que los grupos sean comparables, lo que significa que sus características al inicio del estudio (llamadas características basales) son muy similares (aunque esta similitud no se puede garantizar al 100%) y que las variables que pueden influir en la relación entre la intervención realizada y las variables de resultado se distribuyen de igual forma en ambos grupos. Por lo tanto, si se encuentran diferencias entre el grupo control y el experimental al final del estudio, se podría afirmar que son debidas al efecto de la intervención, no a que los grupos fuesen diferentes cuando se inició el estudio. Las características basales suelen ser variables sociodemográficas, clínicas u otras de interés. Esta asignación a los grupos experimental y control debe ser oculta, lo que significa que las personas implicadas en el estudio no deben conocer ni tener acceso a la secuencia de inclusión de los participantes a cada grupo. Cuando se va asignando cada participante al grupo control o al experimental, se le realizará la intervención que le corresponda. En general, al grupo experimental se le realiza el tratamiento nuevo a experimentar, y al grupo control, el tratamiento habitual o un placebo (aunque éste último no siempre es posible utilizarlo). En el caso de que se realice este tratamiento habitual o de que se impartan los cuidados enfermeros habituales, habrá que definirlos muy bien, puesto que pueden ser diferentes según el centro donde se desarrolle el estudio. Ambos grupos deben ser tratados de la forma más similar posible a lo largo del estudio, a excepción de la intervención asignada. Lo habitual es que los sujetos del grupo control y del grupo experimental reciban la intervención al mismo tiempo, por lo que el estudio se denomina “ensayo clínico paralelo”. En caso contrario, será no paralelo. Se deben indicar y definir claramente las variables principales del estudio: la independiente, que será la intervención a realizar, y la variable principal de resultado. Deben indicarse y describirse las intervenciones que se harán al grupo control y al grupo experimental. También hay que describir claramente cuál o cuáles son las variables principales de resultado, que preferiblemente deben poder medirse de forma objetiva, para no incluir sesgos en el estudio. Para que el estudio tenga mayor calidad y rigor metodológico, se pueden utilizar las técnicas de cegamiento o ciego: 92
2.4. Estudios experimentales y cuasi experimentales
1. Ensayo clínico abierto o no ciego. Tanto el investigador como el sujeto de estudio conocen el grupo al que ha sido asignado dicho sujeto. 2. Simple ciego. Los participantes desconocen si han sido asignados al grupo control o al experimental. 3. Doble ciego. Tanto el investigador como el sujeto de estudio desconocen el grupo al que ha sido asignado dicho sujeto. 4. Triple ciego. Además de los participantes y el investigador, tampoco la persona que analiza los resultados del ensayo conoce el grupo al que ha sido asignado el sujeto. 5. Evaluación ciega por terceros. Cuando no se puede utilizar alguna de las técnicas de ciego anteriores, la opción es realizar una evaluación ciega por terceros, en la que una persona, generalmente ajena al equipo investigador y que desconoce el grupo al que ha sido asignado cada sujeto, evalúa la variable principal de resultado. El equipo investigador determinará el tiempo de seguimiento que se realizará a los participantes en el estudio. Al final de este periodo se medirá la variable principal de resultado, para ver si ha habido cambios tras la intervención en cada uno de los dos grupos. En esta fase de seguimiento es muy importante controlar las pérdidas de participantes en cada grupo, las causas de estas pérdidas y las características de dichos sujetos, así como los efectos adversos que se puedan producir, para saber si pueden estar relacionados con la intervención realizada a cada sujeto. También se deberán tener en cuenta los incumplidores del tratamiento asignado, tanto en el grupo control como en el experimental, para evaluar si el incumplimiento tuviese relación con dicho tratamiento. Además del diseño clásico del ensayo clínico que se ha mostrado en la figura 2.4.3, existen otros tipos, como el “ensayo clínico cruzado”, en el que cada sujeto es su propio control, por lo que todos los participantes reciben los dos tratamientos o intervenciones. A la mitad de los sujetos de la muestra se les asigna de forma aleatoria al tratamiento A o al B, y después de un periodo (llamado de blanqueo o de lavado, para que los efectos del tratamiento recibido desaparezcan), se les cambia el tratamiento, a los que recibieron el A se les asigna el B, y viceversa. Cuando en un estudio experimental la intervención no se realiza sobre cada uno de los individuos sino que se realiza sobre un grupo o sobre una comunidad de la que forman parte dichos individuos, estos estudios se denominan “ensayos comunitarios”. Generalmente se evalúan intervenciones relacionadas con hábitos de salud. Los resultados obtenidos en el estudio son del grupo, no se pueden extraer de cada individuo en particular. Un grupo de expertos ha elaborado unas recomendaciones para la publicación de estudios experimentales en revistas científicas, pero que pueden ser útiles para investigadores noveles que deseen desarrollar un estudio de este tipo. Estas directrices se recogen en la lista de comprobación CONSORT (Consolidated Standards of Reporting Trials).5 En la página web del grupo (http://www.consort-statement.org/) se pueden consultar diferentes instrumentos según el tipo de estudio (ensayos grupales, no inferioridad y equivalencia y ensayos pragmáticos),6-8 según el tipo de intervención (hierbas medicinales, tratamientos no farmacológicos y acupuntura)9-11 u otros instrumentos (efectos adversos y elaboración de resúmenes).12-13 Ventajas y limitaciones A continuación se señalan algunas de las principales ventajas de los estudios experimentales. • Una de las mayores ventajas de los estudios experimentales es el control que los investigadores tienen sobre el diseño del estudio. Se puede controlar tanto la intervención que se realiza como todo el desarrollo del estudio y, por tanto, las condiciones en que se realiza el ensayo. 93
Manual del Investigador Novel
• Cuando se trata de evaluar efectividad o eficacia, son los que aportan un mayor nivel de evidencia científica y, en consecuencia, una mayor calidad de la evidencia. • El riesgo de introducir sesgos en los ensayos clínicos es menor que en otro tipo de estudios epidemiológicos, debido principalmente a la asignación aleatoria a los grupos control y experimental, que permite que las variables confusoras se distribuyan de igual forma en ambos grupos. • Son estudios fácilmente reproducibles. Y si las intervenciones evaluadas y las variables principales de resultado son iguales que las de otros estudios, los resultados obtenidos serán fácilmente comparables. • Se pueden utilizar técnicas de ciego, lo que reduce el riesgo de introducir en el ensayo sesgos de información. Estos estudios también presentan una serie de limitaciones, que se detallan a continuación. • Una de las principales limitaciones es la dificultad para generalizar los resultados. Con el control estricto del diseño del ensayo se garantiza la validez interna, pero a veces la validez externa se ve perjudicada debido a los estrictos criterios de selección de los participantes y también a la propia intervención, que puede alejarse de la práctica habitual e imposibilitar que se trasladen los resultados a la práctica. • Muchas veces son estudios de elevado coste, dependiendo de las intervenciones que se realicen y del tiempo de seguimiento de los participantes. • También pueden presentar limitaciones de tipo ético, debido a la asignación aleatoria de las intervenciones a evaluar, sobre todo cuando la intervención del grupo control es menos efectiva que la del grupo experimental. • En cada estudio sólo se podrá evaluar una intervención experimental, ya que, si se realiza más de una, no se sabrá a qué intervención se debe el efecto producido. • Con los estudios experimentales sólo se pueden responder las preguntas de investigación relacionadas con efectividad o eficacia, por lo que muchas otras preguntas no se pueden responder con este tipo de estudios.
ESTUDIOS CUASI EXPERIMENTALES Características Los diseños cuasi experimentales son también muy utilizados en investigación clínica, ya que a veces no es posible tener un grupo control y otro experimental o asignar a los participantes de forma aleatoria a dichos grupos.14 Seguidamente, se exponen algunos diseños de este tipo. a. Cuasi experimentales pretest-postest con grupo control. La intervención sólo se realiza en el grupo experimental, mientras que al grupo control se le realizan las mismas mediciones de la variable de resultado pero no se le hace ninguna intervención. Las mediciones se efectúan antes y después de la intervención. A veces, en este tipo de estudios también se realiza una intervención en el grupo control. b. Cuasi experimentales postest con grupo control. En este tipo de estudios, aunque hay grupo experimental y control, sólo se hace una medición de la variable de resultado tras la realización de la intervención, no se realiza la medición previa a la intervención. c. Cuasi experimentales pretest-postest de un solo grupo. Después de incluir a los sujetos en el estudio, se les realiza una primera medición, a continuación se les hace la intervención y finalmente se les hace otra medición para ver el efecto de la intervención.
94
2.4. Estudios experimentales y cuasi experimentales
Ventajas y limitaciones Loa estudios cuasi experimentales son más fáciles de desarrollar que los experimentales y, por tanto, más económicos en cuanto a recursos materiales, personales y de tiempo. Además, a veces son la única alternativa para responder a la pregunta de investigación. En ocasiones, la validez externa es más factible que en los experimentales. La principal limitación de estos estudios es que no hay asignación aleatoria a los grupos control y experimental, por lo que puede darse el caso de que los grupos no sean homogéneos y, por tanto, no se puedan comparar. Además, la inclusión de sesgos es más fácil en estos estudios que en los experimentales.
PRINCIPALES SESGOS EN LOS ESTUDIOS EXPERIMENTALES Y CUASI EXPERIMENTALES Como con cualquier otro tipo de diseño, en los estudios experimentales y cuasi experimentales se deben evitar o minimizar los sesgos para no perjudicar la validez interna del estudio. Los principales sesgos de estos diseños están relacionados con la selección de los pacientes, la asignación aleatoria a los grupos control y experimental, la realización de la intervención y el seguimiento de los participantes. Se producirá un sesgo de selección cuando haya diferencias en los grupos control y experimental al inicio del estudio. Este sesgo se evitará o minimizará definiendo claramente los criterios de selección de los participantes (criterios de inclusión y exclusión), con la estimación del tamaño muestral y con la asignación aleatoria oculta a ambos grupos. Cabe señalar, que la primera fase del análisis estadístico en estos estudios será comprobar que los dos grupos, experimental y control, sean similares en las variables definidas como basales y, por tanto, sean comparables, ya que la asignación aleatoria no garantiza totalmente que los grupos sean homogéneos. Cuando el estudio ya se ha iniciado, se puede producir un sesgo de realización cuando se hace la intervención en los grupos control y experimental, si se dan diferencias en la atención habitual proporcionada a ambos grupos, a parte de la intervención que se evalúe. Este sesgo se puede evitar utilizando las técnicas de ciego indicadas anteriormente.15 Otro sesgo que se puede introducir en estos estudios es el de seguimiento (llamado también de desgaste o pérdida), cuando los participantes que finalizan el estudio tienen características diferentes a los que lo han abandonado. Para evitar este sesgo, debemos hacer un buen control del seguimiento de los participantes y registrar con todo detalle la información sobre las pérdidas o abandonos, sus causas y las características de todos los sujetos perdidos. Otra forma de evitarlo es con un análisis estadístico de los datos al finalizar el estudio, realizando el llamado análisis por intención de tratar. Se trata de hacer el análisis con los sujetos dentro del grupo al que han sido asignados inicialmente, independientemente del grupo en el que finalicen el estudio y de la intervención recibida.16 En los estudios cuasi experimentales, como no hay asignación aleatoria o no hay grupo control, es mucho más fácil y frecuente que se produzcan sesgos.
95
Manual del Investigador Novel
ENSAYO CLÍNICO CON MEDICAMENTOS Como se ha comentado anteriormente, un estudio experimental se denomina también ensayo clínico, aunque algunos ensayos tienen unas implicaciones legales y administrativas que otros estudios experimentales no tienen. Los estudios que se realizan con medicamentos o con algunos productos sanitarios deben cumplir una serie de requisitos marcados por la legislación española17 y por la europea.18 En el Real Decreto 1090/201517 se indican los diferentes conceptos relacionados con este tipo de estudios: ensayo clínico, medicamento de investigación, comités de ética de la investigación con medicamentos, etc. Ensayo clínico. “Un estudio clínico que cumpla cualquiera de las siguientes condiciones: 1) Se asigna de antemano al sujeto de ensayo a una estrategia terapéutica determinada, que no forma parte de la práctica clínica habitual del Estado miembro implicado; 2) La decisión de prescribir los medicamentos en investigación se toma junto con la de incluir al sujeto en el estudio clínico; 3) Se aplican procedimientos de diagnóstico o seguimiento a los sujetos de ensayo que van más allá de la práctica clínica habitual.” Medicamento de uso humano: “Toda sustancia o combinación de sustancias que se presente como poseedora de propiedades para tratamiento o prevención de enfermedades en seres humanos o que pueda usarse en seres humanos o administrarse a seres humanos con el fin de restaurar, corregir o modificar las funciones fisiológicas ejerciendo una acción farmacológica, inmunológica o metabólica, o de establecer un diagnóstico médico”. Reacción adversa. “Cualquier respuesta nociva y no intencionada a un medicamento”. Producto sanitario. “Cualquier instrumento, dispositivo, equipo, programa informático, material u otro artículo, utilizado solo o en combinación, incluidos los programas informáticos destinados por su fabricante a finalidades específicas de diagnóstico y/o terapia y que intervengan en su buen funcionamiento, destinado por el fabricante a ser utilizado en seres humanos.”
CONSIDERACIONES ÉTICAS DE LOS ESTUDIOS EXPERIMENTALES Todos los estudios clínicos deben ser aprobados por un Comité de Ética de la Investigación con Medicamentos (CEIM). El CEIM revisará que el estudio cumpla todos los requisitos legales y administrativos, así como los aspectos metodológicos, que en ocasiones tienen repercusión en la seguridad de los participantes. Entre los aspectos importantes a revisar, cabe destacar: evaluar el balance riesgo/beneficio para los participantes; evaluar las modificaciones de la práctica habitual y las intervenciones invasivas; tener en consideración las poblaciones vulnerables (niños, ancianos, mujeres embarazadas, etc.); y respetar en todo momento la ley de protección de datos de carácter personal. Antes del inicio del estudio, todos los participantes deben tener información del estudio y deben firmar un consentimiento para su participación. En el capítulo II del Real Decreto 1090/2015,17 se indican todos los aspectos relacionados con la protección de los sujetos del ensayo y del consentimiento informado.
96
2.4. Estudios experimentales y cuasi experimentales
PUNTOS CLAVE • En los estudios observacionales los investigadores no realizan ninguna intervención, en cambio en los experimentales sí. Esta es la principal diferencia entre ambos diseños. • Las tres características fundamentales de los estudios experimentales son: manipulación (intervención) por parte del investigador, grupo control y grupo experimental y asignación aleatoria a ambos grupos. • Los aspectos más importantes en el diseño de los estudios experimentales son: los criterios de selección, la asignación aleatoria a los grupos control y experimental y el control en el seguimiento de pérdidas, abandonos y efectos adversos. • Para evaluar efectividad o eficacia, los estudios experimentales aportan el nivel de evidencia más elevado. • En los estudios cuasi experimentales se pueden producir más sesgos que en los experimentales. • Los estudios con medicamentos o productos sanitarios deben seguir las pautas indicadas en la legislación española y europea.
97
Manual del Investigador Novel
BIBLIOGRAFÍA 1. Bermejo B. Estudios experimentales. Matronas Prof. 2008;9(1):15-20. 2. Manterola C, Otzen T. Estudios experimentales. 1ª Parte. El ensayo clínico. Int J Morphol. 2015;33(1):342349. 3. Laporte JR. Principios básicos de investigación clínica.. Barcelona: AstraZeneca, 2ª ed., 2001. Disponible en: http://www.icf.uab.cat/llibre/llibre.htm. 4. Delgado O, Puigventós F, Pinteño M, Ventayol P. Equivalencia terapéutica: concepto y niveles de evidencia. Med Clin (Barc). 2007;129(19):736-745. 5. Cobos A. Ensayos clínicos aleatorizados (CONSORT). Med Clin (Barc). 2005;125(Supl. 1):21-27. 6. Campbell MK, Piaggio G, Elbourne DR, Altman DG; CONSORT Group. Consort 2010 statement: extension to cluster randomised trials. BMJ. 2012;345:e5661. Doi: 10.1136/bmj.e5661. 7. Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJ; CONSORT Group. Reporting of noninferiority and equivalence randomized trials: an extension of the CONSORT statement. JAMA. 2006;295(10):1152-1160. 8. Zwarenstein M, Treweek S, Gagnier JJ, Altman DG, Tunis S, Haynes B, et al; CONSORT group; Pragmatic Trials in Healthcare (Practihc) group. Improving the reporting of pragmatic trials: an extension of the CONSORT statement. BMJ. 2008; 337:a2390. doi: 10.1136/bmj.a2390. 9. Boutron I, Moher D, Altman DG, Schulz KF, Ravaud P; CONSORT Group. Methods and processes of the CONSORT Group: example of an extension for trials assessing nonpharmacologic treatments. Ann Intern Med. 2008;148(4):60-66. 10. Gagnier JJ, Boon H, Rochon P, Moher D, Barnes J, Bombardier C; CONSORT Group. Reporting randomized, controlled trials of herbal interventions: an elaborated CONSORT statement. Ann Intern Med. 2006;144(5):364-367. 11. MacPherson H, Altman DG, Hammerschlag R, Youping L, Taixiang W, White A, Moher D; STRICTA Revision Group. Revised Standards for Reporting Interventions in Clinical Trials of Acupuncture (STRICTA): extending the CONSORT statement. PLoS Med. 2010;7(6):e1000261. 12. Hopewell S, Clarke M, Moher D, Wager E, Middleton P, Altman DG, Schulz KF and the CONSORT Group (2008) CONSORT for reporting randomised trials in journal and conference abstracts. Lancet. 371:281-283. 13. Ioannidis JP, Evans SJ, Gøtzsche PC, O’Neill RT, Altman DG, Schulz K, et al; CONSORT Group. Better reporting of harms in randomized trials: an extension of the CONSORT statement. Ann Intern Med. 2004;141(10):781-788. 14. Manterola C, Otzen T. Estudios experimentales 2ª Parte. Estudios Cuasi-Experimentales. Int J Morphol. 2015;33(1):382-387. 15. Rodríguez JL, Casado A. Doble ciego. El control de los sesgos en la realización de ensayos clínicos. Contradicciones, insuficiencias e implicaciones. Med Clin (Barc). 2002;118(5):192-195. 16. Abraira V. ¿Qué es el análisis por intención de tratar?. SEMERGEN. 2000;26:393-394. 17. Boletín Oficial del Estado. Nº 307, jueves 24 de diciembre de 2015. Real Decreto 1090/2015, de 4 de diciembre, por el que se regulan los ensayos clínicos con medicamentos, los Comités de Ética de la Investigación con medicamentos y el Registro Español de Estudios Clínicos. 18. Diario Oficial de la Unión Europea del 27/05/2014. Reglamento (UE) Nº 536/2014 del Parlamento Europeo y del Consejo, sobre los ensayos clínicos de medicamentos de uso humano.
98
2.4. Estudios experimentales y cuasi experimentales
TABLAS Y FIGURAS Figura 2.4.1. Estudios experimentales y cuasi experimentales
99
Manual del Investigador Novel
Figura 2.4.2. Esquema de los estudios experimentales
E = enfermedad o característica en estudio
Figura 2.4.3. Esquema de los ensayos cruzados
100
2.5. Tipos de error. Validez, sesgos y confusión
2.5. TIPOS DE ERROR. VALIDEZ, SESGOS Y CONFUSIÓN Dra. Judith García Aymerich
EL ERROR EN INVESTIGACIÓN Cualquier trabajo de investigación puede ser considerado un ejercicio de medida y, como tal, es propenso a tener errores. Tales errores pueden resultar en infra o sobreestimaciones de la prevalencia de exposiciones o enfermedades así como provocar asociaciones falsas u ocultar asociaciones verdaderas entre exposiciones y enfermedades. A menudo, estas situaciones llevan a contradicciones entre estudios y suscitan críticas externas a la investigación como disciplina. Por ello, es esencial que los investigadores tengan formación sobre los diferentes tipos de errores y sus causas. Existen múltiples fuentes de error, que además pueden coexistir. En general, el error se clasifica en aleatorio y sistemático. Este capítulo revisa, en primer lugar, las definiciones, causas, efectos y métodos para evaluar los errores aleatorios y sistemáticos. A continuación se presenta y discute el concepto de validez externa, tradicionalmente explicado junto con el error sistemático. Posteriormente se presentan los métodos para evitar o reducir los errores aleatorio y sistemático. Finalmente, se revisan algunos equívocos frecuentes en torno a los errores, para concluir con unas consideraciones finales. El capítulo se acompaña de ejemplos reales e hipotéticos que, por simplificación para fines pedagógicos, se limitan a preguntas de investigación sobre prevalencia (de exposición o enfermedad) o sobre asociación entre exposición y enfermedad.
ERROR ALEATORIO. PRECISIÓN Definición, causas y efectos del error aleatorio El error aleatorio se puede definir como “aquella parte de nuestra experiencia que no podemos predecir”,1 y puede atribuirse al fenómeno biológico que se está midiendo o al propio proceso de medición.2 La ausencia de error aleatorio se denomina precisión (Figura 2.5.1). La principal fuente de error aleatorio en investigación es el uso de muestras para estudiar fenómenos de poblaciones. Ante la imposibilidad de estudiar toda una población, las mediciones se realizan en una muestra de sujetos, que puede representar erróneamente el conjunto de dicha población. Por este motivo, el error aleatorio se denomina a menudo error muestral. Otra fuente de error aleatorio relacionada con el error muestral es la ineficiencia muestral. La eficiencia muestral se define como la capacidad de maximizar la 101
Manual del Investigador Novel
información obtenida y requiere disponer de suficientes sujetos en todas las categorías de interés. Si no se contempla la eficiencia muestral, puede suceder que, incluso con un tamaño muestral elevado, el tamaño de ciertos subgrupos de interés (por ejemplo, “sujetos de 30-45 años no fumadores con hipertensión”) sea reducido y se convierta en fuente de error aleatorio. Finalmente, la variabilidad en un mismo individuo, los instrumentos de medida, los entrevistadores o incluso el proceso de entrada de datos pueden también ser origen de error aleatorio. El error aleatorio tiene tantas probabilidades de provocar observaciones individuales con valores superiores a los reales como inferiores a éstos. Como consecuencia, la media de las observaciones individuales tiende a acercarse al valor real. Evaluación del error aleatorio Para tener en cuenta la presencia de error aleatorio, los resultados de las investigaciones no se presentan a través de un único valor (estimación puntual) sino que se acompañan de medidas de precisión (intervalo de confianza, desviación estándar u otras). Estas medidas informan del intervalo de valores que es probable que incluyan el valor real. Para evaluar el error aleatorio se utilizan las pruebas de contraste de hipótesis, que estiman la probabilidad de que el resultado de una investigación se haya obtenido por azar. Estas pruebas, detalladas en los capítulos 26-32, son las que proporcionan los familiares “valores de p”.
ERROR SISTEMÁTICO. VALIDEZ El error sistemático o sesgo se define como la diferencia sistemática entre un valor observado y el valor real.3 La ausencia de error sistemático se denomina validez. El término sesgo también significa prejuicio y, aunque no se discute en este capítulo, es importante reconocer que los prejuicios (opiniones preconcebidas y preferencias) de los investigadores también pueden producir sesgo al interpretar los resultados de una investigación.4 En general, el error sistemático en las investigaciones se debe a factores implicados en el proceso de selección de sujetos y a factores que intervienen en la definición y medición de las variables del estudio. Así, aunque se han descrito múltiples tipos de sesgos, se distinguen tres grandes grupos: el sesgo de selección, el sesgo de información y la confusión (o sesgo de confusión). Sesgo de selección. Definición, causas y efectos El sesgo de selección se define como la distorsión en los resultados de una investigación debida a errores sistemáticos en el proceso de identificación, selección o seguimiento de los sujetos a estudiar. Este sesgo se relaciona inversamente con la representatividad, definida como el grado de similitud entre las características de los sujetos participantes y las de todos los sujetos elegibles (participantes y no participantes). En general, la relación entre la exposición y la enfermedad de los sujetos participantes es distinta a la de los sujetos elegibles. Como resultado, la asociación observada en los participantes es una combinación entre la asociación real (la que se habría observado en todos los sujetos elegibles) y los efectos de los factores que determinan la participación. La tabla 2.5.1 describe diversos ejemplos de sesgo de selección.5 El sesgo de selección puede alterar los resultados en cualquier sentido.
102
2.5. Tipos de error. Validez, sesgos y confusión
Sesgo de información. Definición, causas y efectos El sesgo de información se define como la distorsión en los resultados de la investigación debida a errores sistemáticos en la medida de la exposición, la enfermedad u otras variables relevantes para un estudio. Si este error se produce en la medida de la exposición, da lugar a la denominada “mala clasificación de la exposición”, es decir, algunos sujetos clasificados como expuestos en realidad no lo están, y viceversa. Si el error se produce en la medida de la enfermedad, da lugar a la llamada “mala clasificación de la enfermedad”, es decir, algunos sujetos clasificados como enfermos en realidad no lo son, y viceversa. La tabla 2.5.2 muestra diversos ejemplos de sesgo de información. Las consecuencias del sesgo de información dependen de si la mala clasificación se presenta de forma diferencial o de forma no diferencial entre los grupos de interés. La mala clasificación diferencial es aquella que depende de otras variables. Por ejemplo, en un estudio sobre el riesgo de malformaciones congénitas potencialmente atribuibles a cierto medicamento, las madres cuyos hijos sufren alguna malformación son más propensas a recordar todos los medicamentos que tomaron durante el embarazo, lo que resulta en una estimación errónea del efecto del medicamento (Tabla 2.5.3). Este tipo concreto de sesgo de información se denomina sesgo de memoria, y puede aparecer en cualquier estudio que utiliza la anamnesis para asignar exposiciones, ya que la experiencia de enfermedad afecta la memoria. En segundo lugar, la mala clasificación no diferencial es aquella que no depende de los valores de otras variables. La tabla 2.5.4 ilustra un hipotético estudio de casos y controles en el que el instrumento para medir la exposición, tanto en casos como en controles, tiene una sensibilidad del 80% y una especificidad del 100%. Como resultado, la asociación observada es diferente a la real. El sesgo de información de tipo mala clasificación diferencial puede tanto exagerar como infraestimar la magnitud de una asociación. En el caso de mala clasificación no diferencial, la dirección del sesgo es, en general, hacia la hipótesis nula. Sin embargo, en situaciones de extrema mala clasificación, de medidas continuas de la exposición o la enfermedad, o cuando coinciden mala clasificación no diferencial de la exposición y de la enfermedad, es posible que el sesgo, aun siendo no diferencial, se aleje de la hipótesis nula (es decir, sobreestime la asociación).1 Confusión. Definición, causas y efectos La confusión es la situación en la que la asociación observada entre una determinada exposición y una determinada enfermedad se debe a la influencia de una tercera variable que confunde o se combina con la asociación real entre exposición y enfermedad. Por ejemplo, en el estudio del efecto del consumo de alcohol en la enfermedad coronaria, la asociación entre estas variables puede estar confundida por el papel del consumo de tabaco; este es más frecuente en los consumidores de alcohol y causa de enfermedad coronaria (Figura 2.5.2). Habitualmente se denomina variable confusora (confounder o confounding variable en inglés) a la variable responsable de la confusión. Ésta se utiliza como variable de ajuste para eliminar el sesgo producido por la confusión. En general, una variable confusora debe ser un factor de riesgo para la enfermedad, debe estar asociada (causalmente o no) con la exposición, y no puede ser un paso intermedio en la cadena causal entre la exposición y la enfermedad1 (Figura 2.5.2). Es importante resaltar que la evaluación de la confusión requiere combinar el conocimiento experto (clínico y/o fisiopatológico) con las estrategias estadísticas. Así, una evaluación (y eventual manejo) de la confusión basada solamente en criterios estadísticos o solamente en conocimiento experto puede conducir a errores. La confusión puede llevar a sobreestimar o infraestimar el efecto real de una exposición en la enfermedad, e incluso puede cambiar el sentido de la asociación. 103
Manual del Investigador Novel
Evaluación del error sistemático (sesgo de selección, sesgo de información y confusión). Análisis de sensibilidad Es muy importante resaltar que el sesgo es un fenómeno cuantitativo, no cualitativo. Por ello, es la cantidad de sesgo la que se debe evaluar (y eventualmente corregir), no su mera presencia o ausencia. La tabla 2.5.5 muestra cómo se puede evaluar cuantitativamente el error sistemático utilizando como ejemplo un caso real de confusión por indicación. En la confusión por indicación, los sujetos expuestos a un tratamiento teóricamente beneficioso muestran peor pronóstico que los sujetos no expuestos, debido a que la indicación de tratamiento es motivada por la gravedad de la enfermedad, que también es la responsable de la evolución. En este ejemplo, en el que los pacientes con EPOC que son controlados por el neumólogo toman anticolinérgicos inhalados, participan en programas de rehabilitación pulmonar o reciben oxigenoterapia domiciliaria tienen mayor riesgo de ingresar por agudización de la EPOC que los correspondientes grupos de referencia, el ajuste por las variables disponibles de gravedad (parámetros de función pulmonar, intercambio de gases e ingresos previos) conseguía explicar hasta un 72% de la asociación.6 Sin embargo, el modelo ajustado todavía mostraba una asociación entre ser controlado por el neumólogo y tomar anticolinérgicos y peor evolución, lo que podría atribuirse a confusión residual (debida a variables de gravedad no medidas en el estudio), a efectos adversos de los tratamientos, o a una combinación de ambos.7 El análisis de sensibilidad es un análisis habitualmente planificado a priori por los investigadores para evaluar el efecto de los errores, es decir, para medir la cantidad de sesgo. El análisis de sensibilidad consiste en repetir de manera sistemática el análisis estadístico utilizando cada vez diferentes asunciones sobre la población de estudio, la medida de la exposición y la enfermedad, y las variables confusoras, para ver hasta qué punto los estimadores son sensibles a los cambios en las asunciones.1 Si los estimadores cambian poco en respuesta a los cambios en las asunciones, los resultados se califican de razonablemente aceptables y se considera altamente improbable que el sesgo en estudio sea responsable de la asociación observada. Si los estimadores cambian mucho, es necesario aceptar que el sesgo podría ser responsable de los resultados y, por tanto, que los resultados obtenidos no se corresponden con los valores reales. A continuación se presentan diversos métodos para analizar el efecto de los sesgos de información, confusión y selección. El análisis de sensibilidad para sesgo de selección se presenta en último lugar porque combina estrategias del análisis de sensibilidad del sesgo de información y del de confusión. Respecto al sesgo de información, la asunción (habitualmente no declarada) de todos los estudios es que la información sobre la exposición y la enfermedad es correcta, es decir, que todos los sujetos clasificados como expuestos o como enfermos en realidad lo están. Una estrategia frecuente para medir el sesgo producido por la mala clasificación en la exposición o la enfermedad consiste en repetir los análisis ponderando los valores de la variable exposición o enfermedad potencialmente “errónea” a partir de datos sobre sensibilidad y especificidad (obtenidos en el propio estudio o de la literatura) del instrumento de medida. Por ejemplo, la broncoscopia puede tener una sensibilidad inferior al 50% para diagnosticar cáncer de pulmón cuando la lesión no es visible endoscópicamente; si en un estudio de casos y controles se ha utilizado la broncoscopia para definir los casos de cáncer, se puede repetir el análisis del estudio reclasificando a ciertos sujetos del grupo control como casos de cáncer (ver más detalles en la referencia 1). En estas situaciones, se puede asumir tanto mala clasificación diferencial como no diferencial y se pueden estimar los resultados bajo diferentes supuestos. Otro análisis habitual consiste en modificar la definición de la exposición o la enfermedad haciéndola más específica para reducir la posible mala clasificación. Por ejemplo, en un estudio poblacional sobre EPOC se pueden excluir los sujetos que, aun cumpliendo con la definición espirométrica de EPOC, declaran tener síntomas de asma. Para eliminar el sesgo por confusión, habitualmente se ofrecen los resultados tras ajustar por las variables confusoras, pero es frecuente que alguna posible confusora no se haya recogido en un estudio concreto. Por ejemplo, la inactividad física aumenta el riesgo de múltiples enfermedades, pero raramente se mide de 104
2.5. Tipos de error. Validez, sesgos y confusión
manera rutinaria, como sí se mide el consumo de tabaco. En este caso, se debe descartar si la asociación observada en el análisis multivariable puede ser debida a confusión residual por las confusoras no medidas. Si la variable en cuestión se ha medido en una submuestra de la población, aunque sea pequeña, se pueden comparar los estimadores entre el análisis con toda la muestra sin la mencionada variable y el análisis sólo con la submuestra adicionalmente ajustado por dicha variable. Aunque en el último caso los intervalos de confianza aumentarán debido a la reducción de tamaño de la muestra (y quizás los valores de p sean > 0,05), los estimadores de la asociación se pueden comparar, como en la tabla 2.5.5, lo que permitirá evaluar la cantidad de sesgo debida a la confusión residual. Otra opción es estimar el valor de una variable no medida a partir de datos en la literatura sobre su prevalencia y su relación con la enfermedad.1 Este método se denomina ajuste externo o ajuste indirecto (más detalles en la referencia 1). Finalmente, para evaluar el sesgo de selección, el mínimo análisis consiste en comparar las características individuales de los sujetos participantes con los no participantes. Cuando se conocen los factores que afectan a la selección (por ejemplo, la no participación o el no seguimiento), este sesgo se puede controlar cuantitativamente. Se pueden usar estrategias similares al control de la confusión si se dispone de la información sobre estos factores en el propio estudio. Si se dispone de la distribución de estos factores en la población, se pueden utilizar estrategias similares al control del sesgo de información.1
VALIDEZ EXTERNA. GENERALIZACIÓN Tradicionalmente, en cuanto a la validez (falta de error sistemático) se han distinguido dos componentes: la validez interna, que hace referencia al “grado en que los resultados del estudio pueden aplicarse a la población de estudio” (aquella en la que se obtuvo la muestra) y la validez externa (o generalización), que se define como “el grado en que los resultados de un estudio pueden aplicarse a poblaciones que no participaron en dicho estudio”.8 Hoy en día, se considera que la validez externa va más allá de las discusiones sobre muestras y poblaciones. Utilizando un argumento extremo, si sólo fuera posible generalizar a las poblaciones en las que se han reclutado las muestras, los resultados de la investigación en animales jamás se aplicarían a humanos y cada población necesitaría repetir todas las investigaciones adaptadas a su realidad física, biológica y social. En realidad, si aceptamos que el objetivo final de la investigación es contribuir al conocimiento científico, cabe reconocer que el proceso de sintetizar la evidencia disponible sobre un fenómeno de interés requiere una gran capacidad de abstracción y que va más allá de aplicar a una muestra más amplia lo que se ha observado.
REDUCIR LOS ERRORES ALEATORIOS Y SISTEMÁTICOS Evitar o reducir el error aleatorio Aunque el error aleatorio, a diferencia del sistemático, no se puede predecir, es más fácil de resolver. El principal instrumento para reducir el error aleatorio es aumentar el tamaño de la muestra. El tamaño de la muestra es inversamente proporcional al error aleatorio. Intuitivamente, todos estamos familiarizados con la idea de que, al lanzar una moneda al aire 1.000 veces, aproximadamente el 50% de las ocasiones caerá de cara, mientras que si la lanzamos solamente 10 veces, esta proporción puede alejarse del 50% simplemente por azar. De la misma manera, a mayor tamaño de la muestra, mayor precisión en las estimaciones. El capítulo 18 describe cómo calcular el tamaño muestral más adecuado según la pregunta de investigación, el diseño del estudio y las características de las variables clave. Escoger el diseño más adecuado para una pregunta de investigación permite también aumentar la precisión. Por ejemplo, en una enfermedad poco frecuente, un diseño de casos y controles es más eficiente estadísti105
Manual del Investigador Novel
camente que un estudio de cohortes. Además, si el estudio prevé análisis estratificados y/o ajustados, es necesario que el cálculo de tamaño muestral asegure suficientes sujetos en cada uno de los estratos de interés. El error aleatorio se puede reducir también intentando minimizar el papel del azar en la recogida e incluso en la entrada de datos. Por ejemplo, la estandarización de las condiciones del instrumental, del paciente y del entorno para medir la tensión arterial permitirá reducir la variabilidad aleatoria en las estimaciones. De manera similar, la doble entrada de los datos permitirá identificar errores tipográficos, reduciendo así la variabilidad aleatoria. Evitar o reducir el sesgo de selección Para reducir el sesgo de selección, lo más importante es definir bien la población de estudio y utilizar técnicas de muestreo que permitan que la muestra sea lo más representativa posible de la población de estudio. En general, una muestra de pacientes seleccionados al azar en centros de atención primaria será más representativa de la población general que una muestra de conveniencia de pacientes hospitalarios. Sin embargo, si la población de interés son pacientes con enfermedad avanzada, la muestra hospitalaria puede ser, no sólo más factible, sino también más adecuada. Otro aspecto esencial para reducir el sesgo de selección es garantizar que la población de referencia (o población control) sea lo más parecida posible a la población expuesta, excepto en la exposición. Algunos diseños (ensayos cruzados o estudios de casos cruzados) permiten estudiar a los mismos sujetos bajo los dos supuestos (exposición y no exposición), pero por desgracia no son aplicables para la mayoría de preguntas de investigación. En ausencia de esta posibilidad, los investigadores deben recopilar el máximo de información sobre las variables que difieren entre ambas poblaciones con el fin de tenerlas en cuenta en el análisis (por ejemplo, como variables de ajuste). De hecho, algunos tipos de sesgo de selección se pueden interpretar como un problema de confusión. Ante el sesgo de selección llamado de no respuesta, los investigadores deberían intentar obtener alguna información sobre los no participantes (sexo, edad, hábito tabáquico) que permitiera estimar las diferencias en variables clave entre los participantes y la población de estudio. También en los estudios de seguimiento donde se producen pérdidas que pueden dar lugar al sesgo de selección denominado sesgo de supervivencia, disponer de las características que se asocian al seguimiento (por ejemplo, factores que aumentan el riesgo de morir) permitirá ajustar por estos factores en el análisis. Recientemente se han utilizado técnicas de imputación para controlar el sesgo de selección, especialmente, el sesgo debido a las pérdidas de seguimiento.9 Aunque el concepto de imputar valores a los fallecidos ha sido discutido,10 los estudios existentes muestran que tales técnicas acostumbran a reducir el sesgo.9 Evitar o reducir el sesgo de información Para reducir el sesgo de información, es necesario utilizar los mejores métodos para definir la enfermedad, la exposición y las otras variables relevantes para la pregunta de investigación. Los datos sobre las enfermedades se pueden obtener, entre otros métodos, a través de cuestionarios, registros o pruebas diagnósticas. En general, se considera buena práctica verificar los diagnósticos siempre que sea posible. Por ejemplo, para asignar un sujeto a las categorías EPOC sí o EPOC no, utilizar una espirometría forzada es preferible a utilizar un cuestionario, y en el caso del cáncer es mejor disponer de una confirmación anatomopatológica que de un cuestionario.
106
2.5. Tipos de error. Validez, sesgos y confusión
En ocasiones no es factible realizar pruebas diagnósticas a todos los participantes. En estos casos se recomienda realizar estudios de validación en una submuestra. Por ejemplo, el Nurses Health Study dispone de una simple pregunta autodeclarada por las enfermeras sobre diagnóstico de asma. Para acompañar esta medida de algún dato de validación, se revisó el diagnóstico a partir de registros médicos en una submuestra, siendo éste confirmado en un 96% de los casos.11 Respecto a la información sobre exposiciones, existen situaciones especialmente complicadas, como la investigación sobre factores ambientales, en la que resulta difícil recoger mediciones individuales, o la investigación sobre exposiciones laborales, en la que se debe recopilar la historia ocupacional completa. En general, la exposición más reciente es más fácil de recordar que la exposición lejana. También para reducir el error en la medida de la exposición, se recomienda realizar estudios de validación. Por ejemplo, para estudiar los efectos de la actividad física en una muestra muy grande de población general se podría utilizar un cuestionario para todos los sujetos y un acelerómetro en una submuestra. Estas dos medidas permitirían validar la medida de actividad física del cuestionario e incluso ponderarla a partir de los datos del acelerómetro. Otra posibilidad es recoger la información de diferentes fuentes (por ejemplo, tabaco a partir de entrevista al paciente, entrevista al familiar y análisis de cotinina en orina). En el caso de utilizar cuestionarios, el entrenamiento de los entrevistadores, las condiciones de la entrevista e incluso el orden de las preguntas son esenciales para reducir los errores sistemáticos en la declaración, que acostumbran a ir en el sentido de lo que se percibe como socialmente deseado (Tabla 2.5.2). Finalmente, el enmascaramiento (o ciego) permite evitar algunos errores sistemáticos debidos al participante o al observador y es una condición requerida en los estudios experimentales. Las técnicas de enmascaramiento más comunes son el simple ciego (sólo el paciente desconoce el grupo al que ha sido asignado, es decir, ignora cuál de los posibles tratamientos recibe), el doble ciego (tanto el paciente como el investigador/ médico desconocen el grupo de asignación) y triple ciego (cuando también el análisis y evaluación de los datos se hace sin conocer la identidad de los grupos). Evitar o reducir la confusión El control de la confusión se debe llevar a cabo en la fase de diseño del estudio y en el análisis estadístico. Existen tres técnicas que permiten evitar la confusión: la aleatorización, el apareamiento y la restricción. La aleatorización para asignar sujetos a un tratamiento u otro en estudios experimentales permite crear subgrupos similares en todas sus características excepto en la exposición de interés, especialmente si las muestras son suficientemente grandes. En el caso de muestras pequeñas, sin embargo, es probable que ciertas características, poco frecuentes pero que afectan el riesgo de la enfermedad, por azar se distribuyan de manera diferente entre los subgrupos, evitando el control de la confusión. El apareamiento se usa sobre todo en estudios de casos y controles. Consiste en seleccionar a los sujetos de tal manera que la distribución de los posibles factores confusores sea igual (o muy similar) entre los grupos a comparar. En general, los sujetos se aparean por sexo, edad, hábito tabáquico o clase social, intentando que ambos elementos de la pareja sólo se distingan por la exposición. Existen diferentes métodos de apareamiento (por ejemplo, individual o de frecuencia), y se pueden utilizar en diferentes diseños, pero es necesario disponer de conocimiento extenso sobre el fenómeno de interés y sobre metodología epidemiológica y estadística, ya que el apareamiento puede también provocar sesgos. La restricción es la manera más efectiva de evitar la confusión. Si la variable confusora se mide en categorías, como en el sexo o la etnia, la restricción se consigue aceptando en el estudio solamente alguna de las categorías. Si la variable confusora se mide de forma continua, como la edad, se puede definir un rango 107
Manual del Investigador Novel
relativamente estrecho como para que la muestra sea homogénea. Un ejemplo reciente es el reanálisis del efecto del asma en la enfermedad cardiovascular: durante décadas, los estudios observacionales han sugerido un riesgo excesivo de morbilidad y mortalidad cardiovascular en los pacientes asmáticos, incluso tras ajustar por las variables disponibles de tabaco. Sin embargo, un estudio reciente no encontró diferencias en enfermedades cardiovasculares entre asmáticos y no asmáticos tras restringir el análisis a los sujetos que no habían fumado nunca.12 Estos resultados sugieren que la asociación previamente descrita se debía a confusión residual por tabaco.13 El problema de la restricción es que puede dificultar la generalización de los resultados, especialmente si el efecto de las exposiciones puede ser diferente entre substratos de las variables confusoras. Desgraciadamente en la mayoría de investigaciones no es posible aleatorizar ni restringir, y el apareamiento es difícil y/o no recomendado, motivo por el que la aproximación más habitual (y acertada) para prevenir la confusión no es precisamente intentar evitarla, sino intentar controlarla. Para ello es necesario recopilar información detallada sobre las posibles variables confusoras y utilizarlas adecuadamente en el análisis estadístico. La identificación de las variables que provocan confusión es específica de cada pregunta de investigación y requiere conocimiento experto clínico y/o fisiopatológico. La medición de las variables de confusión requiere también experiencia en metodología de la investigación. Finalmente, es necesario disponer de conocimiento estadístico para utilizar las variables de confusión como covariables en los modelos multivariables y/o para estratificar los resultados (ver capítulos módulo 5).
EQUÍVOCOS Y DUDAS FRECUENTES EN TORNO A LOS ERRORES EN INVESTIGACIÓN Azar versus leyes de la física. Algunas personas creen en el azar como origen de los fenómenos físicos y biológicos. Otras personas, deterministas, consideran que todos los fenómenos son predecibles. En la práctica, todos aquellos fenómenos impredecibles con el conocimiento actual son indistinguibles de los producidos por azar, por lo que la distinción entre error aleatorio y sistemático descrita en este capítulo es válida bajo todas las creencias. Valor de la p, tamaño muestral y sesgo. A menudo se interpreta el resultado de las pruebas de contraste de hipótesis (por ejemplo, el valor de p) como una medida de evaluación del sesgo. No es correcto. El sesgo es debido a la presencia de error sistemático y, por tanto, no se puede analizar con las técnicas que miden error aleatorio. De manera similar, el aumento del tamaño de la muestra no puede corregir ningún sesgo. ¿Existe el sesgo? ¿Sí o no? El sesgo es un fenómeno cuantitativo, no cualitativo. Como se ha mencionado previamente, es la cantidad de sesgo la que se debe evaluar (y eventualmente corregir), no su presencia o ausencia. ¿Confusión o sesgo de confusión? ¿Confusión por indicación o sesgo por indicación? Diversos de los términos mencionados en este capítulo (error sistemático, sesgo, validez…) son utilizados por diversas disciplinas y en diversos contextos, con significado similar, pero no siempre idéntico. Por ejemplo, en estadística sesgo se refiere a la diferencia entre el valor medio de un estimador y el valor real del parámetro que se pretende estimar; en psicometría, la validez se refiere al grado en que un instrumento de medición mide el constructo que se supone que debe medir; y aunque la distinción entre errores aleatorios y sistemáticos se encuentra en muchas disciplinas, no siempre estos dos tipos de error están completamente separados. En cualquier caso, los investigadores deberían preocuparse por entender el fenómeno, sus causas y sus efectos, más que discutir sobre los nombres.
108
2.5. Tipos de error. Validez, sesgos y confusión
Tras ajustar, desaparece la asociación, ergo, no existe asociación. Cualquier asociación puede ser debida a confusión, pero continúa siendo asociación. Si tras ajustar la asociación por una variable confusora la asociación desaparece, la interpretación correcta es que la asociación observada sin ajustar (que es real) no se debe a un efecto causal, sino al efecto de una tercera variable. La variable X es confusora. Ninguna variable X es solo confusora. Cualquier variable X puede ser confusora en el estudio del efecto de una variable Y en otra variable Z. La confusión es un problema de relaciones; en ausencia de con quién relacionarse, no existe confusión.
CONSIDERACIONES FINALES Todo investigador debe, en diversas fases de la investigación (planificación del estudio, análisis estadístico, interpretación de resultados, lectura de artículos, etc.), revisar sistemática y críticamente las cuatro principales fuentes de error más relevantes mencionadas en este capítulo: error aleatorio (tamaño de la muestra), sesgo de selección, sesgo de información y confusión. La tabla 2.5.6 propone una serie de recomendaciones a tener en cuenta. Cabe insistir en la necesidad de disponer de conocimiento experto clínico y/o fisiopatológico, metodológico y estadístico para poder abordar correctamente los errores en investigación. Finalmente, es necesario recordar que sólo se puede realizar una interpretación causal de los resultados de la investigación (tanto observacional como experimental) tras descartar las cuatro fuentes de error revisadas en este capítulo.
PUNTOS CLAVE • • • • • •
Tipos de error en investigación: error aleatorio y error sistemático (o sesgo). Precisión: ausencia de error aleatorio. Validez: ausencia de error sistemático. Tipos de sesgo: sesgo de selección, sesgo de indicación (o mala clasificación) y confusión. El sesgo es un fenómeno cuantitativo, no cualitativo. Cuándo considerar los errores: ¡siempre! (diseño del estudio, recogida de datos, análisis estadístico, interpretación de resultados…). • Cómo reducir el error aleatorio: aumentar el tamaño de la muestra. • Cómo reducir el sesgo de selección: definir bien la población de estudio y las técnicas de muestreo. • Cómo reducir el sesgo de información: utilizar los mejores métodos para definir la enfermedad, la exposición y las demás variables relevantes. • Cómo reducir la confusión: aleatorizar (en estudios experimentales), aparear (en algunos estudios observacionales) o restringir (si la pregunta de investigación lo permite) y, sobre todo, recopilar información detallada sobre las posibles variables confusoras y utilizarla adecuadamente en el análisis estadístico. •- Para prevenir e interpretar correctamente los errores en investigación, es necesario disponer de conocimiento experto clínico y/o fisiopatológico, metodológico y estadístico.
109
Manual del Investigador Novel
BIBLIOGRAFÍA 1. Rothman KJ, Greenland S. Modern epidemiology. Philadelphia, Lippincott-Raven, 2ª ed. 1998. 2. Fletcher R, Fletcher S, Wagner E. Epidemiología Clínica: aspectos fundamentales. Barcelona, MASSON-Williams & Wilkins España, 2ª ed. 1998. 3. Porta M. A Dictionary of Epidemiology. Nueva York, Oxford University Press, 6ª ed. 2014. 4. Abramson JH. Survey Methods in Community Medicine. Edinburgh, Churchill Livingstone, 2ª ed. 1979. 5. Sackett DL. Bias in analytic research. J Chronic Dis. 1979;32:51-63. 6. Szklo M, Nieto J. Epidemiology Beyond the Basics. Geithersburg, Aspen Publishers, 2000. 7. Garcia-Aymerich J, Marrades RM, Monsó E, Barreiro E, Farrero E, Antó JM; EFRAM Investigators. Paradoxical results in the study of risk factors of chronic obstructive pulmonary disease (COPD) re-admission. Respir Med. 2004;98:851-857. 8. Porta M. A Dictionary of Epidemiology. Nueva York, Oxford University Press, 6ª ed. 2014. 9. Weuve J, Tchetgen Tchetgen EJ, Glymour MM, Beck TL, Aggarwal NT, Wilson RS, Evans DA, Mendes de Leon CF. Accounting for bias due to selective attrition: the example of smoking and cognitive decline. Epidemiology. 2012;23:119-128. 10. Chaix B, Evans D, Merlo J, Suzuki E. Commentary: Weighing up the dead and missing: reflections on inverse-probability weighting and principal stratification to address truncation by death. Epidemiology. 2012;23:129-131. 11. Camargo CA, Weiss ST, Zhang S, Willett WC, Speizer FE. Prospective study of body mass index, weight change, and risk of adult-onset asthma in women. Arch Intern Med. 1999;159:2582-2588. 12. Çolak Y, Afzal S, Nordestgaard BG, Lange P. Characteristics and Prognosis of Never-Smokers and Smokers with Asthma in the Copenhagen General Population Study. A Prospective Cohort Study. Am J Respir Crit Care Med. 2015;192:172-181. 13. Garcia-Aymerich J. The Role of Smoking in the Association between Asthma and Cardiovascular Disease. An Example of Poorly Controlled Confounding. Am J Respir Crit Care Med. 2015;192:123.
110
2.5. Tipos de error. Validez, sesgos y confusión
TABLAS Y FIGURAS Tabla 2.5.1. Ejemplos de sesgos de selección Nombre del sesgo de selección
Ejemplo
Autoselección / sesgo del voluntario / sesgo de no respuesta
En un estudio para estimar la prevalencia de síntomas respiratorios en población general, los sujetos que sufren algún síntoma (o que tienen algún familiar que sufre síntomas) son más propensos a participar que los que no tienen síntomas respiratorios. Como consecuencia, la muestra participante tendrá una mayor prevalencia de síntomas que la población real.
Falacia de Berkson / selección en el hospital
En un estudio de casos y controles para conocer si el consumo de tabaco aumenta el riesgo de fracturas, los casos se seleccionan en el hospital (donde es fácil identificar un número elevado de sujetos con fracturas). Se observará una asociación entre tabaco y fracturas superior a la asociación real debido a que en el caso de sufrir una fractura es más probable ser ingresado si existen enfermedades concomitantes (cardiovasculares, respiratorias o cáncer) y al hecho de que estas enfermedades a menudo tienen relación con el consumo de tabaco.
Trabajador sano
En un estudio para conocer los efectos respiratorios de cierta exposición laboral continuada, los sujetos que han desarrollado algún problema respiratorio han dejado de trabajar y no participan en el estudio, por lo que el efecto observado será inferior al efecto real.
Sesgo de supervivencia
En un estudio de seguimiento para analizar la relación entre el tabaquismo activo y los cambios en la función pulmonar, algunos sujetos mueren tras ser reclutados y no pueden participar en las visitas de seguimiento. Dado que la muerte está probablemente relacionada con el consumo de tabaco, los sujetos que continúan en el estudio exhibirán características diferentes a los que han fallecido y la asociación observada entre tabaco y cambios en función pulmonar estará sesgada.
111
Manual del Investigador Novel
Tabla 2.5.2. Ejemplos de sesgos de información Fuente del error de medida
Ejemplo
Error de medida dependiente del sujeto
Cambios fisiológicos
Función pulmonar reducida en los asmáticos agudizados
Respuesta socialmente aceptable / Cambios por saber que está siendo investigado
Declaración de no fumar en un cuestionario sobre síntomasrespiratorios
Factores que afectan la respuesta a las preguntas: despiste, motivación, memoria, etc.
Olvido sobre haber consumido un fármaco en el pasado según el estado de salud en el presente
Errores sistemáticos al administrar preguntas
“Usted no toma alcohol, ¿verdad?”
Factores relacionados con la experiencia
En un estudio de función pulmonar con múltiples observadores, un observador con más experiencia en la técnica de la espirometría conseguirá valores más altos que el resto
Propiedades del instrumento de medida
Baja sensibilidad en la broncoscopia para diagnosticar cáncer de pulmón no visible endoscópicamente
Errores en el instrumento de medida
Pequeña fuga de aire en el espirómetro
Error de medida dependiente del observador
Error de medida dependiente de los instrumentos
112
2.5. Tipos de error. Validez, sesgos y confusión
Tabla 2.5.3. Sesgo de información por mala clasificación diferencial de la exposición debida a falta de memoria selectiva (sesgo de memoria, datos hipotéticos)
Exposición
No exposición
Datos reales Casos Controles
10 10
40 40
OR=1
Datos declaradosa Casos Controles
10 2
40 48
OR=6
OR: Odds ratio a
Los sujetos enfermos (casos) recuerdan la exposición perfectamente y los datos declarados concuerdan con la realidad. Sin embargo, la mayoría de los sujetos sanos (controles) han olvidado haber estado expuestos; esta mala clasificación deriva en una estimación errónea de la asociación entre exposición y enfermedad (OR observada = 6 versus OR real = 1).
Tabla 2.5.4. Sesgo de información por mala clasificación no diferencial de la exposición debida al instrumento de medida (datos hipotéticos)
Exposición
No exposición
Datos reales Casos Controles
25 10
25 40
OR=4
Datos observadosa Casos Controles
20 8
30 42
OR=3,5
OR: Odds ratio a
Tanto en los sujetos enfermos (casos) como en los sanos (controles), el instrumento de medida tiene una sensibilidad del 80%, por lo que el 20% de los expuestos se clasifican como no expuestos. Esta mala clasificación deriva en una estimación errónea de la asociación entre exposición y enfermedad (OR observada = 3,5 versus OR real = 4).
113
Manual del Investigador Novel
Tabla 2.5.5. Evaluación de la confusión por indicación. Asociación entre diversas intervenciones médicas y riesgo de ingreso por agudización de la EPOC HR crudo
HR ajustadoa
% exceso de riesgob
Control por el neumólogo (referencia: médico de familia)
2.16c
1.73c
37%
Uso de anticolinérgicos inhalados
3.52c
2.10c
56%
Rehabilitación pulmonar
1.77c
1.28
64%
Oxigenoterapia domiciliaria
2.36c
1.38
72%
HR: hazard ratio (razón de riesgos) a
Ajustado por FEV1, PaO2 e ingresos previos por agudización de la EPOC.
b
Porcentaje del exceso de riesgo explicado por FEV1, PaO2 e ingresos previos, calculado como [(HR crudo – HR ajustado)/HR crudo-1)]*100. c
p < 0,05.
Fuente: Garcia-Aymerich J, Marrades RM, Monsó E, Barreiro E, Farrero E, Antó JM; EFRAM Investigators. Paradoxical results in the study of risk factors of chronic obstructive pulmonary disease (COPD) re-admission. Respir Med. 2004;98:851-857.
114
2.5. Tipos de error. Validez, sesgos y confusión
Tabla 2.5.6. Recomendaciones sobre cómo actuar ante los posibles errores en diferentes fases de la investigación
Diseñar un estudio
Describir las limitaciones de un estudio
Interpretar un resultado / leer un artículo
Tamaño muestral
Calcular el tamaño de la muestra necesaria, incluyendo previsión de ps y análisis de subgrupos.
Identificar si se ha conseguido el tamaño muestral previsto, incluyendo los subgrupos.
¿Es la muestra suficientemente grande? ¿Se presentan los cálculos de tamaño muestral? ¿Se discute en limitaciones sobre el tamaño de la muestra, especialmente en los subgrupos para los que se presentan resultados?
Sesgo de selección
Identificar la población de estudio, muestra y técnica de muestreo más adecuada a la pregunta de investigación y el diseño. Planificar el análisis de sensibilidad.
Discutir si se ha conseguido una muestra que represente a toda la población de estudio o si las no respuestas, pérdidas o exclusiones pueden haber afectado la representatividad. Discutir el posible efecto del sesgo de selección en los resultados.
¿Están los individuos bien seleccionados? ¿Se describe la población de estudio? ¿Se describe el sistema de muestreo? ¿Se informa de no respuestas, pérdidas, muertes o exclusiones y se comparan sus características con las de los participantes? ¿Se discuten los posibles sesgos y sus efectos? ¿Se incluye algún análisis de sensibilidad?
Sesgo de información
Utilizar los mejores instrumentos para definir las variables de exposición, enfermedad y otras relevantes. Considerar estudios de validación en una submuestra. Planificar el análisis de sensibilidad.
Discutir sobre validez y fiabilidad de los instrumentos utilizados para definir las variables de exposición, enfermedad y otras relevantes. Discutir el posible efecto del sesgo de información en los resultados.
¿Están las variables de exposición, enfermedad y confusoras bien definidas? ¿Se describen los instrumentos utilizados para medir las variables y su validez y precisión? ¿Se incluyen análisis de sensibilidad? ¿Se discuten los posibles sesgos y sus efectos?
Confusión
Identificar y medir las principales variables que pudieran provocar confusión. Planificar el análisis multivariable. Planificar el análisis de sensibilidad.
Discutir las diferencias entre los modelos crudo y ajustado. Identificar si existen factores de confusión no medidos y discutir el posible efecto de la confusión residual en los resultados.
¿Están medidas y consideradas en el análisis todas las posibles v ariables confusoras? ¿Se describen las variables consideradas confusoras? ¿Se describe cómo se han construido los modelos multivariables? ¿Se incluye el análisis de sensibilidad?
115
Manual del Investigador Novel
Figura 2.5.1. Representación gráfica de los conceptos de precisión y validez
116
2.5. Tipos de error. Validez, sesgos y confusión
Figura 2.5.2. Representación gráfica del efecto del tabaco (variable confusora) en el estudio de la asociación entre el consumo de alcohol (variable exposición) y la enfermedad coronaria
117
Manual del Investigador Novel
118
2.6. Revisiones sistemáticas y metaanálisis
2.6. REVISIONES SISTEMÁTICAS Y METAANÁLISIS Dra. Elena Gimeno Santos
INTRODUCCIÓN Una revisión sistemática (RS) tiene como objetivo recopilar toda la evidencia para responder una pregunta de investigación concreta, minimizando el sesgo gracias a la utilización de métodos explícitos, sistemáticos y rigurosos. Es por este rigor metodológico que las RS son el estándar de referencia para la síntesis de evidencias en salud y se utilizan para el desarrollo de guías de práctica clínica y apoyar la toma de decisiones clínicas. Por lo tanto, una RS tiene unas características similares a cualquier estudio de investigación. Sin embargo no usa datos de sujetos individuales, sino que recoge datos de estudios ya realizados. Aunque muchas RS contienen metaanálisis, estos dos términos no deberían usarse como sinónimos, aunque habitualmente ocurre. El término metaanálisis corresponde al método estadístico que combina resultados de estudios individuales para dar una estimación global más precisa de los efectos estudiados. Asimismo, debe diferenciarse una RS de una revisión de la literatura realizada por uno o varios expertos. La primera, la RS, es una revisión protocolizada que identifica, selecciona, sintetiza y evalúa todas las evidencias de investigaciones primarias. La revisión de la literatura es un resumen cualitativo de las evidencias en un tema concreto que usa métodos informales o subjetivos para recolectar e interpretar los estudios elegidos.
PROTOCOLO DE LA REVISIÓN SISTEMÁTICA Igual que cualquier proyecto de investigación, una RS debe seguir un protocolo que se habrá escrito y detallado antes de iniciar el proceso de revisión en sí, a fin de que cualquier investigador pueda reproducir el proceso de revisión. El protocolo especificará los métodos usados durante las diferentes fases del proceso de RS, las cuales se resumen a continuación. • Definición de la pregunta de investigación. Formulación de objetivos claros y concretos. • Concreción de criterios de selección de las referencias bibliográficas (criterios inclusión y exclusión) y de la estrategia de búsqueda. • Búsqueda sistemática de la literatura y aplicación de los criterios de elegibilidad de los estudios. 119
Manual del Investigador Novel
• Inclusión de estudios y extracción de datos. • Evaluación del riesgo de sesgos y de la calidad de la evidencia. • Síntesis de los datos mediante procedimientos estadísticos, como el metaanálisis (si es necesario) y la interpretación de datos. • Redacción de los resultados.
DEFINICIÓN DE LA PREGUNTA DE REVISIÓN Una RS debería establecer preguntas claras. Se recomienda que la definición de la pregunta sea precisa para conseguir la mejor evidencia para responderla. La pregunta de revisión, especialmente en RI sobre intervenciones, debe estar enmarcada en términos de población, intervención, comparación, variables de resultado (Outcomes) y frecuentemente también el diseño del estudio (Study design). Estos elementos, que se resumen en el acrónimo PICO(S), facilitan la definición de los criterios de inclusión y exclusión que se usarán para la selección de los estudios a revisar. A continuación, un ejemplo de pregunta siguiendo la “fórmula” PICO(S). • Objetivo de la revisión: Evaluar los efectos de la rehabilitación pulmonar tras una exacerbación de la EPOC en hospitalizaciones, mortalidad, calidad de vida y capacidad de ejercicio. • Población: Pacientes con EPOC que hayan sufrido una exacerbación de la enfermedad (con o sin ingreso hospitalario). • Intervención: Cualquier programa de rehabilitación pulmonar que incluya al menos ejercicio físico, tanto en pacientes hospitalizados como ambulatorios, que hayan sufrido una exacerbación de la EPOC. El programa de rehabilitación debe comenzar inmediatamente después o hasta tres semanas después del inicio del tratamiento médico de la exacerbación. • Comparación: Rehabilitación pulmonar versus tratamiento convencional tras exacerbación de la EPOC. • Outcomes: Hospitalizaciones (como mínimo una durante el periodo de seguimiento). Outcomes secundarios: mortalidad, calidad de vida y capacidad de ejercicio. • Diseño ((S)tudy design): Ensayos clínicos aleatorizados y controlados.
CRITERIOS DE INCLUSIÓN Y EXCLUSIÓN Los criterios de inclusión y exclusión (criterios de elegibilidad) de la revisión han de ser explícitos y claros y deben permitir guiar de manera correcta la inclusión de los estudios. Los criterios de inclusión y exclusión servirán también para preparar la estrategia de búsqueda bibliográfica y definir los filtros que se añadirán a esta. Los criterios de elegibilidad son la combinación de los diferentes aspectos de la pregunta de revisión: tipos de participantes, tipos de intervenciones, tipos de variables de resultado (outcomes) y tipos de estudio. A continuación se detallará los factores a considerar en cada punto. 1. Tipos de participantes • Definir la condición clínica o enfermedad diagnosticada. • Detallar las características más importantes de los participantes. • Especificar el entorno de los participantes (hospital, atención primaria, comunidad, etc.). • Definir si hay algún otro tipo de participante o condición clínica que debería ser excluido de la revisión. • Concretar cómo se gestionarán los estudios que incluyan sólo una submuestra de los participantes de interés. 120
2.6. Revisiones sistemáticas y metaanálisis
2. Tipos de intervenciones • Definir la intervención experimental y control (o comparación) de interés. • Especificar si la intervención puede tener variaciones en relación a dosis, modo, frecuencia, duración y tiempo de administración o personal que lo administra. • Concretar cómo se gestionarán los estudios que incluyan sólo una parte de la intervención. 3. Tipos de outcomes o variables de resultado • Generalmente se incluyen todas las variables de resultado que puedan tener una importancia para los clínicos, pacientes, responsables de políticas de salud, así como, población general. • Es importante decidir cómo se han medido los outcomes (medidas objetivas o subjetivas) y en qué momento temporal se midieron (una estrategia de ayuda es preespecificar intervalos: corto, medio y largo plazo). • Asegurar que las variables de resultado incluyen tanto los efectos de la intervención como los efectos adversos de esta. 4. Tipos de estudios • En el momento de escribir el protocolo de la revisión sistemática, los autores deben considerar qué tipo/s de diseño/s son los más adecuados para responder los objetivos de su revisión. • Generalmente, las revisiones sistemáticas se centran en ensayos clínicos aleatorizados porque así se asegura la comparación entre grupos. Sin embargo, y según la pregunta de investigación planteada, se pueden utilizar otro tipo de estudios, como los observacionales. Hay que tener en cuenta que el uso de estudios que no sean ensayos clínicos dificultará el proceso de análisis de la magnitud del efecto y la combinación de los datos.
BÚSQUEDA BIBLIOGRÁFICA La búsqueda de las referencias bibliográficas debería ser lo más sensible posible, aunque esto implique baja precisión en un inicio. El objetivo de la búsqueda debe ser identificar todos los estudios existentes sobre el tema en cuestión, esto implica detectar tanto los estudios publicados como los no publicados. La estrategia de búsqueda debe ser replicable y deberá documentarse adecuadamente en el momento de escribir el manuscrito de la RS (generalmente como anexo). Es recomendable contar con la participación de un documentalista que ayude a realizar una correcta estrategia de búsqueda bibliográfica combinando los términos clave (basados en la pregunta PICO) con los operadores booleanos (AND, OR y NOT), y asegurando que esté libre de sesgos (sesgo de publicación, de idioma, etc.). Reducir el sesgo de publicación implica que la búsqueda bibliográfica incluya búsqueda en bases de datos como Medline, Embase, Psycinfo, Biblioteca Cochrane, entre otras (generalmente se recomienda buscar en más de una). Pero también es necesario complementarla con la búsqueda manual a través de las referencias localizadas en la búsqueda electrónica, en libros o en otras revisiones, contactar con expertos en el tema, así como intentar localizar literatura no publicada y literatura “gris” (tesis doctorales, comunicaciones en congresos, etc.). Asimismo es importante no aplicar ninguna restricción de idioma y/o fecha a la estrategia de búsqueda para acceder al máximo de referencias bibliográficas. Una vez realizada la búsqueda, es recomendable tratar las referencias mediante software específico para ello (EndNote, RefWorks, Reference Manager, Mendeley, etc.). La decisión de qué gestor bibliográfico utilizar muchas veces está supeditado a los accesos que tenga la propia institución de trabajo. 121
Manual del Investigador Novel
PROCESO DE REVISIÓN El proceso de revisión de las referencias bibliográficas encontradas debe estar detallado en el protocolo. Los pasos a seguir para seleccionar estudios e incluirlos en la revisión deberían ser los que se detallan a continuación. 1. Reunir en el gestor bibliográfico todas las referencias encontradas y descartar referencias duplicadas. Esto ocurre al utilizar varias bases de datos para la búsqueda. 2. Revisar los títulos y los resúmenes de las publicaciones para eliminar aquellas referencias que no sean relevantes para la RS. Este proceso se realiza en parejas de revisores, por lo que si el número de referencias es muy alto se recomienda realizar dos o más equipos de revisores. Cada revisor explorará de manera independiente las referencias asignadas a la pareja de revisores. Una vez terminado el proceso, se compararán las decisiones y se discutirán las discrepancias que puedan existir (si es necesario, un tercer revisor tomará la decisión final). En esta fase se recomienda a los revisores ser muy conservadores (“más vale que sobren referencias que no que falten”), ya que si alguna referencia finalmente no debe incluirse en la revisión se podrá descartar en el proceso de revisión de texto completo. 3. Encontrar el texto completo de las referencias marcadas como incluidas durante el proceso de revisión de títulos y resúmenes. Este punto puede ser complejo por las restricciones de acceso a revistas (no subscripción) en cada institución. De nuevo será recomendable trabajar de manera coordinada con un documentalista. 4. Revisar el texto completo y aplicar los criterios de elegibilidad (previamente definidos en el protocolo) para decidir si el artículo o publicación se incluye o se excluye de la revisión. Este proceso vuelve a realizarse por parejas de revisores. Una vez completado, se comparan las decisiones que cada revisor ha tomado de manera independiente para comprobar si existe consenso en la decisión. En caso de desacuerdo entre revisores, de nuevo será un tercer revisor quien se encargará de tomar la decisión. 5. Complementar el proceso de revisión con una revisión manual de las referencias de cada publicación incluida. Y repetir los pasos anteriores en caso de añadir alguna referencia nueva al proceso de revisión. 6. Proceder a la extracción de datos de las publicaciones incluidas en la revisión. Equipo de revisores El equipo de revisores que llevará a cabo la RS debería tener conocimientos de metodología concreta sobre RS, así como experiencia en el área de estudio y en métodos estadísticos específicos. Se recomienda que como mínimo dos investigadores/revisores estén implicados en la revisión, pues así se reduce al máximo el sesgo y la presencia de errores durante el proceso de revisión. Sin embargo, en algunos momentos del proceso de revisión se puede requerir la participación de un tercer investigador, por ejemplo ante la discrepancia de los dos revisores respecto a incluir o no un estudio en la RS. Asimismo, en algunas ocasiones el equipo de revisores puede necesitar asesoramiento de expertos clínicos o metodológicos externos, por lo que se recomienda (aunque no es obligado) tener un grupo asesor asociado a la RS. Estudios excluidos Es recomendable listar los estudios o publicaciones que pasan a la fase de “revisión de texto completo” pero que finalmente quedan excluidas, así como recoger el motivo principal de exclusión.
122
2.6. Revisiones sistemáticas y metaanálisis
PROCESO DE EXTRACCIÓN DE DATOS Los datos que se extraerán de cada publicación/estudio y la estrategia para realizar la obtención de datos deben contemplarse en el protocolo de la RS. Los formularios de extracción de datos deben estar diseñados cuidadosamente para alcanzar los objetivos de la RS. Dichos formularios pueden ser en formato electrónico o en formato papel, a elección de los investigadores. También es importante hacer una prueba piloto con el formulario y redefinirlo y perfeccionarlo adecuadamente. La extracción de datos, al igual que el resto de procesos de la revisión, deben realizarlo como mínimo dos revisores independientes. Es importante valorar la concordancia entre revisores para garantizar que los datos extraídos sean adecuados. La tabla 2.6.1 resume los principales datos que se extraen de cada artículo o publicación incluida en la RS. En relación a las variables principales y al estimador que se va a utilizar para comparar todos los estudios (diferencia de medias, odds ratio, risk ratios, etc.), si la publicación en sí no proporciona datos suficientes será necesario contactar con los autores para intentar obtener dicho estimador o los datos originales y poder calcularlo.
EVALUACIÓN DEL RIESGO DE SESGOS La evaluación de la validez de los estudios incluidos en una RS es muy importante, ya que puede alterar los análisis, la interpretación de los datos y, por lo tanto, las conclusiones de la RS. Para la evaluación del riesgo de sesgo se pueden encontrar diferentes herramientas, la mayoría escalas y listas de comprobación que permiten cuantificar el riesgo. A continuación, y por su frecuencia de uso en las RS, se resumen los diferentes tipos de sesgo que se deberían evaluar en ensayos clínicos. • Sesgo de selección: diferencias sistemáticas en las características basales de los grupos de comparación. Tiene relación con cómo se generó la secuencia de asignación de grupos y la ocultación de esta. • Sesgo de actuación: diferencias sistemáticas en la intervención o cuidado proporcionado a cada grupo. Tiene relación con el proceso de enmascaramiento de los participantes y de los profesionales que administran la intervención. • Sesgo de detección: diferencias sistemáticas entre grupos por cómo se evalúan las variables de resultado (outcomes). Tiene relación con el proceso de enmascaramiento del evaluador. • Sesgo por pérdida de datos: diferencias sistemáticas entre grupos por exclusión de sujetos de los análisis o datos no disponibles. Tiene relación con datos incompletos de las variables de resultado. • Sesgo de descripción de datos: diferencias sistemáticas entre datos reportados y datos no reportados. Tiene relación con la presentación o descripción selectiva de los resultados. Además de lo anterior, hay sesgos que pueden afectar a los resultados de la RS y que no tienen relación directa con el sesgo que pueda presentar cada estudio de manera individual, pero también se tendrán en cuenta en el momento de reportar las conclusiones que se extraigan de la RS. Estos sesgos se puede clasificar en: • Sesgo de publicación: cuando no se han podido detectar todos los estudios, por ejemplo porque presentan resultados negativos y son difíciles de publicar.
123
Manual del Investigador Novel
• Sesgo de idioma: cuando en la revisión sólo se incluyen estudios publicados en un solo idioma, por ejemplo en inglés. • Sesgo de localización de estudios en las bases de datos: suele ocurrir si sólo se utiliza una base de datos para la búsqueda de las referencias bibliográficas. • Sesgo de publicación múltiple: suele ocurrir cuando se incluyen datos de diferentes publicaciones pero que provienen del mismo estudio (típico de estudios multicéntricos).
ANÁLISIS DE LOS RESULTADOS Los análisis de una RS pueden ser narrativos (resumen estructurado de los estudios encontrados) o cuantitativos (uso de análisis estadístico con los estimadores de los estudios individuales). El protocolo de la RS también debería considerar el plan de análisis que se llevará a cabo. Este suele ser el apartado del protocolo que está más supeditado a cambios, ya que es imposible anticipar qué datos se van a encontrar y a extraer de los estudios. Metaanálisis El metaanálisis es una herramienta estadística que permite combinar los resultados de dos o más estudios individuales. Un metaanálisis es una herramienta complementaria a todo el proceso de RS, y se debe tener en cuenta junto a las consideraciones realizadas para el análisis en general. En otras palabras, el efecto global resumido por el rombo en la figura del forest plot no es el único resultado de la RS. Los objetivos del metaanálisis se centran en: 1) hacer una valoración cualitativa y cuantitativa de los resultados individuales de cada estudio, 2) mejorar la precisión del estimador, es decir, aumentar el poder estadístico, 3) resolver incongruencias entre los resultados de los estudios individuales, 4) responder a nuevas preguntas de investigación que no se habían planteado en los estudios originales y/o no tenían suficiente poder estadístico para hacerlo, y 5) generar nuevas ideas para futuros trabajos de investigación. Para que el metaanálisis tenga sentido, se deben combinar los resultados si los estudios son lo suficientemente homogéneos, por lo que en un primer paso del análisis es importante analizar correctamente la heterogeneidad (I2) de los estudios. En caso de que exista mucha heterogeneidad, se debería tratar de identificar qué factores están relacionados y qué puede explicarla. Una I2 mayor al 50% ya representa una heterogeneidad importante y, por lo tanto, debe considerarse en el momento de la interpretación de resultados y conclusión de la RS. La figura 2.6.1 representa un ejemplo de la representación gráfica (forest plot) de un metaanálisis para datos dicotómicos. Metasíntesis Cuando realizar el metaanálisis no es posible o no es apropiado, la única opción para reportar los resultados es realizarlo de manera narrativa (mediante texto, tablas resumen, etc.). Esto suele ocurrir cuando en la RS existe mucha heterogeneidad, como por ejemplo si se incluyen diferentes tipos de estudios, con diferentes estimadores, y por lo tanto, se intenta comparar “peras con manzanas”. 124
2.6. Revisiones sistemáticas y metaanálisis
EVALUACIÓN DE LA CALIDAD DE LA EVIDENCIA Los datos de una RS y su respectivo metaanálisis (si se ha realizado) no deberían mostrarse sin haber evaluado la calidad de la evidencia encontrada. Esto significa poder responder a “cuán confiados estamos de que el efecto global calculado para cada variable resultado está cercano a la verdad”. Para responder esta pregunta existen diferentes enfoques. Uno de los más recomendados y utilizados es el sistema GRADE (Grading of Recommendations Assessment, Development and Evaluation). El método GRADE especifica 4 niveles de calidad (alta, moderada, baja y muy baja) que dependen de diversos factores que los autores deberán evaluar para cada variable resultado siguiendo unos criterios que permiten reducir o incrementar la puntuación del nivel de calidad de la evidencia.
REDACCIÓN DE LOS RESULTADOS Toda RS debería reportarse siguiendo la guía específica para ello: la normativa PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses). Esta consiste en un listado de 27 ítems y un diagrama de flujo para representar los resultados de las diferentes fases de una RS. Es importante destacar que PRISMA tiene como objetivo ayudar a los investigadores a reportar los resultados de una RS de manera transparente y adecuada, pero no es una herramienta que evalúe o proporcione información sobre la calidad de la RS. Como en todo manuscrito, la sección de resultados de una RS debe ser clara y lógica. Los autores pueden usar las tablas y figuras que crean más convenientes. Es adecuado mostrar los resultados en relación a las características de los estudios incluidos (se recomienda el uso de tablas), los datos analizados (si se ha realizado metaanálisis, se suelen representar usando forest plot), las figuras (diagrama de flujo, otros forest plots, gráficas y tablas del riesgo de sesgo, etc.) y otros resultados y tablas que se quiera mostrar.
LIMITACIONES DE LOS RESULTADOS Aunque la RS y el metanálisis se consideran la mejor evidencia para obtener una respuesta definitiva a una pregunta de investigación, los defectos inherentes asociados y presentados durante el capítulo (ej.: selección de estudios, heterogeneidad, pérdida de información, etc.) pueden limitar la toma de decisiones clínicas o cambios en actuaciones de promoción de la salud. Así pues, se debe asumir que tras realizar una RS puede seguir habiendo resultados no concluyentes sobre la pregunta de investigación, que puede no haber suficientes estudios o que todos los estudios encontrados pueden tener una baja evidencia.
REVISANDO UNA REVISIÓN Como revisores o lectores de un manuscrito de una RS, también se recomienda seguir un proceso sistemático para evaluarla de forma crítica. Las siguientes preguntas, basadas en el propio proceso de una RS, pueden ayudar: • ¿La pregunta de la revisión está claramente definida en términos de población, intervención, comparación, resultados y diseño de los estudios (PICO(S))? • ¿La estrategia de búsqueda es adecuada y apropiada? ¿Hay restricciones de idioma, tipo de publicación o fecha de publicación? 125
Manual del Investigador Novel
• • • • • •
¿Los criterios para evaluar la calidad de los estudios originales son adecuados? ¿Se ha intentado minimizar el sesgo y los errores en el proceso de selección de los estudios? ¿Se ha intentado minimizar el sesgo y los errores en el proceso de extracción de datos? ¿Los detalles presentados para cada uno de los estudios primarios son adecuados y suficientes? ¿Los métodos utilizados para la síntesis de los datos han sido adecuados? ¿Las conclusiones de los autores reflejan con precisión la evidencia revisada?
PUNTOS CLAVE • Una revisión sistemática: búsqueda sistemática, evaluación crítica y síntesis de todos los estudios relevantes sobre un tema específico. • El objetivo: recopilar toda la evidencia para responder una pregunta de investigación concreta minimizando el sesgo mediante la utilización de métodos explícitos, sistemáticos y rigurosos. • Es semejante a un diseño de investigación en sí misma en que las unidades a estudio son trabajos originales ya publicados. • El metaanálisis es una herramienta estadística que permite combinar los resultados de dos o más estudios individuales siempre y cuando los estudios sean lo suficientemente homogéneos.
126
2.6. Revisiones sistemáticas y metaanálisis
BIBLIOGRAFÍA Higgins JPT, Green S (ed.). Cochrane Handbook for Systematic Reviews of Interventions Version 5.1.0 [actualización Marzo 2011]. The Cochrane Collaboration, 2011. Disponible en www.cochrane-handbook.org. Argimón Pallás JM, Jiménez Villa J. Métodos de investigación clínica y epidemiológica. Madrid, Elsevier, 4ª ed., 2013. Gisbert JP, Bonfill X. ¿Cómo realizar, evaluar y utilizar revisiones sistemáticas? Gastroenterol Hepatol. 2004;27(3):129-149. Cochrane Database of Systematic Reviews http://www.cochranelibrary.com/cochrane-database-of-systematic-reviews/. Formación online de Cochrane Collaboration sobre revisiones sistemáticas http://training.cochrane.org/. Normativa PRISMA (Preferred Reportin Items for Systematic Reviews and Meta-Analyses) http://www. prisma-statement.org/. Normativa GRADE (Grading of Recommendations Assessment, Development and Evaluation) http://www. gradeworkinggroup.org/.
127
Manual del Investigador Novel
TABLAS Y FIGURAS Tabla 2.6.1. Datos que se extraerán de cada artículo o publicación incluida en una revisión sistemática Datos identificativos
• Identificador del estudio (creado por el revisor); • Identificador del revisor (generalmente las iniciales); • Referencia bibliográfica y detalles de contacto;
Inclusión/Exclusión
• Confirmación de inclusión (sí/no); • Motivo de exclusión;
Métodos
• • • • • •
Diseño del estudio; Duración del estudio; Generación de la secuencia de asignación de grupos; Ocultación de la secuencia de asignación; Enmascaramiento; Otras información relacionada con los sesgos;
Participantes
• • • • • •
Número total de sujetos; Entorno (setting); Diagnóstico y datos relevantes relacionados (ej.: FEV1); Edad; Sexo; Otros datos demográficos relevantes para la revisión (ej.: raza);
Intervenciones
• Número total de grupos de intervención; Para cada intervención: • Intervención; • Detalles de la intervención;
Variables resultado (outcomes)
• Variable resultado y momento de recogida; Para cada variable resultado: • Definición de la variable resultado; • Unidad de medida (si es relevante);
Resultados
• Número de participantes asignados a cada grupo de intervención; Para cada variable resultado: • Tamaño de la muestra; • Participantes perdidos (missings); • Datos resumen para cada grupo intervención (ej.: Tabla 2x2 para datos dicotómicos, media y desviación estándar para datos continuos);
Otra información que se considere oportuna para la revisión o por el revisor: financiación del estudio, referencias relacionadas, comentarios del revisor, etc.
128
2.6. Revisiones sistemáticas y metaanálisis
Figura 2.6.1. Ejemplo de la representación gráfica (forest plot) de metaanálisis para datos dicotómicos
129
Manual del Investigador Novel
130
2.7. Validación de pruebas diagnósticas
2.7. VALIDACIÓN DE PRUEBAS DIAGNÓSTICAS Dr. Alberto Fernández Villar
INTRODUCCIÓN Las decisiones clínicas se basan en la información obtenida de los pacientes mediante diferentes procedimientos, como la historia clínica, la exploración física y las pruebas de laboratorio o de imagen. Éstas aportan datos que pueden modificar la probabilidad de un diagnóstico al reducir la incertidumbre sobre si un paciente tiene una afección de interés.1-2 El diagnóstico consiste, pues, en decidir, en base a la información obtenida de las pruebas diagnósticas, si una persona está o no enferma, si bien en la mayoría de las veces existirá alguna incertidumbre. Aunque la evaluación de las pruebas diagnósticas desempeña un papel central en la actividad clínica, los profesionales sanitarios reciben un escaso entrenamiento formal para ella, cuya incorporación a la práctica clínica históricamente no ha tenido el mismo control que las intervenciones terapéuticas.1,3 En múltiples estudios se ha demostrado que los trabajos referidos a pruebas diagnósticas publicados, incluso en prestigiosas revistas, adolecen de importantes sesgos y problemas metodológicos que generalmente llevan a la sobreestimación de la validez de las mismas.3 En el presente capítulo se describen los aspectos más importantes que permitan a diseñar y llevar a cabo estudios de validación de pruebas diagnósticas de calidad.
FASES DE UN ESTUDIO DE EVALUACIÓN DE PRUEBAS DIAGNÓSTICAS Al igual que el diseño de un ensayo clínico, estos estudios constan de diferentes fases, cada una de las cuales debe responder a una pregunta concreta. Solo se puede pasar a la siguiente fase en el caso de que la respuesta a la cuestión de la anterior sea afirmativa.2 • Fase I: ¿Los resultados de la prueba diagnóstica en pacientes con la enfermedad difieren de los de las personas normales (no enfermas)? • Fase II: ¿Son los individuos con determinados resultados de la prueba más propensos a tener la enfermedad que los pacientes con otros resultados de la prueba? • Fase III: ¿El resultado de la prueba diagnóstica discrimina a los individuos con y sin la enfermedad en los individuos en los que es clínicamente razonable sospechar que la enfermedad está presente? • Fase IV: ¿A los pacientes que se someten a esta prueba diagnóstica les va mejor (“consecuencias” en salud) que a pacientes similares que no han sido testados? 131
Manual del Investigador Novel
ELEMENTOS CLAVE PARA AUMENTAR LA CALIDAD DE LOS ESTUDIOS DE VALIDACIÓN DIAGNÓSTICA La estructura básica de este tipo de estudio está constituida por las etapas óptimas, el patrón de referencia (gold standard), los posibles tipos de diseño y la descripción del método dirigido a describir de forma adecuada los resultados del estudio. La combinación óptima de estos ingredientes va a condicionar la calidad del estudio al disminuir los posibles sesgos que se producen con más frecuencia.1-2,4-8 Estructura básica Estamos ante un problema clínico que es posible medir de forma fiable mediante una prueba de referencia o gold standard, pero existe otro test (tal vez más económico o invasivo) que también podría diagnosticar la enfermedad. El objetivo de nuestro estudio será averiguar si la nueva prueba podría ser sustituta de la habitual en todos o algunos casos. Pasos a seguir en los estudios Primera: Definir de forma clara las pruebas que se van a analizar en el estudio (prueba nueva y el patrón de referencia o gold standard). El patrón de referencia debe ser el mejor método accesible para determinar si un paciente tiene la enfermedad o estado de interés. Como este método muchas veces es invasivo y/o caro, motivo por el cual pretendemos validar otras pruebas, realizar estos patrones a individuos no enfermos suele generar problemas, o no es del todo ético, por lo que estaríamos ante el sesgo de referencia o verificación parcial. En algunos estudios se opta por realizar un seguimiento del paciente al no poder realizarse el patrón de referencia, lo que implicaría un posible sesgo de verificación diferencial. Ambas soluciones suelen conllevar una sobreestimación del rendimiento diagnóstico de la nueva prueba a validar. En relación con el patrón de referencia, resulta también importante considerar si es capaz de clasificar el estado de enfermedad en todas las observaciones. En el caso de que existan observaciones con un diagnóstico indeterminado, si éstas son excluidas del análisis se producirán estimaciones sesgadas de las características operativas de la prueba diagnóstica. Este sesgo, conocido como sesgo por exclusión de indeterminados, ocasiona habitualmente sobrestimaciones de la sensibilidad y de la especificidad. Segunda: Enmascarar la interpretación de las pruebas de modo que ambas sean evaluadas de forma independiente y ciegas entre sí. Esta exigencia es tanto más importante cuanto mayor componente de interpretación subjetiva tengan las pruebas. Este paso evita el sesgo de revisión, que puede llevar tanto a sobrestimación como a subestimación. Tercera: Evitar que la prueba de referencia “dependa de” o “incorpore a” la prueba a analizar, con lo que así evitamos el sesgo de incorporación. Cuarta: Elegir adecuadamente la población a estudiar. La prueba debe validarse en los individuos en los que se pretende evaluar en el futuro y, si es posible, en una muestra consecutiva de pacientes. También deben incluirse a sujetos con diferentes grados de gravedad de la enfermedad, es decir, no solo los muy enfermos, también los no enfermos y, entre estos, a pacientes en los que la enfermedad entre en el diagnóstico diferencial, y no solo exclusivamente sanos, con lo que disminuiremos el sesgo de espectro. Quinta: Seleccionar correctamente el diseño de estudio. Podemos hacerlo a través de una única muestra, mediante un diseño transversal en el que incluiremos a sujetos a los que se les realizaría la prueba. Aunque este diseño tiene la ventaja de que la estimación de la 132
2.7. Validación de pruebas diagnósticas
validez y la exactitud diagnóstica puede hacerse forma directa, su inconveniente es que si la prevalencia es baja se precisan tamaños muestrales grandes. Otro posible diseño sería seleccionar dos muestras bien a partir del gold standard (diagnóstico definitivo) o bien a partir de la prueba a validar. El primero sería un diseño caso-control, siendo los casos los sujetos enfermos (prueba de referencia positiva), y los controles, los sujetos no enfermos, ya que ésta fue negativa. La ventaja principal de este diseño es su mayor potencia, al necesitarse tamaños muestrales más bajos. Sin embargo, como desventajas deben destacar que solo puede estimarse parcialmente la validez diagnóstica –pues puede determinarse de forma directa los valores predictivos que dependen de la prevalencia–, que solo puede calcularse de forma indirecta y que tiende a sobreestimar el verdadero valor de la prueba a validar. Si partimos del resultado de la nueva prueba, hablaríamos de un estudio de cohortes, una en la que el resultado fue positivo y otra en la que fue negativo. Sus ventajas e inconvenientes son contrarios a los de caso-control, pudiendo calcularse solamente la sensibilidad y la especificidad de forma directa y precisando tamaños muestrales amplios en el caso de una prevalencia de enfermedad baja. Al comprobar solo los casos positivos, incurriríamos en el sesgo de verificación o confirmación. Sexta: Describir con detalle los métodos realizados para permitir su reproducción en otro entorno y los términos de normalidad y anormalidad que se van a considerar y el análisis de la interpretación de los resultados. Séptima: Tener en cuenta los posibles resultados del estudio, que serán la capacidad discriminatoria de la prueba entre enfermos y no enfermos (sensibilidad y especificidad), el rendimiento de la misma (valores predictivos) o evaluar la utilidad y posible satisfacción de la prueba diagnóstica. La utilidad de una prueba dependerá de la capacidad para producir los mismos resultados cada vez que se aplica en condiciones similares (fiabilidad) y de que sus mediciones reflejen exactamente el fenómeno que se intenta medir (validez y exactitud), pero también de su rendimiento clínico y de su coste. Por su importancia, sobre todo en la evaluación de los estudios de validación de pruebas diagnósticas, este aspecto se comenta de forma más detallada en el siguiente apartado. En la figura 2.7.1 se representa un esquema de los pasos clave de un estudio de validación de una prueba diagnóstica.
VALIDEZ, FIABILIDAD Y PRECISIÓN DE LOS ESTUDIOS DE PRUEBAS DIAGNÓSTICAS Validez Para evaluar la validez de una prueba diagnóstica se requiere un patrón de referencia. El grado de acuerdo entre la prueba diagnóstica y el patrón de referencia puede ser representado en una tabla de contingencia (2x2), de donde se obtiene, entre otros, la sensibilidad (S), especificidad (E), valor predictivo positivo (VPP) y valor predictivo negativo (VPN). En la tabla 2.7.1 se expresan los indicadores de validez de una prueba diagnóstica a través de los resultados de un estudio hipotético sobre la utilidad de una prueba diagnóstica utilizando su patrón de referencia, tomado de la referencia 4. La S considera la validez de la prueba entre los enfermos (corresponde a la probabilidad de que la prueba sea positiva en sujetos con la enfermedad) y la E la validez de la prueba entre los sanos (corresponde a la 133
Manual del Investigador Novel
probabilidad de que el resultado de la prueba sea negativo en sujetos sanos). Los valores complementarios de la S y la E corresponden a las probabilidades de los resultados falsos negativos (FN) y falsos positivos (FP), respectivamente. Cuando una prueba tiene una S muy alta, un resultado negativo sirve para descartar la enfermedad (la probabilidad de un FN es muy pequeña); si la prueba tiene una E muy alta, un resultado positivo es prácticamente diagnóstico (la probabilidad de un FP es muy pequeña).4-5 El VPP es la probabilidad de encontrar la enfermedad en individuos con un resultado positivo de la prueba. El VPN es la probabilidad de no encontrar la enfermedad en individuos con un resultado negativo de la prueba. S y E son propiedad intrínseca de las pruebas diagnósticas, que presentan una relación recíproca entre ambas y cuyos resultados son independientes de la prevalencia de la enfermedad, a diferencia de los valores predictivos. Así, cuanto mayor sea la prevalencia de la enfermedad, mayor será el VPP y menor el VPN; los valores predictivos tienen una utilidad postprueba.2,4-5 Las características operativas tradicionales de las pruebas diagnósticas –la S, la E, el VPP y el VPN– tienen algunas limitaciones para su uso en la práctica clínica diaria. La S y la E no brindan información suficiente para tomar decisiones junto al paciente, y consideradas aisladamente, es imposible concluir si un paciente tiene o no una determinada enfermedad. La interpretación del resultado de una prueba, en el contexto del diagnóstico, requiere el uso de los valores “predictivos”, y éstos, a su vez, pueden tener valores diferentes en cada escenario clínico de acuerdo con la prevalencia o probabilidad previa de la enfermedad. Como alternativa para vencer esas limitaciones, en la literatura médica de los últimos años se ha propuesto otra herramienta con algunas ventajas prácticas para la evaluación y utilización de las pruebas diagnósticas: el cociente de probabilidades (CP, Likelihood Ratio en inglés). El CP compara la probabilidad de encontrar el resultado de la prueba (positivo, negativo, o cualquiera que éste sea) en personas enfermas, con la probabilidad de encontrar ese mismo resultado en personas sin la enfermedad. Cuando el resultado de la prueba en estudio es positivo, este resultado debe ser más frecuente en los enfermos que en los no enfermos; y cuando el resultado de la prueba es negativo, éste debe ser más frecuente en los no enfermos que en los enfermos. De este modo, el CP dice cuántas más –o menos– veces es frecuente el resultado de una prueba en personas enfermas comparado con personas sin la enfermedad.4-5 Para la situación más simple, tenemos dos tipos: cociente de probabilidades de un resultado positivo (CP+) y cociente de probabilidades de un resultado negativo (CP-) (Tabla 2.7.2). 1). Dado que los CP relacionan la S y la E, no varían con la prevalencia. Los CP adoptan valores entre 0 e infinito, siendo el valor nulo el 1, y cuya interpretación se valora según los criterios expresados en la tabla 2.8.2. El CP es una medida de gran utilidad en la práctica clínica. Su principal utilidad es permitir calcular la probabilidad postprueba (Ppost = probabilidad de que un sujeto tenga la enfermedad si obtiene un resultado positivo en la prueba o VPP ajustado) a partir de cualquier probabilidad preprueba (Ppre = probabilidad de que un sujeto tenga la enfermedad antes de aplicarle la prueba) o prevalencia, y de esta forma evaluar cuánto puede ganarse si se realiza. El objetivo de la realización de la prueba diagnóstica es, una vez conocido el resultado, modificar esta Ppre hasta obtener una Ppost; la magnitud y dirección de ese cambio va a depender de las características operativas de la prueba diagnóstica, pero en todo caso debemos tener en cuenta que el punto de partida, la Ppre, va a resultar muy importante en ese proceso.4,6 Para operar con los CP en el cálculo de probabilidades, éstas deben transformarse en ventajas (odds) (Tabla 2.7.1); los pasos a seguir son: 1) transformar la Ppre en odds preprueba = Ppre/1-Ppre; 2) obtener la odds postprueba = CP+ x odds preprueba; 3) obtener la Ppost= odds postprueba/1 + odds postprueba. La diferencia que exista entre la Ppre y Ppost informa de la utilidad de una determinada prueba diagnóstica; a mayor diferencia entre una y otra probabilidad, mayor contribución de la prueba al proceso diagnóstico. 134
2.7. Validación de pruebas diagnósticas
Afortunadamente, existe un modo más simple de realizar estos cálculos, como es el Nomograma de Fagan6,8 (Figura 2.7.2). Existen muchas calculadoras web y aplicativos para dispositivos móviles que permiten realizar estos cálculos de forma directa. Todos estos estimadores de validez pueden ser aplicados a pruebas con resultados discretos con más de dos categorías e incluso a resultados expresados en variables continuas. En este caso, podemos establecer puntos de corte para convertir el resultado en una variable discreta con dos o más categorías. Otra alternativa que permite explorar la capacidad diagnóstica de una prueba en sus distintos valores son las curvas ROC (iniciales del término inglés Receiver Operating Characteristics), con las que podemos conocer su validez global y seleccionar el punto o puntos de corte más adecuados. La curva ROC es un gráfico en el que se observan todos los pares S/E resultantes de la variación continua de los puntos de corte en todo el rango de resultados observados. En el eje Y de coordenadas se sitúa la S o fracción de VP, definida como se expuso anteriormente y calculada en el grupo de enfermos (Figura 2.7.3). En el eje X se sitúa la fracción de FP o 1-especificidad, definida como FP/VN + FP y calculada en el subgrupo no afectado. Cada punto de la curva representa un par S/1-E correspondiente a un nivel de decisión determinado. Una prueba con discriminación perfecta, sin solapamiento de resultados en las dos poblaciones, tiene una curva ROC que pasa por la esquina superior izquierda, donde S y E toman valores máximos (S y E = 1). Una prueba sin discriminación, con igual distribución de resultados en los dos subgrupos, da lugar a una línea diagonal de 45º, desde la esquina inferior izquierda hasta la superior derecha. La mayoría de las curvas ROC caen entre estos dos extremos. Si cae por debajo de la diagonal de 45º, se corrige cambiando el criterio de positividad de “mayor que” a “menor que”, o viceversa. De lo anterior se desprende que el área bajo la curva ROC (ABC) se puede utilizar como un índice conveniente de la exactitud global de la PD, donde la validez máxima corresponde a un valor de ABC de1 y la mínima a uno de 0,5. El uso de estas gráficas aporta también la ventaja de permitir comparar visualmente de forma directa el poder discriminativo de dos pruebas diferentes4-5 (Figura 2.7.3). Fiabilidad La fiabilidad de una prueba viene determinada por la estabilidad de sus mediciones cuando se repite en condiciones similares. La variabilidad de las mediciones va a estar influida por múltiples factores que interesa conocer y controlar. Entre ellos, tiene especial importancia distinguir las variaciones de interpretación intraobservador e interobservador. La fiabilidad puede ser evaluada para resultados discretos nominales mediante el índice kappa (IK), para resultados discretos ordinales mediante el índice kappa ponderado y para resultados continuos mediante el coeficiente de correlación intraclase y el método de Bland-Altman. El IK nos ofrece una estimación del grado de acuerdo no debido al azar a partir de la proporción de acuerdo observado (Po) y la proporción de acuerdo esperado (Pe) = Po-Pe/ 1-Pe. El IK puede adoptar valores entre -1 y + 1: es 1 si existe un acuerdo total, 0 si Po es igual a Pe, y menor de 0 si Po es inferior a Pe por azar.4,6 Para su interpretación, diferentes autores han propuesto varias clasificaciones (Figura 2.7.4). Precisión Al igual que en otros tipos de estudios, la valoración de la validez de las pruebas diagnósticas se hace sobre muestras, por lo que los resultados obtenidos son sólo estimaciones puntuales, sujetas a variabilidad aleatoria, y por lo tanto deben expresarse con sus intervalos de confianza (IC). Estos IC tendrán que ser aplicados en el cálculo de la Ppost para poder juzgar la utilidad de la prueba diagnóstica.
135
Manual del Investigador Novel
CONTROL DE CALIDAD DE LOS ESTUDIOS DE PRUEBAS DIAGNÓSTICAS Como se comentaba en la introducción, con la investigación en pruebas diagnósticas, a pesar de ser un campo muy dinámico debido al desarrollo tecnológico, no ha ocurrido lo mismo que en los estudios sobre intervenciones terapéuticas que siguen un cuidado y detallado proceso marcado por las agencias reguladoras en el que se suceden estudios de complejidad creciente. Al no producirse este razonable control, han surgido iniciativas para corregir la situación. Algunas han ido dirigidas a que el proceso de validación de pruebas diagnósticas sea un proceso conceptual y paralelo al proceso de evaluación de fármacos con estudios preliminares o exploratorios, de validación retrospectiva y prospectiva, y, por último, de impacto y utilidad.1-2 Otras iniciativas van dirigidas a los editores de las revistas y los autores e incluyen unos listados de puntos que resultan esenciales para que se facilite la identificación de posibles sesgos del estudio (atentados a la validez interna) y se puedan valorar en su justa medida la aplicabilidad y la posibilidad de generalizar los resultados (validez externa). Una de ellas ha partido de un grupo de trabajo de la Colaboración Cochrane y tiene como fin mejorar la calidad de las pruebas diagnósticas. Para ello, este grupo recomienda que los artículos que se publiquen reúnan unos STARD (Standars for Reporting of Diagnosis Accuracy), y proponen un listado de 25 elementos de información referidos a elementos de diseño del estudio, del test de evaluación y de sus resultados2,9 (Tabla 2.7.3). Por último, existen iniciativas que, aunque en principio se dirigieron a los investigadores que realizan revisiones sistemáticas de estudios de validez diagnóstica, indirectamente también se dirigen a quienes realizan la investigación primaria, como la norma QUADAS1,10 (Tabla 2.7.4). Otra herramienta útil podría ser el Transparent reporting of a multivariable prediction model for individual prognosis or diagnosis (TRIPOD),11 publicado de forma simultánea en 11 revistas y a cuyas listas de comprobación es posible acceder a través del link https://www.equator-network.org/reporting-guidelines/tripod-statement/. Estos listados proporcionan un método muy útil para medir la calidad de los distintos estudios y la detección de posibles errores y deben ser sistemáticamente utilizados por los investigadores que realizan estudios de validación diagnóstica.
PUNTOS CLAVE • Un estudio de pruebas diagnósticas debe seguir una serie de fases, cada una de las cuales debe responder a una pregunta concreta sobre los resultados e individuos a analizar. Solo puede pasarse a la siguiente fase en el caso de que la respuesta a la cuestión de la anterior sea afirmativa. • Los elementos clave para aumentar la calidad de los estudios de validación diagnóstica son la estructura básica de este tipo de estudios, las etapas óptimas, el patrón de referencia (gold standard), los posibles tipos de diseño y la descripción del método dirigido a describir de forma adecuada los resultados del estudio. La combinación óptima de estos ingredientes va a condicionar la calidad del estudio, pues disminuirá los sesgos que se producen con más frecuencia. • En este tipo de estudios debe analizarse su validez (sensibilidad, especificidad, valores predictivos y cocientes de probabilidad), fiabilidad (índice Kappa o coeficiente de correlación intraclase) y precisión (intervalos de confianza). • Existen una serie de listados y herramientas muy útiles para medir la calidad de los distintos estudios y la detección de posibles errores, y se recomienda su utilización sistemática en las investigaciones de validación diagnóstica.
136
2.7. Validación de pruebas diagnósticas
BIBLIOGRAFÍA 1. Abraira V, Zamora J. Criterios de calidad de los estudios de pruebas diagnósticas. FMC. 2008;15:460461. 2. Rodríguez Álvarez MX. Diseñando un estudio de pruebas diagnósticas. Itinerario de Investigación e Innovación Biosanitaria. FEGAS/SERGAS. En: http://fegasmultimedia.sergas.es/default.aspx?action=play&conferenceGUID=8b18ce66-1722-40a6-86b7-10e89b5d20cb. Consultado el 1 de diciembre de 2019. 3. Carnero-Pardo C. Evaluación de pruebas diagnósticas. Rev Neurol. 2005;40:641-643. 4. Ochoa Sangrador C, González de Dios J, Buñuel Álvarez JC. Evaluación de artículos científicos sobre pruebas diagnósticas. Evid Pediatr. 2007;3:24. 5. Jaeschke R, Guyatt G, Sackett DL. Users’ guides to the medical literature. III. How to use an article about a diagnostic test. A. Are the results of the study valid? Evidence-Based Medicine Working Group. JAMA. 1994;271:389-391. 6. Jaeschke R, Guyatt GH, Sackett DL. Users’ guides to the medical literature. III. How to use an article about a diagnostictest. B. What are the results and will they help me in caringfor my patients? The Evidence-Based Medicine Working Group. JAMA. 1994;271:703-707. 7. Grimes DA, Schulz Kf. Refining clinical diagnosis with likelihood ratios. Lancet. 2005;365:1500-1505. 8. Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med. 1975;293:257. 9. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, et al. Towards complete and accurate reporting of studies of diagnostic accuracy: The STARD Initiative. Ann Intern Med. 2003;138: 40-44. 10. Whiting P, Rutjes AW, Reitsma JB, Bossuyt PM, Kleijnen J. The developmentof QUADAS: a tool for the quality assessment of studies ofdiagnostic accuracy included in systematic reviews. BMC Med Res Methodol. 2003;3:25. 11. Moons KG, Altman DG, Reitsma JB, Ioannidis JP, Macaskill P, Steyerberg EW, et al. Transparent Reporting of a multivariable prediction model for Individual Prognosis or Diagnosis (TRIPOD): Explanation and Elaboration. Ann Intern Med. 2015;162:W1-W73.
137
Manual del Investigador Novel
TABLAS Y FIGURAS Tabla 2.7.1. Medidas de utilidad de una prueba diagnóstica. Resultados de un estudio hipotético de la utilidad de una prueba diagnóstica, utilizando su patrón de referencia
Prueba de referencia Prueba diagnóstica
Positiva
Negativa
Positiva
225 VP (a)
25 FP (b)
250 (a+b)
Negativa
100 FN (c)
400 VN (d)
500 (c+d)
325 (a+c)
425 (b+d)
750 (a+b+c+d)
(a) Verdaderos positivos (VP): enfermos con la prueba positiva
(b) Falsos positivos (FP): no enfermos con la prueba positiva (c) Falsos negativos (FN): enfermos con la prueba negativa (d) Verdaderos negativos (VN): no enfermos con la prueba negativa a+c: casos con patrón de referencia positivo (enfermos) b+d: casos con patrón de referencia negativo (no enfermos) a+b: casos con la prueba diagnóstica positiva c+d: casos con la prueba diagnóstica negativa Sensibilidad (S) = a/(a+c) = 225/325 = 69,2% Especificidad (E) = d/(b+d) = 400/425 = 94,1% Falsos negativos (FN) = 1-S = 30,8% Falsos positivos (FP) = 1-E = 5,9% Valor predictivo positivo (VPP) = a/(a+b) = 225/250 = 90,0% Valor predictivo negativo (VPN) = d/(c+d) = 400/500 = 80,0% Cociente de probabilidad positivo (CP+) = S/(1-E) = 69,2/5,9 = 11,7 Cociente de probabilidad negativo (CP-) = 1-S/E = 30,8/94,1 = 0,32 Prevalencia o probabilidad preprueba (Ppre) = (a+c)/(a+b+c+d) = 325/750 = 43,03% Odds preprueba = Ppre/(1-Ppre) = 43,3/56,7 = 0,76 Odds postprueba = CP+ x odds preprueba = 11,7 x 0,76 = 8,89 Probabilidad postprueba (Ppost) = odds postprueba/(odds postprueba + 1) = 8,89/9.89 = 89,8%
138
2.7. Validación de pruebas diagnósticas
Tabla 2.7.2. Interpretación de los cocientes de probabilidad Valor del CP + y CP-
Interpretación
CP+ >10 ó CP- <0,1
Generan cambios amplios y a menudo concluyentes desde una probabilidad preprueba hasta una probabilidad postprueba
CP+ 5-10 y CP- 0,1-0,2
Generan cambios moderados desde la probabilidad preprueba hasta la probabilidad postprueba
CP+ 2-5 y CP- 0,5 – 0,2
Generan cambios pequeños (pero en ocasiones pueden ser importantes) de la probabilidad
CP+ 1-2 y CP- 0,5-1
Alteran la probabilidad en un grado insignificante (y rara vez importante)
CP+: cociente de probabilidad positivo; CP-: cociente de probabilidad negativo
139
Manual del Investigador Novel
Tabla 2.7.3. Lista STARD para el informe de los estudios de precisión diagnóstica TÍTULO / RESUMEN
1
El artículo se identifica como un estudio de VD
INTRODUCCIÓN
2
Consta que el objetivo es estimar la VD o compararla con la de otro test
3
Describe la población estudiada y los criterios de selección y exclusión
4
Describe el criterio de reclutamiento: síntomas, otros test, hacer el test actual
5
Describe el muestreo: consecutivo, aleatorio, no especificado
6
Describe la recogida de datos: prospectivo o retrospectivo
7
Describe la prueba de referencia y su justificación
8
Describe o referencia las especificaciones técnicas y como tomar las medidas
9
Describe las unidades de medida, puntos de corte o categorías de los r esultados
10
Describe el número, entrenamiento y experiencia de los que realizan el test
11
Describe si la aplicación dela prueba y del test de referencia se realizó de forma ciega
12
Describe los métodos para calcular o comparar la VD y el grado de incertidumbre
13
Describe cálculo de la fiabilidad y cómo se ha hecho
14
Informa cuando se realizó el estudio (fecha de inicio y finalización del r eclutamientende
15
Informa de los caracteres demográficos y clínicos
16
Informa de las razones para la pérdida (diagrama de flujo)
17
Informa del tiempo y circunstancias (tratamiento) entre el test y el estándar
18
Informa del grado de afectación de los enfermos y del diagnóstico de los no enfermos
19
En caso de valores discretos hay tabla 2x2 con los resultados. En caso de valores continuos se informa de la distribución. Se describe los resultados perdidos e indeterminados
20
Se describen los efectos adversos del test y del estándar
21
Se describe la VD y su incertidumbre estadística (p. ej. IC 95%)
22
Informa como se ha manejado los perdidos, indeterminados o extremos
23
Informa de la variabilidad de la VD entre evaluadores, centros y subgrupos
24
Informa sobre la fiabilidad en el caso de que se haya evaluado
25
Discute la aplicabilidad clínica de los hallazgos del estudio
MÉTODOS Participantes
Métodos de las pruebas
Métodos estadísticos
RESULTADOS Participantes
Resultados de las pruebas
Estimación
DISCUSIÓN
VD: Validez diagnóstica; IC 95%: Intervalo de confianza del 95% 140
2.7. Validación de pruebas diagnósticas
Tabla 2.7.4. Ítems de la herramienta QUADAS 1. ¿Es representativa la muestra? 2. ¿Se describen bien los criterios de selección? 3. ¿Clasifica bien el patrón de referencia? 4. Si el patrón y la prueba no se aplican simultáneamente, ¿es razonable pensar que la enfermedad no haya evolucionado en ese tiempo 5. ¿Sesgo de verificación parcial? 6. ¿Sesgo de verificación diferencial? 7. ¿Es el patrón de referencia independiente de la prueba? (p. ej., la prueba no forma parte del patrón) 8. Detalle de la ejecución de la prueba 9. Detalle de la ejecución del estándar 10. ¿Se interpretó la prueba sin conocer el resultado del patrón? 11. ¿Se interpretó el patrón sin conocer el resultado de la prueba? 12. ¿La información clínica disponible en la interpretación de la prueba es la misma que habrá cuando se use en la práctica? 13. ¿Se informa de los resultados no interpretables? 14. ¿Se explican las pérdidas?
Figura 2.7.1. Esquema de los pasos claves de un estudio de evaluación de los estudios de pruebas diagnósticas
141
Manual del Investigador Novel
Figura 2.7.2. Nomograma de Fagan para la interpretación de los cocientes de probabilidad
142
2.7. Validación de pruebas diagnósticas
Figura 2.7.3. Curvas ROC. Ejemplos de dos pruebas con diferente nivel de discriminación Ejemplo 1: Sabemos que la probabilidad preprueba de una determinada prueba diagnóstica es del 10% y el cociente de probabilidad negativa es de 0,2. El resultado negativo de esta prueba haría que la probabilidad postprueba fuera del 2% (línea continua azul). Ejemplo 2: Sabemos que la probabilidad preprueba de una determinada prueba diagnóstica es del 30% y el cociente de probabilidad negativa es de 0,05. El resultado negativo de esta prueba haría que la probabilidad postprueba fuera del 2% (línea discontinua roja).
Figura 2.7.4. Clasificaciones propuestas para la interpretación del Índice de Kappa
143
Manual del Investigador Novel
144
2.8. Validación de cuestionarios
2.8. VALIDACIÓN DE CUESTIONARIOS Dr. Ignasi Serra Pons Dra. Judith García Aymerich
INTRODUCCIÓN El cuestionario es una de las técnicas más utilizadas en el campo de la investigación para la recogida de datos. Es una herramienta económica que nos permite recoger información relevante del aspecto de salud que queremos estudiar. Esta información será más o menos útil en función de la calidad del cuestionario. Por esa razón, es de vital importancia su validación. Si se utiliza información extraída de un cuestionario de salud que no haya sido validado, las conclusiones obtenidas de esos datos carecerán de un valor y no las podremos creer. No será una buena herramienta. La validación de cuestionarios es un tema complejo en el campo de la salud. Su principal complejidad viene dada por el objetivo que tienen este tipo de herramientas: medir de forma objetiva una característica (dimensión) o características de salud que provienen de una definición conceptual. Por ejemplo: la ansiedad, el bienestar físico, la calidad de vida, la cantidad de actividad física, el nivel nutricional… En todos los casos pretendemos cuantificar un concepto no observable directamente, tenemos una idea subjetiva de lo que queremos. El cuestionario es el instrumento que consigue acercarnos a esta idea empíricamente. Es difícil desarrollar una herramienta que nos proporcione una escala de valoración cuantitativa a partir de ideas, actitudes, sentimientos y percepciones personales. En consecuencia, valorar la calidad de estos instrumentos resulta complejo. Lo que está claro es que, cuanto más precisos y minuciosos seamos en todos los pasos de elaboración de un cuestionario, éste será de más calidad, y por lo tanto, será más válido. En general, para desarrollar una herramienta válida y fiable es necesario tener en cuenta dos fases: la elaboración del cuestionario y su validación (Figura 2.8.1). Sin embargo, cabe mencionar que la validación es un aspecto a considerar en todo el proceso de desarrollo de la herramienta, desde la elaboración de cada uno de los ítems hasta conseguir una escala útil para medir el constructo del estado de salud en el cual estamos interesados. En este capítulo desarrollamos los conceptos y métodos más importantes para realizar la validación de cuestionarios durante todo el proceso.
145
Manual del Investigador Novel
ELABORACIÓN DE UN CUESTIONARIO En la primera fase se define el aspecto a medir o constructo1 y sus dimensiones (puede tener más de una dimensión) y se elaboran las preguntas o ítems del cuestionario. Esta fase suele ser costosa, pues requiere una investigación cualitativa, varias revisiones bibliográficas y el contacto con expertos en la materia de interés. Se recomienda formar un comité lo más multidisciplinar posible que reúna aspectos de salud, metodológicos y de redacción. A continuación se detallan los puntos a definir claramente. (1) El objetivo, el aspecto a medir (constructo) y sus dimensiones. Hay que llegar a una idea clara de lo que se quiere medir y para qué. Un mismo constructo se puede definir de varias formas. Hay que consensuar una definición lo más precisa posible del fenómeno que queremos cuantificar y si lo que medimos tiene una sola dimensión o varias. Por ejemplo, el estudio PROactive pretendía desarrollar un cuestionario para medir la experiencia de actividad física de los pacientes con enfermedad pulmonar obstructiva crónica (EPOC). Tras la investigación cualitativa (entrevistas individuales y grupos focales, ambos con pacientes y expertos), se identificó que el constructo “experiencia de actividad física” era descrito por los pacientes en tres dimensiones: “cantidad de actividad física”, “síntomas experimentados durante la actividad física” y “adaptaciones realizadas para facilitar la actividad física”.13 (2) La población a quien va dirigida. Hay que delimitar la población objetivo en la cual administraremos la herramienta. Según la población objetivo, las preguntas del cuestionario y su enfoque serán distintos aunque pretendan medir el mismo constructo. Por ejemplo, no es lo mismo evaluar el nivel de actividad física en pacientes con EPOC mayores de 45 años que en adolescentes que van al instituto. Estas dos poblaciones son muy distintas y, por lo tanto, el enfoque del cuestionario también será diferente. (3) La forma de administración. Según el constructo y la población objetivo, podemos administrar el cuestionario de varias formas: telefónicamente, autoadministrado, a modo de entrevista personal o a través de plataformas digitales. Por ejemplo, en una población mayor y con problemas de salud, probablemente sea más fácil recoger la información a través de una entrevista personal en el hospital que utilizando nuevas tecnologías que requieran cierto nivel de práctica y entrenamiento. Utilizando una forma u otra podemos obtener información de calidad distinta. (4) Los ítems. Crear los ítems implica definir el formato, la redacción, el orden de los mismos, la codificación de las respuestas y la puntuación de cada una de ellas para generar una escala clara. El ítem es la unidad primaria del cuestionario. Consiste en una pregunta con una respuesta cerrada con diferentes opciones. Cada opción de respuesta tiene un valor que contribuye a la puntuación de la escala final. El diseño, la redacción y el orden de los ítems dependerán del constructo a medir, de sus dimensiones y de la forma de administración. (5) Prueba piloto. Antes de la siguiente fase, se realiza una primera valoración de la herramienta para, si es preciso, mejorarla. En este punto se valora la viabilidad (feasibility, en inglés) del cuestionario con una muestra de unos 30-40 participantes con los mismos criterios de inclusión que la población objetivo. Este número puede variar en función del tipo de cuestionario elaborado. El objetivo es hacer un informe con las principales dificultades de comprensión del cuestionario entrevistando personalmente a los participantes. Se valorará la calidad de las preguntas, el tiempo utilizado en responderlas, la facilidad de entendimiento, el formato de administración y otros aspectos cualitativos del instrumento. La viabilidad es una validación cualitativa del cuestionario antes de su redacción final. En esta primera fase de elaboración del cuestionario se utilizan diversas técnicas estadísticas. Las más relevantes para los investigadores clínicos son el análisis factorial y los modelos de la teoría de respuesta de los ítems. 146
2.8. Validación de cuestionarios
El primero, el análisis factorial, nos indica si hemos definido correctamente las dimensiones del constructo de interés. Es un análisis que nos muestra la variabilidad capturada por todos los ítems dentro de las diferentes dimensiones teóricas que hemos usado para definir el constructo. Nos crea unos factores latentes que deberían representar las dimensiones teóricas descritas en la primera fase. Por ejemplo, en el estudio PROactive se crearon los ítems correspondientes a las dimensiones etiquetadas por los pacientes como “cantidad de actividad física”, “síntomas” y “adaptaciones”. En el siguiente paso se realizó el análisis factorial con los resultados de los ítems medidos en 236 pacientes con EPOC. Se identificó que los ítems del cuestionario se distribuían en dos dimensiones, “cantidad de actividad física” (correspondiente a los ítems desarrollados con los pacientes en la dimensión “cantidad”) y “dificultad con la actividad física” (incluyendo los ítems de las dimensiones “síntomas” y “adaptaciones”).14 En este caso, el análisis factorial sugirió que la mejor manera de agrupar la información era en dos factores independientes (las dos dimensiones) y nos informó de los ítems asociados a cada una de ellas así como de la variabilidad explicada por estos ítems en la dimensión a la cual pertenecían. El segundo, la teoría de respuesta de los ítems, nos permite estudiar las propiedades de cada uno de los ítems según la probabilidad de sus respuestas. En función de las probabilidades de respuesta en cada categoría de cada ítem podemos reducir el número de ítems del cuestionario final e incluso agrupar categorías que se solapan dentro de un ítem determinado. Por ejemplo, en la dimensión “dificultad de actividad física” del estudio PROactive se partió de 26 ítems iniciales, y después, mediante análisis de teoría de respuesta de los ítems, se mejoró gradualmente el cuestionario reduciendo esta dimensión a tan sólo 5 ítems. Se consiguió omitir ítems redundantes que explicaban la misma información que otros dentro de la propia dimensión “dificultad”.
VALIDACIÓN DEL CUESTIONARIO Una vez elaborado el instrumento que cuantifica el constructo definido, debemos analizar sus principales propiedades psicométricas: la fiabilidad, la validez y la respuesta al cambio.2 Los conceptos de validez y fiabilidad, así como el error aleatorio y sistemático, a los cuales también haremos referencia, se presentan en este mismo capítulo. La respuesta al cambio es una propiedad de los cuestionarios que algunos autores analizan separadamente de la validación. Nosotros la presentamos conjuntamente por cuestiones pedagógicas. Es importante mencionar que la bibliografía está repleta de múltiples teorías e índices estadísticos para valorar las propiedades psicométricas de los cuestionarios. En este capítulo se muestran las principales y más utilizadas que todo investigador clínico debe conocer. A partir de aquí, se puede afinar más o menos según las características propias de cada estudio. Fiabilidad La fiabilidad (reliability en inglés) es la capacidad del instrumento para proporcionar medidas con precisión, es decir, con el mínimo error posible. La fiabilidad está sometida solamente al error aleatorio y mide la proporción de la variabilidad en las mediciones debida únicamente a diferencias entre los individuos.1,3 La fiabilidad se valora a través de la coherencia interna, la fiabilidad intra-observador o test-retest y la fiabilidad inter-observador. Coherencia interna La coherencia interna de un cuestionario valora en qué medida los ítems que lo forman están relacionados entre sí y, por lo tanto, en qué medida presentan una homogeneidad común para medir el constructo de interés. Si el cuestionario está formado por ítems que miden diferentes dimensiones del mismo constructo, 147
Manual del Investigador Novel
los ítems relacionados con cada una de las dimensiones deben presentar una buena homogeneidad entre ellos. Esta homogeneidad se mide con el estadístico Alfa de Cronbach, un índice con valores entre 0 y 1. Se considera que el instrumento tiene una buena coherencia interna a partir del valor 0,7, siendo aconsejable tener valores comprendidos entre 0,7 y 0,9.4 Los valores mayores de 0,9 indican una coherencia muy buena, pero también pueden indicar la presencia de algún ítem redundante, es decir, la existencia de un ítem que mide exactamente lo mismo que otro. Por ejemplo, en la versión diaria del cuestionario PROactive de actividad física mencionado anteriormente5 los cuatro ítems de la dimensión “cantidad” muestran un Alfa de Cronbach de 0,77, y los cinco ítems de la dimensión “dificultad” toman valores de Alfa de Cronbach de 0,85. Podemos considerar entonces que el cuestionario tiene una buena coherencia interna. Fiabilidad intra-observador (test-retest) El test-retest se refiere a la concordancia obtenida en la puntuación de nuestro constructo de interés al repetirlo en dos o más momentos diferentes en el tiempo, es decir, analizamos la repetibilidad de la herramienta. Si el cuestionario tiene una escala cuantitativa, realizamos el análisis mediante el coeficiente de correlación intraclase (CCI).6 Es difícil valorar la correcta aplicabilidad de esta técnica porque el tiempo que debe pasar entre las dos administraciones del cuestionario no puede ser ni muy largo ni muy breve (habitualmente se consideran dos semanas). Si el tiempo es demasiado breve, nos veremos influenciados por el efecto recordatorio, y si es demasiado largo, pueden haber cambiado algunas condiciones del fenómeno medido. El CCI es un estadístico que se basa en la ANOVA de medidas repetidas y se calcula mediante el cociente de la variación debida a las dos medidas en el tiempo entre la variación total de las medidas. Es de fácil interpretación, ya que se parece a un índice de correlación, y su valor oscila entre 0 y 1. Son deseables CCI’s superiores a 0,8.4 Una alternativa (o complemento) a este índice es el método gráfico de Bland y Altman,7 en el que se representa la diferencia entre las dos medidas contra la media de ambas. Por ejemplo, la dimensión “dificultad” del cuestionario PROactive5 tiene un CCI = 0,87 y el Bland-Altman muestra diferencias prácticamente inexistentes entre las dos administraciones para todos los valores del cuestionario. Finalmente, si la escala medida es una escala cualitativa, lo cual sucede con mucha menos frecuencia, analizaremos la repetibilidad a través del índice de concordancia Kappa de Cohen.8 Fiabilidad inter-observador La fiabilidad inter-observador analiza el grado de acuerdo entre dos o más evaluadores diferentes. Utilizamos también los métodos ICC, Bland Altman y el índice de Kappa de Cohen según sea la escala de medida, cuantitativa o cualitativa. Este tipo de fiabilidad no es evaluable en cuestionarios auto administrados, en los que no existe evaluador. Validez La validez es la capacidad del instrumento de medir el constructo para el que ha sido elaborado. Por ejemplo, un cuestionario elaborado para medir la ansiedad debe medir la ansiedad y no la depresión. La validez está sometida al error sistemático, es decir, cuanto menos error sistemático tenga el instrumento, más válido va a ser. Es la característica que nos permite hacer buenas inferencias de las medidas del cuestionario al constructo de interés. Para estudiar la correcta validación de los cuestionarios debemos analizar sus cuatro dimensiones: validez aparente o lógica, de contenido, de constructo y de criterio. La validez aparente y la de contenido se evalúan de forma cualitativa, básicamente en la primera fase de elaboración del cuestionario, y se revisa después de la prueba piloto. Esta evaluación es subjetiva y requiere revisiones bibliográficas y expertos en el tema de interés. En este capítulo nos centramos en la validez de
148
2.8. Validación de cuestionarios
constructo y de criterio, ya que son las más relevantes para el investigador clínico y se evalúan de forma objetiva mediante estadísticos conocidos. Validez de constructo La validez de constructo evalúa de forma empírica y objetiva si las mediciones obtenidas a partir de la escala generada del fenómeno de interés se pueden considerar válidas y útiles para cuantificarlo. Una técnica utilizada para analizar este tipo de validez es el análisis factorial confirmatorio. Este método parte de un modelo teórico en el que se definen los diferentes factores (dimensiones del fenómeno de interés) y verifica que cada factor se corresponda con las dimensiones definidas a priori. Cuantifica la relación que existe entre los ítems y las dimensiones del constructo. Otra manera más fácil de analizar la validez de constructo es a través de la validez convergente y de la validez discriminante, ambas basadas en el cálculo de correlaciones. La validez convergente estudia la relación entre la escala creada y otras mediciones que ya sabemos que son válidas y están relacionadas con el fenómeno que estudiamos.1-3 Por ejemplo, para analizar la validez de constructo del cuestionario PROactive de actividad física5 calculamos la correlación entre la escala (y subescalas) del cuestionario y las variables “distancia recorrida en la prueba de la marcha” y “escala de disnea mMRC”, ya que existe abundante literatura que demuestra que, en pacientes con EPOC, la actividad física se relaciona con estos parámetros.9 El grado de validez del cuestionario se determina al comparar estas correlaciones con las esperadas por conocimiento experto o por la literatura. Se esperan siempre correlaciones menores de 0,9, ya que si son mayores se considera que nuestra escala mide exactamente lo mismo que la medición externa.4 De la misma forma, la validez discriminante estudia la relación entre la escala creada y otras variables que ya sabemos que no tienen relación alguna con nuestro constructo. Se considera que las correlaciones deben ser < 0,3. Siguiendo con el ejemplo anterior, para medir la validez discriminante del cuestionario PROactive5 se calculó la correlación entre el mismo y las variables “altura” y “presión arterial sistólica” del paciente, ya que sabemos que no están relacionadas con la actividad física. Los resultados obtenidos fueron de correlaciones inferiores a 0,3. Validez de criterio La validez de criterio se analiza comparando el instrumento nuevo con un estándar de referencia ampliamente validado y reconocido. Se usará como criterio externo ya validado.10 Para evaluar la validez de criterio, se requiere administrar el cuestionario y también el estándar de referencia a los mismos sujetos, como si fueran medidas independientes. Dependiendo del tipo de escala y de las variables medidas, se usarán coeficientes de correlación (variables cuantitativas) o los índices de sensibilidad y especificidad (variables cualitativas). Si las dos escalas están correlacionadas entre sí, podemos decir que nuestro cuestionario tiene validez de criterio. Por ejemplo, para validar el cuestionario Yale de actividad física se compararon sus resultados con los resultados de un acelerómetro, utilizando tanto coeficientes de correlación (entre otros, para la medida de tiempo en actividad física) como los índices de sensibilidad y especificidad (para evaluar la capacidad del cuestionario de detectar inactividad física).15
149
Manual del Investigador Novel
RESPUESTA AL CAMBIO La respuesta al cambio (responsiveness) es la capacidad de un instrumento para medir si se ha producido un cambio verdadero en el estado de salud de interés. Existen muchas maneras de evaluar la respuesta al cambio, debido, entre otros motivos, a la falta de una definición estándar y controversia en los conceptos,11 ya que la sensibilidad al cambio depende de las características de la muestra, del cambio que se espera y del diseño del estudio. El principal criterio para escoger entre unas u otras técnicas es la homogeneidad/heterogeneidad esperada en el cambio. Por ejemplo, en un grupo de pacientes la puntuación global de un cuestionario de síntomas respiratorios puede cambiar de forma parecida en todos los sujetos (cambio homogéneo en la muestra), mientras que en otro grupo de pacientes, por sus diferencias en la gravedad de la enfermedad o por cualquier otra razón, la puntuación puede cambiar de forma distinta entre pacientes (cambio heterogéneo en la muestra). En este capítulo exponemos los estadísticos principales que evalúan la sensibilidad al cambio según la homogeneidad/heterogeneidad del cambio en nuestra muestra. Cambio homogéneo Si suponemos que nuestra muestra está formada por un grupo de pacientes que pueden tener un cambio parecido entre dos administraciones de un cuestionario, por ejemplo, después de un tratamiento conocido,12 utilizaremos estadísticos que nos cuantifiquen la media del cambio. Estos estadísticos son los que se detallan a continuación. (1) Estadístico t para datos apareados. Este estadístico evalúa la hipótesis de cambio nulo en la media de nuestra escala de interés entre dos momentos en el tiempo. Dado que se trata de los mismos sujetos, se utiliza la t para datos apareados: t = media de la diferencia / (desviación estándar de la diferencia / √n). Este estadístico se basa en las diferencias estadísticamente significativas, y depende del tamaño de la muestra y de la variabilidad entre las dos administraciones. No es muy potente para la sensibilidad al cambio, ya que depende de n, es decir, puede detectar como estadísticamente significativos cambios que no sean clínicamente relevantes para muestras grandes. Si t es grande, rechazamos la hipótesis nula “no hay cambio”. (2) Tamaño del efecto estandarizado de Cohen. Es la media de las diferencias entre las dos administraciones dividida por la desviación estándar de la administración basal: Cohen = media de la diferencia / desviación estándar basal. Un valor de 0,25, por ejemplo, nos indica que el cambio es una cuarta parte de la desviación estándar basal y se considera pequeño. En general, se considera que los valores menores de 0,5 indican poca sensibilidad al cambio, entre 0,5 y 0,7 indican moderada sensibilidad, y mayores de 0,7 indican alta sensibilidad a los cambios.11-12 (3) Respuesta media estandarizada (SMR). Este estadístico tiene en cuenta la variabilidad del cambio entre las dos administraciones. Si observamos una gran variabilidad en el cambio obtendremos valores pequeños en el SMR. SMR = media de la diferencia / desviación estándar de la diferencia. 150
2.8. Validación de cuestionarios
El SMR es el estadístico más adecuado ya que además de no depender del tamaño de la muestra, también controla la variabilidad del cambio entre las dos medidas. El SMR se interpreta igual que Cohen.11-12 Cambio heterogéneo En este caso, partimos de la premisa que nuestra muestra está formada por un grupo de pacientes que pueden cambiar de diferente manera. Se evalúa también un estándar de referencia externo y se comparan ambas medidas de cambio. Los métodos que se utilizan para evaluar la respuesta al cambio son el coeficiente de correlación y los modelos de regresión. (1) Coeficiente de correlación. Se calcula el coeficiente de correlación entre las dos medidas del cambio, la de nuestra herramienta de interés y la del estándar externo. Este estadístico tiene valores entre -1 y +1, donde un valor cercano a |1| nos indica que nuestra herramienta es sensible al cambio. La sensibilidad al cambio depende del estándar externo elegido, por lo que la selección de este estándar es muy importante. Una limitación de este estadístico es la presencia de valores extremos. (2) Modelos de regresión. En este caso se evalúa si el cambio en el instrumento de interés puede predecir el cambio del estándar externo, o viceversa: Cambio en la medida estándar = constante + coeficiente* (Cambio en el instrumento) + error. Unos valores del coeficiente altos nos indican que los cambios producidos en el instrumento producen también cambios importantes en el estándar. La ventaja de este modelo es que se puede ajustar por niveles basales del estado de salud de interés y por otras variables que consideremos relevantes. Si el cambio en nuestro instrumento puede predecir el cambio del estándar externo, podemos considerar que nuestra herramienta es sensible al cambio.
CUESTIONES A CONSIDERAR Los cuestionarios forman parte del día a día de los investigadores clínicos. En la mayoría de casos, estos investigadores son “simplemente usuarios”, otras veces necesitan validar un cuestionario ya elaborado para una nueva población o un nuevo idioma, y, en el más infrecuente pero no menos importante de los casos, deben desarrollar completamente un cuestionario desde cero. Todos ellos necesitan conocer los conceptos y métodos descritos en este capítulo para saber interpretar la literatura existente, tomar decisiones sobre instrumentos a escoger en las investigaciones y, eventualmente, llevar a cabo una validación completa. Hay que ser rigurosos en los pasos descritos para construir herramientas de medición adecuadas, válidas y fiables. Sólo de esta manera se pueden obtener resultados realmente útiles para la comunidad científica y la salud de nuestras poblaciones.
151
Manual del Investigador Novel
PUNTOS CLAVE • Constructo: concepto no observable que se pretende cuantificar. • Dimensión (o factor): característica de un aspecto del constructo. El constructo puede tener más de una dimensión. • Ítem: unidad primaria de que se compone un cuestionario o instrumento de medida. • Fases de desarrollo de un cuestionario: elaboración (definición del constructo y sus dimensiones, la población objetivo y el modo de administración, elaboración de ítems y prueba piloto) y validación (estudio de la fiabilidad, validez y respuesta al cambio). • Fiabilidad: capacidad de un instrumento de medir sin error, con precisión. La fiabilidad se mide a través de la coherencia interna, la fiabilidad intra-observador y la fiabilidad inter-observador. • Coherencia interna: grado de coherencia de todos los ítems de un instrumento. • Fiabilidad intra-observador o test-retest: fiabilidad que mide el acuerdo entre dos medidas de un mismo instrumento en los mismos sujetos en diferentes momentos del tiempo. • Fiabilidad inter-observador: fiabilidad que mide el acuerdo entre dos medidas de un mismo instrumento administrado por diferentes evaluadores en los mismos sujetos. • Validez: capacidad del instrumento de medir el constructo para el que ha sido diseñado. La medimos a través de la validez aparente y la validez de contenido, que son estudiadas cualitativamente según bibliografía y expertos en el tema, y a través de la validez de constructo y la validez de criterio, las cuales son estudiadas empíricamente según medidas externas. Respuesta al cambio: es la capacidad del instrumento para medir si se producen cambios verdaderos en el aspecto de salud de interés.
152
2.8. Validación de cuestionarios
BIBLIOGRAFÍA 1. Argimón Pallás JM, Jiménez Vila J. Métodos de investigación clínica y epidemiológica. Madrid, Ediciones Harcourt, 3ª ed., 2006. 2. Martín Arribas MC. Diseño y validación de cuestionarios. Matronas profesión. 2004; Vol. 5, núm. 17. 3. García de Yébenes Prous MJ, Rodríguez Salvanés F, Carmona Ortells L. Validación de cuestionarios. Reumatología Clínica. 2009; 5(4):171-177. 4. Pesudovs K, Burr JM, Harley C, et al. The development, assessment, and selection of questionnaires. Optom Vis Sci. 2007;84:663-674. 5. Gimeno-Santos E, Raste Y, Demeyer H, Louvaris L, De Jong C, Rabinovich RA, et al. The PROactive instruments to measure physical activity in patients with chronic obstructive pulmonary disease. Eur Respir J. 2015;46(4):988-1000. 6. Müller R, Büttner P. A critical discussion of intraclass correlation coefficients. Stat Med. 1994;13:24652476. 7. Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. Statistician. 1983;32:307-317. 8. Ato García M, López García JJ. Análisis estadístico para datos categóricos. Madrid, Síntesis, 1ª ed., 1996. 9. Gimeno-Santos E, Frei A, Steurer-Stey C, De Batlle J, Rabinovich RA, Raste Y, et al. Determinants and outcomes of physical activity in patients with COPD: a systematic review. Thorax. 2014; 69(8):731-739. 10. Ramada-Rodilla JM, Serra-Pujadas C, Delclós-Clanchet GL. Adaptación cultural y validación de cuestionarios de salud: revisión y recomendaciones metodológicas. Salud Publica Mex. 2013;55:57-66. 11. García de Yébenes Prous MJ, Rodríguez Salvanés F, Carmona Ortells L. Sensibilidad al cambio de las medidas de desenlace. Reumatología Clínica- 2008;4:240-247. 12. Husted JA, Cook RJ, Farewell VT, Gladman DD. Methods for assessing responsiveness: a critical review and recommendations. J Clin Epidemiol. 2000;53:459-468. 13. Dobbels F, De Jong C, Drost E, Elberse J, Feridou C, Jacobs L, et al. The PROactive innovative conceptual framework on physical activity. Eur Respir J. 2014;44:1223-1233. 14. Gimeno-Santos E, Raste Y, Demeyer H, Louvaris Z, De Jong C, Rabinovich RA, et al. The PROactive instruments to measure physical activity in patients with chronic obstructive pulmonary disease. Eur Respir J. 2015;46:988-1000. 15. Donaire-Gonzalez D, Gimeno-Santos E, Serra I, Roca J, Balcells E, Rodríguez E, et al. Validation of the Yale Physical Activity Survey in chronic obstructive pulmonary disease patients. Arch Bronconeumol. 2011;47:552-560.
153
Figura 2.8.1. Fases de la elaboración y validación de cuestionarios
Manual del Investigador Novel
TABLAS Y FIGURAS
154
Modulo 3:
PROYECTO DE INVESTIGACIÓN
Responsable: Dr. Francisco García Río
Manual del Investigador Novel
156
3.1. Índice Protocolo de investigación: Generalidades
ÍNDICE 3.1. PROTOCOLO DE INVESTIGACIÓN: GENERALIDADES ............................................................. 161 INTRODUCCIÓN Y CONCEPTO ....................................................................................................... 161 FINALIDADES ........................................................................................................................................ 161 CONSIDERACIONES GENERALES PARA LA ELABORACIÓN DE UN PROTOCOLO DE INVESTIGACIÓN................................................................................................................................... 162 ESTRUCTURA DE UN PROTOCOLO DE INVESTIGACIÓN ........................................................ 163 Identificación Resumen Antecedentes y estado actual del tema. Justificació Bibliografía Objetivos Hipótesis Metodología Ejemplos OTROS ASPECTOS DEL PROTOCOLO DE INVESTIGACIÓN.................................................... 167 PUNTOS CLAVE .................................................................................................................................... 167 BIBLIOGRAFÍA ...................................................................................................................................... 168 TABLAS Y FIGURAS ........................................................................................................................... 169 3.2. HIPÓTESIS Y OBJETIVO DE ESTUDIO ........................................................................................... 175 CONTRASTE DE HIPÓTESIS ............................................................................................................. 175 Errores en el contraste de hipótesis: error tipo i y error tipo ii OBJETIVO DE ESTUDIO ...................................................................................................................... 176 Formulación de un objetivo PUNTOS CLAVE .................................................................................................................................... 177 BIBLIOGRAFÍA ...................................................................................................................................... 178 TABLAS Y FIGURAS ........................................................................................................................... 179
157
Manual del Investigador Novel
3.3. POBLACIÓN DIANA, POBLACIÓN DE ESTUDIO Y MUESTRA. TÉCNICAS DE MUESTREO ...................................................................................................................................... 181 INTRODUCCIÓN................................................................................................................................... 181 POBLACIÓN, MUESTRA Y OTROS CONCEPTOS ASOCIADOS.............................................. 181 MUESTREO PROBABILÍSTICO ........................................................................................................ 182 Muestreo aleatorio simple Muestreo sistemático Muestreo aleatorio estratificado Muestreo aleatorio por conglomerados o en etapas múltiples MUESTREO NO PROBABILÍSTICO ................................................................................................. 184 Muestreo por cuotas Muestreo discrecional Muestreo por bola de nieve Muestreo de conveniencia ERROR ALEATORIO Y SESGOS ....................................................................................................... 185 PUNTOS CLAVE ................................................................................................................................... 185 BIBLIOGRAFÍA ..................................................................................................................................... 186 TABLAS Y FIGURAS ........................................................................................................................... 187 3.4. TAMAÑO DE LA MUESTRA ............................................................................................................... 193 INTRODUCCIÓN .................................................................................................................................. 193 ESTIMACIÓN DE PARÁMETROS...................................................................................................... 193 Estimación de una proporción Estimación de una medida PRUEBAS DE CONTRASTE DE HIPÓTESIS .................................................................................. 196 ESTIMACIÓN DE UNA ODDS RATIO .............................................................................................. 198 EQUIVALENCIA DE DOS INTERVENCIONES ................................................................................ 199 EL TAMAÑO MUESTRAL AJUSTADO A LAS PÉRDIDAS ........................................................... 200 Calculadoras de tamaño de muestra PUNTOS CLAVE ................................................................................................................................... 200 BIBLIOGRAFÍA ..................................................................................................................................... 201 TABLAS Y FIGURAS ........................................................................................................................... 202 3.5. CREACIÓN Y MEDICIÓN DE VARIABLES. FUENTES DE INFORMACIÓN ............................ 203 TIPOS DE VARIABLES ....................................................................................................................... 203 Variables cuantitativas Variables cualitativas Variables según su influencia MEDICIÓN DE LAS VARIABLES ....................................................................................................... 205 FUENTES DE INFORMACIÓN ............................................................................................................ 205 PUNTOS CLAVE ................................................................................................................................... 206 BIBLIOGRAFÍA ..................................................................................................................................... 207 TABLAS Y FIGURAS ........................................................................................................................... 208
158
3.1. Índice Protocolo de investigación: Generalidades
3.6. TRABAJO DE CAMPO ......................................................................................................................... 209 CARACTERÍSTICAS DEL TRABAJO DE CAMPO .......................................................................... 209 TIPOS DE DISEÑO DEL TRABAJO DE CAMPO ............................................................................. 210 Diseño experimental Experimento post-facto Diseño encuesta Diseño panel Estudio de casos TÉCNICAS Y FASES DEL TRABAJO DE CAMPO ......................................................................... 210 Proceso en la investigación de campo PREPARACIÓN DEL INVESTIGADOR PARA INICIAR EL TRABAJO DE CAMPO ................ 213 RECOGIDA DE DATOS EN EL TRABAJO DE CAMPO................................................................... 213 Encuestas Cuestionario Entrevista Grupos de enfoque Observación PUNTOS CLAVE ................................................................................................................................... 214 BIBLIOGRAFÍA ..................................................................................................................................... 215 TABLAS Y FIGURAS ........................................................................................................................... 216 3.7. PROCESAMIENTO Y GESTIÓN DE MUESTRAS BIOLÓGICAS. BIOBANCOS ................... 217 MUESTRAS BIOLÓGICAS PARA INVESTIGACIÓN BIOMÉDICA ........................................... 217 PROCESAMIENTO Y ALMACENAMIENTO DE MUESTRAS Y DATOS ASOCIADOS .......... 218 Procesamiento y almacenamiento de muestras DATOS ASOCIADOS A LAS MUESTRAS ...................................................................................... 219 Datos del biobanco/biorepositorio Datos del paciente o donante de muestras Datos de la donación Datos de la muestra Datos del análisis de las muestras APLICATIVOS DE GESTIÓN DE MUESTRAS ................................................................................ 220 GESTIÓN DE MUESTRAS BIOLÓGICAS........................................................................................ 220 BIOBANCOS .......................................................................................................................................... 220 PUNTOS CLAVE ................................................................................................................................... 222 BIBLIOGRAFÍA ..................................................................................................................................... 223 3.8. FINANCIACIÓN DE UN PROYECTO. MEMORIA ECONÓMICA ............................................... 225 NORMAS GENERALES ........................................................................................................................ 225 FUENTES DE FINANCIACIÓN ............................................................................................................ 227 QUÉ SE PUEDE FINANCIAR .............................................................................................................. 228 MEMORIA ECONÓMICA..................................................................................................................... 229 PUNTOS CLAVE ................................................................................................................................... 229 TABLAS Y FIGURAS ........................................................................................................................... 230 159
Manual del Investigador Novel
160
3.1. Protocolo de investigación: Generalidades
3.1. PROTOCOLO DE INVESTIGACIÓN: GENERALIDADES Dr. Francisco García Río
INTRODUCCIÓN Y CONCEPTO En el presente módulo se revisarán algunos de los aspectos más relevantes a tener en cuenta para plantear un proyecto de investigación. Aunque en los sucesivos capítulos se proporcionará una explicación más detallada sobre aspectos concretos, en este primer capítulo del módulo se plantea una visión global de qué es un protocolo de investigación, sus finalidades y su estructura. Además, se abordarán algunos aspectos generales que pueden resultar de utilidad a la hora de elaborar un protocolo. El protocolo de un proyecto de investigación es un documento que refleja una descripción ordenada y sistemática del estudio propuesto y proporciona una visión general de los aspectos del estudio. Debe ser redactado con suficiente claridad para permitir que otro investigador pueda realizar el estudio o para que pueda ser realizado en otro momento.1 Necesariamente, es un documento que antecede a la investigación y que se presentará ante las instituciones correspondientes para dar a conocer los aspectos del estudio que se pretende realizar, a fin de que sean evaluadas su pertinencia y relevancia, así como su oportunidad, originalidad, practicidad y aplicabilidad. Todo lo anterior justifica la importancia de elaborar un buen protocolo o proyecto de investigación. Así pues, la claridad con que se enuncien los objetivos y el método del estudio redundará tanto en la calidad de los resultados como en la evaluación de su pertinencia.2-3
FINALIDADES Desde un punto de vista general, puede considerarse que un protocolo de investigación tiene tres finalidades: comunicación, planificación y compromiso.4 La primera de sus tareas es comunicar, ya que el proyecto de investigación sirve para dar a conocer los planes de investigación de su autor. La segunda función es planificar, pues el protocolo es un plan de acción que se detalla paso por paso. Finalmente, la tercera función implica un compromiso entre el investigador, sus colaboradores y la institución para la cual se llevará a cabo el trabajo. De una forma más concreta, resulta claro que el protocolo de investigación es el instrumento que permite una discusión concreta y precisa del proyecto e identifica los aspectos que resultan menos adecuados.5 En 161
Manual del Investigador Novel
este sentido, es muy recomendable que un grupo de investigación novel someta su protocolo a revisión, que llevarán a cabo investigadores más expertos de su propio centro, sociedad científica o instituciones afines. Cuando ya se dispone de una propuesta explicitada y detallada de lo que se pretende realizar, es el momento idóneo para detectar aspectos de mejora y plantear cambios que el equipo investigador pueda asumir. Desde luego, una vez iniciado el proyecto resulta mucho más difícil (y casi siempre no recomendable) introducir modificaciones metodológicas. A su vez, sobre una propuesta concreta de investigación detallada en un protocolo resulta factible concretar posibles colaboraciones y definir con precisión el ámbito en que se va a llevar a cabo cada una de ellas. También es necesario considerar que el protocolo de investigación deberá ser sometido a la aprobación o autorización institucional correspondiente.6 Dado que la actividad investigadora no es una tarea aislada, cada vez existen más requerimientos para que un grupo de investigación someta su propuesta al organismo establecido por su institución (comisión de investigación, dirección, etc.) con objeto de determinar si resulta pertinente y adecuada y si se corresponde con los intereses o líneas de investigación de la institución. Este suele ser un requisito previo para la autorización formal a la realización del proyecto. Además, para llevar a cabo el estudio también es necesario remitir el protocolo de investigación al comité de ética de investigación correspondiente para que de su aprobación. Otra finalidad del protocolo de investigación es la captación de recursos. En un entorno cada vez más competitivo, en el que resulta necesario captar fondos de ayudas destinadas a la investigación por parte de agencias de financiación externa, el protocolo de investigación constituye habitualmente un elemento crucial para determinar el interés en financiar una propuesta.3 Incluso en convocatorias no competitivas y para la formalización de cualquier contrato de investigación, se requiere un protocolo de investigación. Por último, tampoco debe dejar de considerarse que el protocolo de investigación supone el instrumento para comunicar al resto de la comunidad científica el proyecto que estamos realizando y que, como tal, en muchas ocasiones puede interesar su publicación o registro en algún repertorio internacional.7
CONSIDERACIONES GENERALES PARA LA ELABORACIÓN DE UN PROTOCOLO DE INVESTIGACIÓN El protocolo de investigación debe contener las distintas fases de la investigación (Figura 3.1.1). Obviamente, requiere una revisión del modelo teórico del conocimiento que permita formular la pregunta a investigar. Debe explicitar con el máximo detalle posible el diseño de la investigación y concretar cómo se pretende efectuar la recogida de los datos, su análisis y la interpretación de los resultados.8 Incluso puede resultar recomendable que el protocolo de investigación recoja brevemente cómo se van a comunicar los resultados y las estrategias de publicación previstas. En la tabla 3.1.1 se enumeran los principales pasos a seguir en la elaboración de un protocolo de investigación. Aunque a continuación se analizarán los distintos elementos a considerar, cabe plantear como recomendación general que su extensión sea de unos 15-20 folios y que la redacción se realice preferiblemente de forma impersonal. Es decir, resulta aconsejable utilizar expresiones del tipo se analizará o se evaluará y evitar construcciones en primera persona. También se recomienda evitar el uso excesivo de abreviaturas y desarrollarlas la primera vez que aparezcan en el texto. Por supuesto, es necesario tener presente la finalidad del protocolo y, en caso necesario, adaptarlo al formulario específico de un comité evaluador o agencia de financiación, tanto pública como privada o de sociedad científica (Figura 3.1.2). 162
3.1. Protocolo de investigación: Generalidades
No está de más recordar que para la elaboración de un buen protocolo de investigación suele ser necesario el contacto previo con personal cualificado, como estadísticos, epidemiólogos, informáticos, etc., que orienten, no sólo en su preparación, sino también en aspectos metodológicos, como técnicas estadísticas a aplicar, diseños de investigación más complejos, análisis de costes, etc.
ESTRUCTURA DE UN PROTOCOLO DE INVESTIGACIÓN Aunque puede existir cierta variabilidad en función del destino del protocolo, existen unos elementos comunes que deben desarrollarse en todos los casos (Tabla 3.1.2).3,9-10 A continuación, se describen de forma breve. Identificación El título debe ser conciso y específico, reflejar la acción que se va a realizar (evaluación, comparación, determinación, variabilidad, etc.) y sobre qué tipo de pacientes, evitando expresiones superfluas o circunstanciales. Se recomienda seleccionar en el título el mayor número posible de descriptores del proyecto de investigación evitando términos que no clarifican nada, como estudio o informe. Su extensión no debería superar las quince palabras, y no suele ser conveniente incluir abreviaturas. Además del título, puede tener interés generar un acrónimo que permita identificar más fácilmente el proyecto de investigación. También es necesario consignar el número de versión del protocolo y su fecha. En este apartado se debe identificar a los investigadores que desarrollarán el proyecto y sus filiaciones. Resumen Es un esquema estructurado que proporciona una visión general del proyecto. Consiste en una descripción concreta y objetiva del contenido global de la propuesta de investigación, que debe contener: objetivo (principal), diseño, ámbito del estudio (centro de salud, hospital, área sanitaria, ciudad, comunidad, etc.), sujetos del estudio, instrumentación y determinaciones. Habitualmente, se recomienda que su extensión no exceda las 250 palabras. Debe ir acompañado de una selección de palabras clave que permitan la clasificación del protocolo. Antecedentes y estado actual del tema. Justificación Ante todo, es importante destacar que este apartado no debe ser una revisión bibliográfica, sino que debe centrarse en el proyecto de investigación. Los antecedentes deben orientar al trabajo que se va a realizar formulando el problema de investigación, siempre con adecuado soporte bibliográfico. En la redacción del estado actual del tema es aconsejable mencionar cifras de prevalencia o incidencia de los estudios encontrados, siempre partiendo de un ámbito más general para ir luego hacia uno más local. El último apartado de esta sección corresponde a la justificación de por qué realizar el estudio (por ejemplo, “no hay estudios previos en nuestro medio”, “se aporta nueva información”, “se analizan otras variables”, etc.). En su conjunto, esta sección debe contar con la estructura y la claridad adecuadas para que el lector intuya cuáles son los objetivos del proyecto. Un esquema orientativo podría ser el siguiente: • Magnitud, frecuencia y distribución del problema a estudiar. Áreas geográficas involucradas y grupos de población afectados por el problema. • Causas probables del problema: ¿cuál es el conocimiento actual sobre el problema y sus causas?, ¿hay consenso?, ¿hay discrepancias?, ¿hay evidencias conclusivas? 163
Manual del Investigador Novel
• Soluciones posibles: ¿cuáles han sido las formas de resolver el problema?, ¿qué se ha propuesto?, ¿qué resultados se han obtenido? • Preguntas sin respuesta: ¿qué sigue siendo un interrogante?, ¿qué no se ha logrado conocer, determinar, verificar, probar? Bibliografía Debe apoyar toda la argumentación del apartado anterior, por lo que hay que seleccionar las referencias más adecuadas y acordes con lo que se quiere investigar. Las citas deberían tener una antigüedad máxima de 5-10 años, siempre que no se trate de una referencia fundamental, en cuyo caso habrá que incluirla aunque sea más antigua. Resulta muy importante evitar la omisión de referencias fundamentales sobre el tema, sobre todo si se refieren a aspectos parcialmente relacionados con el proyecto que se presenta. En general, las referencias se citan en el texto de forma consecutiva y se editan siguiendo la normativa de Vancouver. Objetivos Aunque un capítulo posterior de este módulo se dedica específicamente a la formulación de hipótesis y objetivos, es conveniente recordar que deben ser precisos, concisos, medibles y alcanzables.10 Ser precisos significa que se deben expresar de forma clara, con lenguaje sencillo y sin ambigüedades. Ser concisos implica que se deben formular de la manera más resumida posible, sin rodeos y utilizando sólo las palabras necesarias, y ser medibles supone que deben expresarse de modo tal que permitan medir las cualidades o características del objeto de investigación. Finalmente, los objetivos deben ser alcanzables, es decir, deben existir posibilidades reales de lograr los objetivos planteados. En su redacción, se recomienda emplear verbos como determinar, comparar, analizar, diferenciar y evitar otros como investigar o estudiar, que resultan más imprecisos. Se suele plantear un objetivo general, muy parecido al título del proyecto, aunque redactado en infinitivo, que constituye el propósito central del proyecto. En esencia, abarca todo el problema e informa de manera global para qué se hace la investigación. Además, se suelen exponer de cuatro a seis objetivos específicos, que contienen un desarrollo pormenorizado del objetivo general y comprenden acciones que no están descritas en éste, procurando evitar duplicidades. Hipótesis Guían el análisis de datos y deben ser la consecuencia de un marco teórico bien establecido. Suelen referirse al objetivo principal y se recomienda que se redacten en afirmativo (“el tratamiento A es más efectivo que el tratamiento B”), antes que como expresiones condicionales. Se suelen establecer distintos niveles de hipótesis. La hipótesis conceptual formula la idea general que se plantea, mientras que la operativa establece una mayor concreción de la misma. Por último, las hipótesis estadísticas serán las que se verifiquen o refuten en el análisis de datos. Las hipótesis estadísticas contienen la nula y la alternativa. La hipótesis nula o hipótesis de diferencias nulas, que niega la existencia de relación significativa entre las variables de estudio, se formula habitualmente con la intención de ser rechazada. La hipótesis alternativa afirma la existencia de relaciones significativas entre las variables, diferencias entre los grupos a comparar, etc. Metodología Constituye la sección más importante del protocolo de investigación y deberá responder a la pregunta: ¿Cómo se procederá para alcanzar los objetivos planteados? Debe exponer cómo se realizará el estudio con
164
3.1. Protocolo de investigación: Generalidades
el mayor grado de detalle posible, pues ello garantiza que cualquier interesado pueda reproducirlo. De forma más o menos esquemática, contiene los siguientes subapartados.3,9 Ejemplos Ámbito del estudio. Constituye la población de referencia o población total sobre la que se espera extrapolar los resultados y donde se enmarca el estudio. Población del estudio o diana. Es el subgrupo de la población de referencia, que debe cumplir una serie de criterios de selección. Está formada por los casos candidatos a participar en el estudio. Criterios de selección. Especifican las características que los pacientes que formen parte del estudio deben cumplir para que su reclutamiento se haga de la manera más homogénea posible y se eviten sesgos. Consisten en los criterios de inclusión, de exclusión y de retirada del estudio. Los primeros corresponden a las características que necesariamente deberán tener los sujetos de estudio, mientras que los criterios de exclusión recopilan las características cuya existencia obliga a no incluir un sujeto como elemento de estudio. Los criterios de retirada definen las características que, al presentarse en los sujetos ya incluidos en el estudio, obliguen a prescindir de ellos. Tamaño muestral y procedimiento de muestreo. Aunque también se desarrolla con mayor extensión en otro capítulo, este apartado del protocolo detalla el número de pacientes necesario para alcanzar los objetivos del estudio. Debe contener una breve descripción de las premisas aplicadas para su cálculo. También se debe precisar el procedimiento de muestreo que se utilizará para seleccionar a los pacientes del estudio (aleatorio, sistemático, consecutivo o de otro tipo). Si se trata de un ensayo clínico, se especificará la forma de asignar los sujetos a los distintos grupos del estudio. Diseño. Debe adecuarse a la pregunta de investigación y describirse de forma clara y concisa, empleando la terminología epidemiológica al uso.11 Este es un aspecto crítico en cualquier protocolo de investigación, que ya ha sido tratado en más detalle en un capítulo previo. Como norma general, se recomienda no mezclar diseños en un mismo estudio. Intervención. Obviamente, este apartado sólo se incluirá cuando el proyecto planteado contenga algún tipo de intervención. Podrá tratarse de estudios comparativos con diseños experimentales, cuasiexperimentales, de antes y después, o de ensayos clínicos. Se deberá describir la intervención tan detalladamente como sea posible explicando las actividades en el orden que van a ocurrir. Variables. Se definirá con claridad y precisión qué variables se van a registrar, cómo se medirán y cómo se codificarán. El proceso de definición de variables comienza en cuanto se determina el problema de estudio y se formulan sus objetivos, y es uno de los pasos más difíciles de la investigación. Hay variables que no son difíciles de describir, definir o medir, como la edad o el sexo, cuya compresión resulta muy intuitiva en la práctica de la vida diaria. Sin embargo, otras variables son más complejas, por su composición o variación de criterios entre regiones, países, especialidades y autores. La calidad de la atención y la accesibilidad a los servicios son ejemplos de variables más problemáticas. Por ello es importante conceptualizar y operacionalizar las variables, ya que cada investigador puede utilizar un criterio diferente y, por tanto, obtener datos muy distintos.10 El proceso de llevar una variable de un nivel abstracto a un plano concreto se denomina operacionalización, y la función básica de dicho proceso es precisar o concretar al máximo el significado o alcance que se otorga a una variable en un determinado estudio. Dicha operacionalización se logra mediante la transformación de una variable en otras que tengan el mismo significado y que sean susceptibles de medición empírica. Para 165
Manual del Investigador Novel
lograrlo, las variables principales se descomponen en otras más específicas llamadas dimensiones, las cuales a su vez se deben traducir en indicadores para permitir la observación directa. Algunas veces, la variable puede ser operacionalizada mediante un solo indicador, mientras que en otros casos es necesario hacerlo por medio de un conjunto de indicadores. En el protocolo se deben identificar las variables independientes (factores de exposición, de confusión, etc.) y una o pocas dependientes (variables de respuesta, resultado o desenlace). En caso de variables categóricas, se señalarán todas las categorías de medida, mientras que si son numéricas se especificarán las escalas y unidades de medida. Recogida de datos. Se describirán los instrumentos de medida o fuentes de información que se utilizarán, cómo se van a llevar a cabo las mediciones sobre los pacientes y quién las va a realizar, dónde y cuándo. Puede resultar muy útil incluir en los anexos el cuaderno de recogida de datos. Análisis de los datos. Debe estar claramente descrito, ya que se conoce de antemano las variables contenidas en el estudio y su escala de medición. Suele ser recomendable incluir una parte descriptiva, otra de análisis básico de los datos y una tercera con análisis más complejos. Se deben describir los métodos y modelos de análisis de los datos, según el tipo de variables. También se detallará brevemente los programas informáticos que se utilizarán. Dificultades y limitaciones del estudio. Es muy recomendable que el protocolo cuente con un apartado en el que se especifiquen los problemas que se prevé encontrar en la realización del estudio, las clases de sesgos, las variables de confusión, las interacciones, las pérdidas, etc. Los investigadores deberían esforzarse en justificar que estos problemas no tienen por qué modificar lo que se quiere medir y qué métodos de control se proponen implantar. Plan de trabajo. El protocolo debe contener un cronograma que especifique las tareas que se realizarán durante el proyecto, algunas de las cuales pueden solaparse, indicando el tiempo estimado para su cumplimiento así como las personas que las llevarán a cabo. (Figura 3.1.3). Este apartado debe completarse con la descripción de la distribución de tareas entre los miembros del equipo investigador. Experiencia del equipo investigador sobre el tema. Proporciona elementos necesarios para valorar la factibilidad del proyecto y su adecuación a las líneas de investigación en que hayan trabajado los solicitantes del proyecto dentro del tema que se desea investigar. Medios disponibles para la realización del proyecto. Contiene una breve relación de los recursos humanos y materiales de los que dispone el equipo investigador. Resulta imprescindible en los protocolos que se presenten a convocatorias de financiación e importante en todos los tipos de protocolo para estimar las garantías sobre la ejecución del proyecto de investigación. Justificación de la ayuda solicitada. En aquellos proyectos que se presenten a convocatorias de financiación, este apartado contendrá la explicación de por qué se necesita la ayuda que se solicita para el estudio. En dichos casos, esta sección suele ir acompañada por una memoria económica en la que se detalla el coste de todas las partidas seleccionadas, que obviamente debe adecuarse a las características de la convocatoria a la que se concurre. Anexos. Pueden incluir información muy diversa, desde datos previos del equipo investigador, todavía no publicados pero útiles para la planificación del proyecto de investigación, hasta el modelo de hoja informativa y consentimiento del paciente, o cuaderno de recogida de datos. 166
3.1. Protocolo de investigación: Generalidades
OTROS ASPECTOS DEL PROTOCOLO DE INVESTIGACIÓN En el caso de proyectos de investigación en seres humanos, en los criterios de selección se establecerá la exigencia de recogida del consentimiento informado. No obstante, dependiendo de las características de la propuesta, puede ser conveniente completar este apartado con algunas consideraciones éticas. Puede contener un conjunto de reflexiones en torno a las posibles implicaciones de la realización del estudio y el compromiso del investigador frente a las personas participantes, los datos obtenidos, el grupo de control si la experiencia es benéfica y acerca del manejo de las fuentes de consulta, entre otros aspectos. Esta información adicional puede resultar de ayuda en la evaluación del comité de ética de la investigación correspondiente. Como ya se ha mencionado, también se recomienda acompañar el protocolo del cuaderno de recogida de datos, lo que facilita una interpretación más concreta de muchos aspectos metodológicos. También resulta de gran utilidad elaborar un manual de procedimientos, en el que se describirán con el mayor detalle posible (tipo enumeración por pasos) todos los procedimientos que se van a llevar a cabo en el proyecto de investigación. Además de reforzar la calidad de las determinaciones, este documento resulta muy importante en proyectos multicéntricos o si se pretende incorporar al equipo nuevos investigadores. En casi todas las convocatorias competitivas se solicita describir el impacto y la repercusión sociosanitaria del proyecto de investigación. En esta sección, habitualmente denominada aplicabilidad y utilidad práctica de los resultados, se explicará el interés que tendrán los resultados del proyecto y para qué servirán, con una indicación de aplicación futura. Se debe redactar en términos prácticos y realistas. Aunque no resulta imprescindible en todos los protocolos, se recomienda considerar la inclusión de un plan de publicaciones y de explotación de resultados. Este apartado ayuda a estimar la relevancia del proyecto y puede ser muy útil para estratificar el análisis de resultados así como para definir precozmente criterios de autoría. Por último, se debe considerar que si el proyecto de investigación propuesto es un ensayo clínico, resulta obligado el registro del protocolo en repositorios en línea específicos. El más habitualmente utilizado es clinicaltrials.gov, y exige una estructura del protocolo predeterminada (Figura 3.1.4). En conclusión, el protocolo de investigación consiste en la descripción detallada de los fundamentos, objetivos y métodos del estudio. Supone un elemento crucial para mejorar el planteamiento de un proyecto de investigación y resulta un requisito imprescindible previo a su ejecución.
PUNTOS CLAVE Cualquier protocolo de investigación debe responder afirmativamente a estas diez preguntas: 1. ¿El título refleja lo que se pretende investigar? 2. ¿El planteamiento del problema explica la situación general que origina la interrogante? 3. ¿La formulación del problema constituye una interrogante precisa, delimitada en espacio y tiempo? 4. ¿Los objetivos expresan los aspectos que se pretende conocer? 5. ¿La justificación explica por qué se realizará el estudio, así como sus posibles aportaciones? 6. ¿Los antecedentes son investigaciones previas relacionadas con el problema? 7. ¿Las bases teóricas constituyen posiciones de distintos autores que permiten sustentar la investigación? 8. ¿La definición de términos expresa el significado de los vocablos inmersos en el problema? 9. ¿El nivel y diseño de la investigación son pertinentes para el logro de los objetivos? 10. ¿Las técnicas e instrumentos corresponden al diseño de investigación? 167
Manual del Investigador Novel
BIBLIOGRAFÍA 1. Villareal Ríos E. El protocolo de investigación en las ciencias de la salud: el proyecto de investigación, metodología y ejemplos de protocolos, aspectos éticos, administrativos y legales. México: Trillas, 2011. 2. García Roldán JL. Cómo elaborar un proyecto de investigación. Alicante: Universidad de Alicante, 1995. 3. Rodríguez del Águilar MM, Pérez Vicente S, Sordo del Castillo L, Fernández Sierra MA. Cómo elaborar un protocolo de investigación en salud. Med Clin (Barc) 2007;129:299-302. 4. Lawrence FL, Silverman S, Spirduso WW. Reading and understanding research. Los Angeles, SAGE Publications Inc., 3a ed., 2009. 5. Guyatt G. Preparing a research protocol to improve chances for success. J Clin Epidemiol. 2006;59:893899. 6. Roca JA. Cómo y para qué hacer un protocolo. Med Clin (Barc). 1996; 106:257-262. 7. Godlee F. Publishing study protocols: making them visible will improve registration, reporting and recruitment. BMC News and Views. 2001;2:4. 8. Organización Panamericana de la Salud. Guía para escribir un protocolo de investigación. Consultado el 20 de septiembre de 2010. Disponible en www.sld.cu/galerias/pdf/sitios/rehabilitacion.../ops_protocolo. pdf. 9. Suárez Pérez EL, Pérez Cardona CM. Basic components in the development of research proposals in health sciences. P R Health Sci J. 1999;18 Suppl A:i-iv,1-49. 10. González Labrador I. Partes componentes y elaboración del protocolo de investigación y del trabajo de terminación de la residencia. Rev Cub Med Gen Integr. 2010;26:387-406. 11. Hulley SB, Cummings SR. Diseño de la investigación clínica. Un enfoque epidemiológico. Barcelona: Doyma; 1993.
168
3.1. Protocolo de investigación: Generalidades
TABLAS Y FIGURAS Tabla 3.1.1. Pasos para la elaboración de un protocolo de investigación 1. Presentar el título completo del estudio. 2. Determinar y especificar de manera clara el planteamiento del problema. 3. Elaborar una justificación del proyecto. 4. Recolectar la información que se incluirá en el apartado de antecedentes/marco teórico. 5. Formulación de una hipótesis válida y precisa. 6. Definición concreta de los objetivos. 7. Selección y explicación de la metodología. 8. Listado y descripción de los recursos. 9. Elaboración del cronograma (opcional). 10. Listado de las referencias bibliográficas consultadas. 11. Presentación de los anexos, sólo si es necesario.
169
Manual del Investigador Novel
Tabla 3.1.2. Epígrafes más importantes de un protocolo de investigación en salud Título Resumen Objetivo Diseño Ámbito del estudio Sujetos del estudio Instrumentación Determinaciones Palabras clave Antecedentes y estado actual del tema Justificación del estudio Bibliografía Objetivos Objetivos generales Objetivos específicos Hipótesis Metodología Población de referencia y de estudio Criterios de inclusión y exclusión Tamaño muestral y procedimientos de muestreo Diseño del estudio Variables Recogida de datos y fuentes de información Análisis de datos Dificultades y limitaciones del estudio Plan de trabajo Experiencia del equipo investigador sobre el tema Aplicabilidad y utilidad práctica de los resultados Medios disponibles para la realización del proyecto Justificación de la ayuda solicitada Presupuesto solicitado Anexos
170
3.1. Protocolo de investigación: Generalidades
Figura 3.1.1.
FASE CONCEPTUAL Formulación de la pregunta
Diseño de la investigación
Recogida de los datos
Análisis de los datos
Redacción del informe de investigación
Figura 3.1.2.
171
Publicación de los resultados
Interpretación de los resultados
FASE EMPÍRICA
Modelo teórico
FASE METODOLÓGICA
Manual del Investigador Novel
Figura 3.1.3.
172
3.1. Protocolo de investigación: Generalidades
Figura 3.1.4.
173
Manual del Investigador Novel
174
3.2. Hipótesis y objetivo de estudio
3.2. HIPÓTESIS Y OBJETIVO DE ESTUDIO Máster Meritxell Peiró i Fàbregas
Existen dos tipos de hipótesis, la hipótesis conceptual y la operativa. La hipótesis conceptual es la que se formula como resultado de las explicaciones teóricas aplicables a nuestro problema. Nos ayuda a explicar desde el punto de vista teórico el fenómeno que estamos investigando. En cambio, la hipótesis operativa es aquella que le sirve al investigador como base de su estudio. Este tipo de hipótesis trata de dar una explicación al fenómeno que se está investigando y presenta cuantitativamente (en términos medibles) la hipótesis conceptual.
CONTRASTE DE HIPÓTESIS Para representar un resultado con un margen de error con límite superior e inferior se utilizan los intervalos de confianza. Estos límites son los utilizados para estimar parámetros de una población. Aun así, existe otro enfoque más indirecto y al que se suele dar preferencia en biomedicina. Se trata del contraste de hipótesis. Un contraste de hipótesis supone una comparación. Se establecen dos hipótesis de trabajo posibles y antagónicas y se elige una. El contraste comienza con la formulación de dos hipótesis sobre el valor de algún parámetro poblacional, cada una de ellas contrapuesta o antagónica respecto a la otra (una es cierta y la otra es falsa). Supondremos cierta una de ellas, a la cual llamaremos hipótesis nula (H0). La hipótesis nula mantiene que el efecto de interés NO influye, es decir, vale 0 en la población de donde sale la muestra. La hipótesis alternativa (H1) mantiene que existe algún efecto distinto de 0 en la población de la que procede la muestra. Por tanto, se empieza planteando siempre una hipótesis nula, que indicará que el efecto sobre la población es cero, y a continuación utilizaremos los datos para decidir si podemos rechazar esta hipótesis y adoptar una hipótesis alternativa. El contraste de hipótesis consistirá en decidir entre una u otra. Si rechazamos la hipótesis nula (H0), diremos que el resultado es estadísticamente significativo. Un ejemplo podría ser un estudio para valorar la eficacia en términos de abstinencia anual de una intervención para la deshabituación tabáquica en pacientes fumadores con EPOC durante un ingreso hospitalario. 175
Manual del Investigador Novel
Al azar, se asignarían en dos grupos. Uno sería el grupo control, en el que la intervención sería la práctica clínica habitual, y el otro sería el grupo intervención, en el que la intervención sería más intensiva con tratamiento farmacológico y seguimiento durante un año después del alta hospitalaria. Por lo tanto, la hipótesis H0 sería: La tasa de abstinencia anual será la misma para los fumadores con EPOC ingresados hayan recibido intervención o no. Errores en el contraste de hipótesis: error tipo i y error tipo ii En la tabla 3.2.1 podremos observar las cuatro posibles combinaciones dependiendo de la decisión tomada y de la certeza o no de la hipótesis nula. Hablaremos de error de tipo I cuando hayamos descartado la hipótesis nula, siendo ésta cierta, es decir, hablaremos de una significación estadística de los resultados cuando no es verdad. Este error se considera muy grave. Finalmente, acontecerá un error de tipo II cuando hayamos optado por no descartar la hipótesis nula y resulte que esta es falsa. O, dicho de otro modo, hablaremos de resultados no estadísticamente significativos cuando en realidad sí lo son. Las pruebas de significación estadística nos proporcionarán un valor p. El valor p será la probabilidad de encontrar la diferencia observada en la muestra u otra más alejada a la hipótesis nula, condicionada a que esta fuera cierta. Cuanto menor sea el valor de la p de significación estadística, mayores argumentos habrá para rechazar la hipótesis nula y apoyar la alternativa. Para considerar un valor p bajo, se suele escribir p < 0,05. En este caso, se rechaza la hipótesis nula y se dice que el resultado es estadísticamente significativo. En cambio, cuando el valor de la p es p ≥ 0,10 no se rechaza la hipótesis nula y se dice que los resultados no son estadísticamente significativos. Pero, ¿qué sucede cuando obtenemos resultados entre 0,05 y 0,10? Podremos decir que hay una tendencia o que se aproxima a la significación estadística. Pero lo relevante no será la significación estadística, sino la significación clínica del resultado. La significación clínica en la práctica diaria dependerá del tamaño muestral y de la magnitud del efecto. Podría ser suficientemente importante para no rechazar la hipótesis nula con una muestra grande pero no con una muestra de un número de sujetos muy reducido. Para la elaboración de un manuscrito se deberá tener en cuenta la forma de transcripción, evitando los valores dados por programas estadísticos como p = ,000 o escribir “ns” (no significativo), numerosos decimales, e incluso evitaremos la p < o > 0,005 al referirnos a si los resultados son o no significativos estadísticamente. En la tabla 3.2.2 se muestran los modos correctos de presentar los resultados de un contraste de hipótesis según la p.
OBJETIVO DE ESTUDIO La hipótesis es una respuesta tentativa a la pregunta que nos planteamos al formular un problema. Por tanto, la hipótesis tiene una relación directa con el problema que se está investigando. Pero cuando queremos resolver un problema, haremos el planteamiento en forma de preguntas. Y de esas preguntas elaboraremos los objetivos, es decir, lo que nos preguntamos, lo que nos proponemos conocer e investigar. Los objetivos deben corresponderse con las preguntas realizadas. Los objetivos generales apuntan al tipo más general de conocimiento que se espera producir con la investigación. Los objetivos específicos son aquellos que deben lograrse para alcanzar los objetivos generales y se enumerarán por orden de importancia, por orden temporal, etc.
176
3.2. Hipótesis y objetivo de estudio
Los objetivos del estudio deberán ser: a) Claros y concretos, sin provocar errores de interpretación. b) Concisos. c) Medibles, es decir, los resultados se podrán medir o cuantificar de forma objetiva. Es necesario tener en cuenta que todos los aspectos del problema de investigación estén contenidos en el objetivo general, así como que todos los objetivos específicos se desprendan del objetivo general, ya que si alguno de ellos no aporta conocimiento al mismo se llevará a cabo sin fundamento, pudiendo, incluso, ser objeto de otra investigación. Los errores más comunes en la definición de los objetivos son: • • • •
Ser demasiado amplios y generalizados. Tener unos objetivos específicos no contenidos en los generales. Hacer un planteamiento de pasos como si fueran objetivos (confundir métodos, caminos, con objetivos). Carecer de relación entre los objetivos, el marco teórico y la metodología: los objetivos son el destino de la tesis; el marco teórico, el terreno y la metodología son el camino a seguir.
Formulación de un objetivo Para la correcta formulación de un objetivo, la composición de este deberá constar de 3 partes principales: a) un verbo en infinitivo b) un qué c) un cómo. Un ejemplo podría ser: Evaluar (a) la eficacia de un programa educativo en asma (b) en términos de prevención de exacerbaciones y mejora del control del asma (c).
PUNTOS CLAVE • La hipótesis nula mantiene que no existe asociación entre los factores y que las diferencias observadas se deben al azar. • La hipótesis alternativa es la que contradice la hipótesis nula y que se aceptará en caso de rechazar la hipótesis nula. • La interpretación de una p es la probabilidad de observar diferencias mayores a las observadas en la muestra si la hipótesis nula fuera cierta. • Cuanto menor sea el valor de p, mayores argumentos tendremos para rechazar la hipótesis nula y aceptar la hipótesis alternativa.
177
Manual del Investigador Novel
BIBLIOGRAFÍA Martínez-González MA, Sánchez Villegas A, Toledo Atucha E, Faulín Fajardo F. Bioestadística amigable. Madrid, ELSEVIER, 3ª ed., 2014. Hernández Sampieri R, Fernández Collado C, Baptista Lucio P. Fundamentos de metodología de la Investigación,. México, Mc. Graw - Hill, 2ª ed., 1998.
178
3.2. Hipótesis y objetivo de estudio
TABLAS Y FIGURAS Tabla 3.2.1. Posibles resultados en un contraste de hipótesis Hipótesis nula H0 Decisión No se descarta la H0 Se rechaza la H0
Verdadera
Falsa
Decisión correcta tipo A (1-α)
Error tipo II Probabilidad β
Error tipo I Probabilidad α
Decisión correcta tipo B (1-β)
Tabla 3.2.2. Modo correcto de presentación de los resultados de un contraste de hipótesis MODO INCORRECTO
MODO CORRECTO
p = ,000, p = 0,0000001
P = < 0,001
p = ns, ns, p > 0,05
Ejemplo: p = 0,16, p = 0,38
p < 0,05
p = 0,04
p = 0,036598700025
p = 0,04
179
Manual del Investigador Novel
180
3.3. Población diana, población de estudio y muestra. Técnicas de muestreo
3.3. POBLACIÓN DIANA, POBLACIÓN DE ESTUDIO Y MUESTRA. TÉCNICAS DE MUESTREO Dr. Francisco García Río
INTRODUCCIÓN Cuando se pretende estudiar alguna característica de la población, se plantea un problema relacionado con la elección de los individuos. Puesto que en general no resulta posible estudiar a toda la población, se debe elegir una muestra que sea representativa y que permita extrapolar los resultados obtenidos a la población de referencia (Figura 3.3.1).1 Sin embargo, es necesario considerar que el empleo de técnicas de muestreo tiene una serie de ventajas y limitaciones.1-4 Entre las primeras se incluyen mayor eficiencia en términos de coste y mayor rapidez en la obtención de los resultados. Sus limitaciones vienen dadas por los errores que se pueden cometer con el muestreo, principalmente el error aleatorio y el error sistemático o sesgo.
POBLACIÓN, MUESTRA Y OTROS CONCEPTOS ASOCIADOS También denominados estudios de seguimiento, de proyección o de incidencia. La palabra cohorte deriva La población es el conjunto de todos los sujetos sobre los que queremos conocer cierta información relacionada con el fenómeno que se estudia. Puede ser el conjunto de pacientes con una enfermedad o los sujetos que viven en una comunidad. Con mucha frecuencia, el investigador no tiene acceso a la totalidad de la población por carecer del censo o por no tener un listado con todos los pacientes que sufren una enfermedad concreta (diagnosticados y no diagnosticados). Por ello, se utiliza el concepto de población de estudio o marco muestral, para referirse al conjunto de sujetos de la población realmente disponibles para la elección de la muestra. Un ejemplo de población de estudio es utilizar el listado telefónico para seleccionar una muestra en lugar del censo poblacional. La muestra es el subconjunto de la población que se selecciona para el estudio, esperando que lo que se averigüe en la misma nos proporcione una idea sobre la población en su conjunto. Por último, el sujeto es la unidad de la población de la que buscamos información. Para que las conclusiones obtenidas a partir de una muestra sean válidas para una población, la muestra debe haberse seleccionado de forma que sea representativa de la población a la que se pretende aplicar la conclusión, es decir, si el proceso de selección de la muestra es adecuado, resulta posible realizar una extrapolación de los resultados obtenidos a la población de estudio o marco muestral por inferencia estadística. 181
Manual del Investigador Novel
Si la población de estudio es representativa de la población diana, los resultados también podrían ser generalizados al conjunto de la misma (Figura 3.3.2).5-6 La mejor forma de asegurar la validez de las inferencias es que la muestra sea suficientemente grande (en el siguiente capítulo se explican los cálculos del tamaño muestral) y que se seleccione mediante una técnica aleatoria (Figura 3.3.3).7
MUESTREO PROBABILÍSTICO Los métodos de muestreo aleatorio o probabilístico se basan en el principio de equiprobabilidad. Es decir, todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra. En la práctica, existen diferentes tipos de muestreo aleatorio: simple, sistemático, estratificado y por etapas (Figura 3.3.4 y Tabla 3.3.1).1-2,8 Aunque en los dos últimos no todos los sujetos tienen la misma probabilidad de formar parte de la muestra, se consideran igualmente aleatorios, ya que al conocer qué probabilidad tiene cada sujeto es posible corregir la desviación mediante ponderaciones.8 Muestreo aleatorio simple Es el procedimiento probabilístico de selección de muestras más sencillo y conocido. Una vez censada la población de estudio, se asigna un número a cada individuo o sujeto y se elige aleatoriamente, de forma manual o electrónica, hasta completar el tamaño muestral establecido. Es muy útil para obtener muestras de poblaciones pequeñas, pero no suele emplearse cuando las poblaciones muestrales son muy grandes, debido tanto a la dificultad o imposibilidad de contar con un listado de las mismas como a razones de coste. En estas situaciones, el muestreo en etapas es mucho más recomendable. Muestreo sistemático Es un procedimiento alternativo al muestreo simple que se usa para la selección de muestras equiprobabilísticas de una población organizada según cierto orden conocido. Se asigna un número a cada sujeto de la población, al igual que en el procedimiento anterior, y se extrae un solo número al azar. A partir de este primer sujeto de la muestra se van tomando los siguientes sujetos dejando un intervalo determinado entre ellos. El tamaño del intervalo (k) se calcula dividiendo el tamaño de la población (N) entre el tamaño de muestra deseado (n) : k = N/n. En función del método empleado para la selección de la muestra, el muestreo sistemático se denomina regular o en fases según se fije, respectivamente, el tamaño de la muestra que se desea seleccionar o el porcentaje de población que debe quedar incluido en la muestra (equivalentemente, la probabilidad de selección). Suele utilizarse para grandes poblaciones y requiere disponer de un marco muestral adecuado, aunque su principal limitación es que si la constante de intervalo se asocia al fenómeno de interés puede producirse un sesgo. Muestreo aleatorio estratificado En este tipo de muestreo, la población de estudio se divide en subgrupos o estratos (clusters) y posteriormente se escoge una muestra al azar de cada estrato. Es frecuente que cuando se realiza un estudio interese evaluar una serie de subpoblaciones (estratos o clusters), siendo importante que en la muestra haya representación de todos y cada uno de los estratos considerados. El muestreo aleatorio simple no garantiza que tal cosa ocurra. Para evitar esto, se obtiene una muestra de cada uno de los estratos. Si la estratificación se realiza con respecto a un carácter, se denomina muestreo estratificado simple, mientras que si se efectúa con respecto a dos o más, se denomina muestreo estratificado compuesto.9
182
3.3. Población diana, población de estudio y muestra. Técnicas de muestreo
Su principal limitación radica en que debe conocerse la distribución de las variables de estatificación en la población. Además, la lógica de los estratos tiene que ser coherente con lo que se busca. Si se estudia la función pulmonar en sujetos sanos, se puede estratificar por sexo o grupos de edad, pero no tiene sentido estratificar por si se es zurdo o diestro. Es posible que la función pulmonar sea similar entre miembros de un mismo grupo etario (homogeneidad en el estrato) y difiera con respecto a otros grupos de edad (heterogeneidad entre estratos). Existen diversas variantes de muestreo estratificado. La más común es la afijación proporcional, en la que el tamaño de la muestra de cada estrato es proporcional al tamaño del estrato dentro de la población. Por otro lado, está la afijación no proporcional, en la que ciertos estratos están sobrerrepresentados en la muestra. Con la afijación no proporcional se pretende aumentar la representación de un estrato clave que por su pequeño tamaño podría estar muy poco representado en un muestreo estratificado. Por ejemplo, se podría estratificar por etnias aumentando el tamaño del estrato de la etnia minoritaria. Cuando se opta por afijación no proporcional, para combinar los datos entre estratos será necesario ponderarlos asignando un peso según la proporción de ese estrato en la población.7 Muestreo aleatorio por conglomerados o en etapas múltiples Consiste en seleccionar primero subdivisiones de la población (conglomerados) y luego muestrear sujetos de los conglomerados elegidos. Un conglomerado es una subdivisión preexistente o natural de la población, como una provincia, un área sanitaria, etc. Un conglomerado debe ser heterogéneo en sí mismo, puesto que idealmente contiene toda la variabilidad de la población. El muestreo aleatorio por conglomerados más sencillo consta de una primera etapa en la que se muestrean los conglomerados y una segunda etapa en la que se estudian todos los sujetos de los conglomerados seleccionados (no se muestrea). Por ejemplo, si se pretende evaluar el tabaquismo en la población de estudiantes de primaria de una ciudad, la primera etapa sería escoger unas cuantas escuelas (conglomerados) aleatoriamente y encuestar a todos los alumnos y alumnas de las escuelas seleccionadas. En muchas ocasiones, hay más etapas (muestreo polietápico) y se muestrea en varios niveles sucesivos. A su vez, el muestreo de cada etapa puede ser simple, sistemático o estratificado. Por ejemplo, si la población a estudiar es el alumnado de primaria de todo un país, se pueden crear dos niveles de conglomerado: provincias y escuelas. En una primera etapa, se extrae una muestra aleatoria simple de provincias del país. En una segunda etapa, se extrae una muestra aleatoria de escuelas por cada provincia seleccionada. En la tercera etapa, a partir del listado de cada escuela seleccionada, se extrae una muestra aleatoria de los alumnos a encuestar. El muestreo por etapas se considera aleatorio si los conglomerados son heterogéneos en sí mismos y homogéneos respecto a otros conglomerados. En el ejemplo anterior de conglomerado de escuelas, esta característica se concretaría en que no existan grandes diferencias entre una escuela y otra pero que exista diversidad dentro de cada escuela. Debe destacarse que el muestreo por estratos y el muestreo por etapas parten de ideas opuestas. La estratificación funciona correctamente cuando dentro del estrato hay homogeneidad, mientras que los estratos son muy diferentes entre sí. Por el contrario, en el muestreo por etapas los conglomerados deben ser parecidos entre sí y presentar heterogeneidad dentro del propio conglomerado. Este tipo de muestreo se utiliza fundamentalmente en los estudios multicéntricos, en los que primero se debe elegir los centros participantes y después, tras haberlos seleccionado, se realiza el muestreo de pacientes dentro de cada uno.2,6 183
Manual del Investigador Novel
MUESTREO NO PROBABILÍSTICO Es aquel en el que no se conoce la probabilidad de que un sujeto de la población pase a formar parte de la muestra, ya que la selección de los elementos muestrales depende en gran medida del criterio del investigador. A diferencia de los métodos probabilísticos, no permiten calcular el error muestral que se está cometiendo (Figura 3.3.4 y Tabla 3.3.2). Muestreo por cuotas Como en el muestreo estratificado, se establecen estratos, que se suponen homogéneos, y se asigna una cuota o tamaño de muestra a esos estratos, que ha de ser proporcional a su presencia en la población. Sin embargo, el muestreo no se hace a partir de un listado poblacional, sino que se deja al libre albedrío del investigador, que tiene libertad para elegir a los sujetos (normalmente, los primeros a los que tenga acceso), siempre que cumpla con las cuotas de cada estrato. Este muestreo es muy común en los estudios de mercado y sondeos de opinión para medir la evolución de las preferencias de la gente. Aunque no sea aleatorio, si se mantiene el mismo sistema de muestreo en sucesivos sondeos suele estimar con relativa precisión dicha evolución.1 Muestreo discrecional También denominado muestreo intencional, opinativo o por selección de experto. Tiene un grado muy bajo de aleatoridad, pues el equipo investigador determina la muestra según su propio criterio, aunque siempre con la intención de obtener una muestra más o menos representativa de la población. Por ejemplo, se podría intentar que haya tantos hombres como mujeres y que haya personas de los distintos grupos sociales. Sería como un muestreo por cuotas, pero en el que no se conoce la proporción de las distintas cuotas en la población. Es una técnica usada por expertos con la intención de seleccionar especímenes típicos o representativos de un fenómeno en particular, con fines fundamentalmente experimentales.3,8 En la medida en que los criterios empleados se aparten de la subjetividad, los resultados que se obtengan serán más fiables. Muestreo por bola de nieve Consiste en ir identificando a los sujetos de la muestra a partir de sujetos ya seleccionados. Se parte de unos pocos individuos de la población a los que se pueda acceder, y a través de ellos se logra contactar con otros sujetos con características similares, y así sucesivamente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones minoritarias o marginales.2-3 Muestreo de conveniencia También denominado muestreo subjetivo, de juicio, casual o incidental. Los sujetos de la muestra se eligen de forma razonada, en función del objetivo perseguido y sin importar la representatividad respecto a la población. Hay muchos tipos de muestreo subjetivo, como el muestreo de casos típicos, la diversidad (sujetos que no se asemejan a la media), de informantes clave o de casos de éxito. El caso más frecuente es utilizar como muestra a los individuos a los que se tiene fácil acceso por proximidad o amistad.
184
3.3. Población diana, población de estudio y muestra. Técnicas de muestreo
ERROR ALEATORIO Y SESGOS Aunque el muestreo tiene como fin obtener una muestra que sea representativa de la población, esto nunca se conseguirá completamente, pues existen dos limitaciones importantes: el error aleatorio y el sesgo de selección.3,7 El error aleatorio es natural e inevitable. Que una muestra aleatoria refleje más o menos las características de la población es, en parte, cuestión de azar. Habrá siempre una imprecisión en las estimaciones que se realicen. No obstante, gracias a la inferencia estadística, es posible cuantificar esa imprecisión y dimensionar las muestras para minimizar el error. Mientras que el error aleatorio es inevitable, el sesgo de selección constituye una limitación metodológica muy importante, es evitable, aunque no se dispone de herramientas para cuantificarlo y controlarlo. Se refiere a la distorsión en la estimación del efecto derivada de la forma en que se han seleccionado los sujetos de la muestra, debido a que la muestra no refleja adecuadamente la población. Existen muchos tipos de sesgos de selección, como el sesgo de inclusión, de autoselección, del trabajador sano, de Berkson o de Neymann, que no es posible desarrollar en la extensión de este capítulo.1-4,9 Como se ha mencionado, los sesgos se deben evitar en la medida de lo posible. Cuando no haya alternativa, es importante reconocer el sesgo de manera transparente a la hora de presentar los resultados de la investigación. Así queda claro sobre qué población se pueden considerar representativos los resultados.
PUNTOS CLAVE • Identifique la población diana y la población muestral de su estudio. • ¿Dispone de una lista o censo de su población muestral? En caso afirmativo: ¿El tamaño de la población es limitado? Si es así, considere un muestreo probabilístico simple. En caso contrario, valore un muestreo sistemático (vigile si la constante de intervalo se asocia al fenómeno que pretende estudiar, para evitar un sesgo) o por etapas. • ¿La población a estudiar no es homogénea? En dicho caso, valore la posibilidad de un muestreo estratificado por las variables que interese controlar. • ¿Los individuos de la población se agrupan en grupos naturales (áreas geográficas, áreas sanitarias…)? Si es así, puede resultar de interés un muestreo por conglomerados o etapas. • Si se plantea un estudio multicéntrico sin acceso al censo poblacional pero con disponibilidad de listados locales, valore la posibilidad de un muestreo por etapas. • Recuerde que, en la medida de lo posible, es preferible un muestreo probabilístico a uno no probabilístico. • Si no tiene acceso al censo de la población muestral y pretende realizar un estudio multicéntrico, entre las técnicas de muestreo no probabilístico considere en primer lugar el muestreo por cuotas. • Aunque resulta menos deseable, el muestreo discrecional siempre es preferible al muestreo de conveniencia. • En cualquier caso, intente controlar siempre los factores que puedan afectar a la representatividad de la muestra. • Realice una estimación del tamaño muestral para controlar el sesgo aleatorio. • ¿Identifica algún posible sesgo de selección? Si es así, siempre es mejor declararlo. • Verifique que ha completado todas las etapas del diseño de muestra (Figura 3.3.5).
185
Manual del Investigador Novel
BIBLIOGRAFÍA 1. 2. 3. 4. 5. 6. 7. 8. 9.
Thompson S. Sampling. Nueva York, Wiley, 1992. Silva Ayçaguer LC. Muestreo para la investigación en ciencias de la salud. Madrid, Díaz de Santos, 1993. Scheaffer R L, Mendenhall W, Ott L. Elementary Survey Sampling. Duxbury, Belmont, 1987. Rueda García MM, Arcos Cebrián A. Problemas de muestreo en poblaciones finitas. Madrid, Grupo Editorial Universitario, 2002. Hulley SB, Cummings SR. Diseño de la investigación clínica. Barcelona, Doyma, 1993. Abramson JH. Métodos de estudio en Medicina Comunitaria. Madrid, Ediciones Díaz de Santos, 1990: 74-84. Statistical Services Centre. Some Basic Ideas of Sampling, Statistical Good Practice Guidelines. Reading, University of Reading, 2001. Cochran W. Técnicas de Muestreo. México, Compañía Editorial Continental, 1985. Azorín F, Sánchez-Crespo JL. Métodos y aplicaciones del muestreo. Madrid, Alianza Universidad Textos, 1994.
186
3.3. Población diana, población de estudio y muestra. Técnicas de muestreo
TABLAS Y FIGURAS Tabla 3.3.1. Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico Ventajas
Inconvenientes
Aleatorio simple
• Sencillo y de fácil comprensión. • Cálculo rápido de medianas y varianzas. • Disponibilidad de paquetes informáticos para analizar los datos.
• Requiere poseer de antemano el listado completo de toda la población de estudio. • En muestras pequeñas, puede no representar adecuadamente a la población.
Sistemático
• Fácil de aplicar. • No siempre es necesario tener un listado de toda la población. • Cuando la población está organizada siguiendo una tendencia conocida, asegura la cobertura de unidades de todos los tipos.
• Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones obtenidas a partir de la muestra pueden contener sesgo de selección.
Estratificado
• Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables concretas. • Se obtienen estimaciones más precisas. • Pueden aplicarse distintas fracciones de muestreo dentro de cada estrato.
• Es necesario conocer la distribución en la población de las variables utilizadas para la estratificación.
Por conglomerados o en etapas
• Muy eficiente cuando la población es muy grande y dispersa. • No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo.
• El error estándar es mayor que en el muestreo aleatorio simple o estratificado. • El cálculo del error estándar es complejo.
187
Manual del Investigador Novel
Tabla 3.3.2. Ventajas e inconvenientes de los tipos más frecuentes de muestreo no probabilístico Ventajas
Inconvenientes
Muestreo por cuotas
• Rápido y eficiente. • Puede ser una alternativa a las muestras estratificadas.
• Sesgo del investigador.
Muestreo discrecional
• Rápido y de bajo coste. • No requiere entrenamiento de entrevistadores. • Tiene una validez relativa para estudios de casos. • Es muy útil para estudios exploratorios. • Útil para optimizar los instrumentos de observación. • Sirve para ampliar el marco teórico y la formulación de hipótesis.
• Problemas en los criterios de selección de los sujetos. • Carece de validez externa y fiabilidad.
Muestreo en bola de nieve
• Acumula información enriquecedora para constituir marcos teóricos. • Recomendada en estudios sociológicos.
• Requiere entrevistadores profesionales bien entrenados. • La interpretación de los resultados tiene problemas de fiabilidad. • Puede haber sesgo en la selección de los sujetos.
Muestreo de conveniencia
• De bajo coste y no requieren personal entrenado. • Se sacan conclusiones rápidamente.
• Carencia de validez externa y fiabilidad. • Presenta sesgos de muestreo por criterios arbitrarios en la selección de sujetos.
188
3.3. Población diana, población de estudio y muestra. Técnicas de muestreo
Figura 3.3.1.
Población diana
Población de estudio o marco muestral
Muestra
Figura 3.3.2.
189
Manual del Investigador Novel
Figura 3.3.3.
Definir población 4
Definir población de estudio 4
Determinar procedimiento de muestreo 4
4
Muestreo no probabilístico
4 Estimación del tamaño muestral
4
Muestreo probabilístico
4
Ejecución del diseño de muestra
Figura 3.3.4.
MUESTREO 4
4
Probabilístico
No probabilístico
Aleatorio simple
Por cuotas
Sistemático
Discrecional
Estratificado
Por bola de nieve
Por conglomerados
Conveniencia 190
3.3. Población diana, población de estudio y muestra. Técnicas de muestreo
Figura 3.3.5.
191
Manual del Investigador Novel
192
3.4. Tamaño de la muestra
3.4. TAMAÑO DE LA MUESTRA Dra. Cristina Esquinas López
INTRODUCCIÓN Todo estudio epidemiológico lleva implícito, en la fase de diseño, la determinación del tamaño muestral necesario para la ejecución del mismo. No realizar dicho proceso puede conducir a dos situaciones diferentes. La primera es que se realice el estudio sin el número adecuado de pacientes, con lo cual no se podrá ser preciso al estimar los parámetros y además no se encontrarán diferencias significativas cuando en realidad sí existen. La segunda es que la inclusión de un número excesivo de sujetos encarece el estudio tanto desde el punto de vista económico como de los recursos humanos y físicos. Además, puede ser considerado poco ético, ya que un mayor número de pacientes estará sometido innecesariamente a determinadas exploraciones o recibirá la intervención menos eficaz. Para determinar el tamaño muestral de un estudio, deben considerar diferentes situaciones: (a) Estudios para determinar parámetros, es decir, cuando se pretende hacer inferencias de valores poblacionales (proporciones, medias…) a partir de una muestra. Por ejemplo, el porcentaje de pacientes con EPOC que hayan presentado agudizaciones en el año previo). (b) Estudios para contraste de hipótesis, es decir, cuando se pretende comparar si las proporciones o las medias de dos o más muestras o grupos son diferentes. Por ejemplo, evaluar cuál de dos pautas terapéuticas consigue un mayor porcentaje de éxitos). El resultado del cálculo debe considerarse como orientativo, ya que se basa en asunciones que pueden ser incorrectas.
ESTIMACIÓN DE PARÁMETROS Con estos estudios pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra. Es importante reconocer que puede existir un error de muestreo en función de la muestra seleccionada. Así, si se desea estimar el valor medio de glucosa en sangre en una población, se escoge una muestra de 100 sujetos en los que se observa una media de 95 mg/dL, con una desviación estándar de 10 mg/dL. Si se hubiera 193
Manual del Investigador Novel
estudiado una muestra diferente, seguramente se habrían obtenido cifras distintas aunque los criterios de selección hubiesen sido los mismos. Por lo tanto, a partir del valor observado en una única muestra no puede conocerse exactamente el verdadero valor en la población de origen, ya que es tan sólo una aproximación (estimación puntual). Para conocer entre qué límites es más probable que se sitúe este verdadero valor, debe calcularse el intervalo de confianza (IC). El método de cálculo del IC en las situaciones más frecuentes se desarrolla en los capítulos dedicados al análisis de los datos. Cuanto menor sea la variabilidad del parámetro y mayor el número de sujetos, mayor precisión existirá en la estimación para un grado de confianza determinado. Cuanta más confianza se desee obtener, más amplio será el IC y menor la precisión obtenida. Para calcular el tamaño de la muestra, deben tenerse en cuenta: • La variabilidad del parámetro que se desea estimar. Si no se conoce, puede obtenerse una aproximación a partir de datos propios o de otras investigaciones, o un estudio piloto. En el caso de las variables cuantitativas, se mide por la variancia, y en el de las cualitativas, por el producto P x (1 – P). • La precisión con que se desea obtener la estimación, es decir, la amplitud del IC. Cuanto más precisa se desee, más estrecho deberá ser este intervalo y más sujetos deberán ser estudiados. La precisión debe fijarse previamente, en función de la finalidad de la estimación. En algunos casos, puede requerirse una gran precisión, mientras que en otros, si sólo se necesita conocer aproximadamente entre qué valores se encuentra el parámetro, se requerirá una menor precisión y, consecuentemente, menos sujetos. • El nivel de confianza deseado, que habitualmente se fija en el 95%, correspondiente a un valor α de 0,05. Este valor indica el grado de confianza que se tiene en que el verdadero valor del parámetro en la población se sitúa en el intervalo obtenido. Cuanta más confianza se desee, menor será el valor de α y más elevado el número de sujetos necesario. De estos tres elementos, sólo debe conocerse la variabilidad del parámetro, ya que tanto la precisión como el nivel de confianza se fijan a partir de los intereses del investigador. Estimación de una proporción Si se desea estimar una proporción, debe conocerse: a) El nivel de confianza o seguridad (1−α). El nivel de confianza prefijado da lugar a un coeficiente (z )α. Para un nivel de seguridad del 95 %, α = 1,96, para un nivel de seguridad del 99 %, α = 2,58. (Véase Tabla 3.4.1). b) La precisión que se desea para el estudio. c) Una idea del valor aproximado del parámetro que se quiere medir (en este caso, una proporción). Esta idea se puede obtener revisando la literatura o mediante estudios piloto previos. En caso de no tener dicha información, se utilizará el valor p = 0,5 (50 %). Por ejemplo, ¿a cuántas personas tendría que estudiarse para conocer la prevalencia de la hipertensión? Seguridad = 95 % Precisión = 3 %
194
3.4. Tamaño de la muestra
Proporción esperada = asumiendo que puede ser próxima al 5 %; si no se tuviese ninguna idea de dicha proporción, se utilizaría el valor p = 0,5 (50 %) que maximiza el tamaño muestral:
n=
z2α x p x q d2
donde:
z2α = 1,962 = 3,84, ya que la seguridad buscada es del 95 % p es la proporción esperada (en este caso 5 % o 0,05) q = 1− p (en este caso 1 – 0,05 = 0,95) d es la precisión deseada (en este caso un 3 %):
n=
1,962 x 0,05 x 0,95 = 203 0,032
Estimación de una medida En este caso también debe fijarse el nivel de confianza y la precisión de la estimación, que se traduce en la amplitud del intervalo alrededor de la media que se desea estimar. En las variables cuantitativas, la medida de la variabilidad viene proporcionada por la variancia de su distribución en la población. Si se desea estimar una media, habrá que conocer: (a) El nivel de confianza o seguridad (1−α). El nivel de confianza prefijado da lugar a un coeficiente (z)α. Para un nivel de seguridad del 95 %, α = 1,96, para un nivel de seguridad del 99 %, α = 2,58. (b) La precisión con que se desea estimar el parámetro (2 × d es la amplitud del intervalo de confianza). (c) Una idea de la varianza s2 de la distribución de la variable cuantitativa que se supone existe en la población.
z2α s2 n= 2 d Por ejemplo, si se desea conocer la media de la glucemia basal de una población con una seguridad del 95 % y una precisión de ± 3 mg/dl y se tiene información a través de un estudio piloto o de una revisión bibliográfica de que la varianza es de 250 mg/dl:
n=
1,962 x 250 = 203 32
Si no se dispone de una estimación de la variabilidad, puede utilizarse una regla práctica, que consiste en determinar la diferencia entre los valores máximo y mínimo esperables. Dado que se asume que esta variable es de distribución normal, el intervalo m ± (2s), siendo m la media y s la desviación estándar de la distribución, incluye aproximadamente el 95% de los valores posibles, por lo que al dividir dicha amplitud de valores entre 4, puede obtenerse una cierta aproximación al valor de la desviación estándar s.
195
Manual del Investigador Novel
Corrección para poblaciones finitas En los cálculos anteriores no ha intervenido el tamaño de la población, ya que en ellos se ha asumido que es infinito. Sin embargo, en muchas ocasiones es preciso obtener una muestra de una población de tamaño conocido (finito). En esta situación, puede aplicarse la siguiente fórmula, que ajusta el número de individuos necesarios según el tamaño de la población: na = n / [1 + (n/N)] donde: na es el número de sujetos necesarios, n es el número de sujetos calculado para poblaciones infinitas, N es el tamaño de la población.
PRUEBAS DE CONTRASTE DE HIPÓTESIS Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes. Desde el punto de vista estadístico, el investigador se enfrenta al problema del contraste de una hipótesis realizando la asunción de que no existen diferencias en la eficacia de los dos fármacos A y B (hipótesis nula). A partir de los resultados observados en la muestra, el investigador utilizará las pruebas de significación estadística para evaluar si existe la suficiente evidencia que le permita rechazar esta hipótesis nula y, consecuentemente, aceptar la hipótesis alternativa de que sí existen diferencias entre ambas terapéuticas. El error tipo I, conocido también como error α (Tabla 3.4.2) se comete cuando el investigador rechaza la hipótesis nula cuando esta es verdadera en la población. Es equivalente a encontrar un resultado falso positivo, ya que el investigador concluye que hay una diferencia, cuando en realidad no existe. El error tipo II, o error ß (Tabla 3.4.2) se comete en la situación contraria, cuando el investigador no rechaza la hipótesis nula pero esta es falsa en la población. Es equivalente a un resultado falso negativo, ya que el investigador concluye que ha sido incapaz de encontrar una diferencia que existe en la realidad. Si ß representa la probabilidad de un resultado falso negativo, su complementario 1 – ß, conocido como poder o potencia estadística, representa la probabilidad de observar en la muestra una determinada diferencia o un efecto, si existen en la población. Para calcular el tamaño de la muestra, se fijan a priori los riesgos de cometer estos errores que se está dispuesto a asumir (ver Tabla 3.4.2). Para el cálculo del tamaño muestral se precisa: (a) Magnitud de la diferencia a detectar que tenga un interés clínicamente relevante. Se pueden comparar dos proporciones o dos medias. Este punto tiene un gran impacto en el tamaño de la muestra, ya que si la diferencia es muy amplia (por ej., si la eficacia del fármaco A es el doble que la del B) se podrá detectar con más facilidad que si es de escasa magnitud, y requerirá un número menor de sujetos. Esta diferencia debe fijarse en términos realistas, dentro del rango de valores esperables. (b) Tener una idea aproximada de los parámetros de la variable que se estudia (a través de la bibliografía o de estudios previos). (c) Garantizar la seguridad del estudio (riesgo de cometer un error α). (d) Tener potencia estadística (1−β) (riesgo de cometer un error β). (e) Definir si la hipótesis va a ser unilateral o bilateral: 196
3.4. Tamaño de la muestra
• Bilateral: cualquiera de los dos parámetros a comparar (medias o proporciones) puede ser mayor o menor que el otro. No se establece ninguna dirección. • Unilateral: cuando se considera que uno de los parámetros debe ser mayor que el otro, indicando por tanto una dirección de las diferencias. La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de cometer un error de tipo I (rechazar la H0 cuando en realidad es verdadera). El tamaño de la muestra requerido es mayor cuanto más pequeña sea la diferencia que se desea detectar y menos elevados sean los riesgos α y β que se acepten. Es importante destacar que una misma diferencia del 5 % entre dos porcentajes requiere el máximo número de pacientes cuando éstos se sitúan alrededor del 50 %. Ello se debe a que, si el porcentaje del grupo de referencia es del 5 %, una diferencia del 5 % implica que el grupo de estudio debe pasar a un 10 %, es decir, dobla la eficacia. En cambio, si el porcentaje del grupo de referencia es del 50 %, una diferencia del 5 % implica solamente un incremento relativo del 10 %. Tamaño muestral para comparación de dos proporciones
donde: n es el número de sujetos necesarios en cada una de las muestras zα es el valor z correspondiente al riesgo α zβ es el valor z correspondiente al riesgo β p1 es el valor de la proporción en el grupo de referencia, placebo, control o tratamiento habitual p2 es el valor de la proporción en el grupo del nuevo tratamiento, intervención o técnica p es la media de las dos proporciones 1 p y 2 p:
p=
p1 + p2 2
Ejemplo Se desea evaluar si el tratamiento 2 T es mejor que el tratamiento 1 T para el alivio del dolor, para lo que se diseña un ensayo clínico. Se sabe por datos previos que la eficacia del fármaco habitual está alrededor del 70 % y se considera clínicamente relevante si el nuevo fármaco aliviara el dolor en un 90 %. El nivel de riesgo se fija en 0,05 y se desea una potencia estadística de un 80 %.
197
Manual del Investigador Novel
Estimación de un riesgo relativo Si el objetivo del estudio es determinar la magnitud de la asociación en términos relativos, la medida que se utilizará en los estudios prospectivos (ensayos clínicos y estudios de cohortes) es el riesgo relativo (RR). Lo que debe fijarse en este caso es la mínima magnitud del RR que se quiere detectar. En esta situación, puede utilizarse la misma fórmula que en el caso de la comparación de dos proporciones, teniendo en cuenta que: RR = P2/P1. La magnitud de la asociación que se quiere detectar corresponde al mínimo RR que se considerará de importancia clínica, donde: P1 es el riesgo de desarrollar la enfermedad en el grupo no expuesto P2 es el riesgo de desarrollar la enfermedad en el grupo expuesto (P2 = P1·RR). A partir del cálculo de la P2 se podría utilizar la fórmula:
El resultado nos indicaría el número en cada grupo (grupo expuesto y grupo no expuesto) necesario para detectar este RR establecido, pero debemos tener en cuenta la prevalencia de la exposición. Un punto importante es estimar cuántos sujetos se deben evaluar para conseguir el número de expuestos necesarios. Por ejemplo, si la frecuencia de la exposición en la población general (f) fuera de un 20 % y nuestro calculo indicara que necesitamos incluir a 199 expuestos, sería necesario examinar a N/f = 199/0,2 = 995 sujetos para encontrar a 199 expuestos.
ESTIMACIÓN DE UNA ODDS RATIO En los estudios de casos y controles, la magnitud de la asociación se estima mediante la odds ratio (OR). Se trata de una situación similar a la de la estimación de un RR, en la que debe conocerse la proporción de exposición esperada en los controles (P1) y fijar la magnitud de la OR que se desea detectar. La proporción esperada de exposición entre los casos es: P2 = (P1·OR) / [1 + P1·(OR – 1)]. A partir del cálculo de la P2 se puede utilizar la fórmula para la comparación de proporciones:
Tamaño muestral para la comparación de dos medias donde: n son los individuos necesarios en cada una de las muestras zα es el valor z correspondiente al riesgo deseado zβ es el valor z correspondiente al riesgo deseado 198
3.4. Tamaño de la muestra
s2 es la varianza de la variable cuantitativa que tiene el grupo control o de referencia d es el valor mínimo de la diferencia que se desea detectar (datos cuantitativos). Los valores zα según la seguridad y zβ según la potencia del test se indican en la tabla 3.4.1. Ejemplo Se desea utilizar un nuevo fármaco antidiabético y se considera que sería clínicamente eficaz si lograse un descenso de 15 mg/dl respecto al tratamiento habitual con el antidiabético estándar. Por estudios previos, sabemos que la desviación típica de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Se acepta un riesgo de 0,05 y se desea una potencia estadística del 90 % para detectar diferencias, en el caso de existir.
Se precisan, un total de 40 pacientes (20 en cada grupo).
EQUIVALENCIA DE DOS INTERVENCIONES En ocasiones se diseña un estudio para determinar si una nueva intervención, que ofrece alguna ventaja, como ser menos costosa o producir menos efectos secundarios, es tan eficaz como la terapéutica habitual. El concepto de equivalencia requiere descartar pequeñas diferencias en la respuesta a las intervenciones. Para considerar equivalentes dos intervenciones, la diferencia entre ellas debe ser menor que la mínima diferencia clínicamente relevante. Concepto de diferencia clínicamente relevante: La relevancia clínica de un fenómeno va más allá de cálculos aritméticos y está determinada por el juicio clínico. La relevancia depende de la magnitud de la diferencia, la gravedad del problema a investigar, la vulnerabilidad, la morbimortalidad generada por el mismo, su coste y su frecuencia, entre otros. La reducción relativa del riesgo relativo es una medida de utilidad en el cálculo de la relevancia clínica. Unas reducciones del riesgo relativo del 50 % casi siempre y del 25 % con frecuencia son consideradas clínicamente relevantes con independencia de la significación estadística La relevancia clínica se define como la diferencia entre los resultados que induciría a adoptar la mejor terapia. El procedimiento que se sigue es el de utilizar este valor como la diferencia que se desea detectar en el cálculo del número de sujetos. Fórmula para el cálculo del tamaño de la muestra en un estudio de equivalencia: Variable cualitativa
N=
Variable cuantitativa
2 P (1 - P) • (Zα + Zβ)o do
2σ2 (Zα + Z β)2 n= d2
199
Manual del Investigador Novel
donde: N: número de sujetos necesarios en cada uno de los grupos Zα: valor de Z correspondiente al riesgo α fijado Zβ: valor de Z correspondiente al riesgo β fijado P: proporción que se espera en el grupo control d: diferencia máxima entre la eficacia de ambos tratamientos que se tolerará para concluir que son equivalentes σ2 : varianza de la variable principal cuantitativa
EL TAMAÑO MUESTRAL AJUSTADO A LAS PÉRDIDAS En todos los estudios es preciso estimar las posibles pérdidas de pacientes por razones diversas (pérdida de información, abandono, no respuesta…), por lo que se debe incrementar el tamaño muestral en proporción a dichas pérdidas. El tamaño muestral ajustado a las pérdidas se puede calcular con la fórmula:
muestra ajustada a las pérdidas = donde: n: número de sujetos teórico R: la proporción esperada de pérdidas. Calculadoras de tamaño de muestra Considerando lo complicado que resulta aplicar los algoritmos de cálculo manualmente, es útil disponer de un programa informático que permita a usuarios no especialistas realizar las estimaciones más habituales de un modo fiable y rápido. En la actualidad existen calculadoras en línea gratuitas que nos facilitan los cálculos, pero es importante entender los conceptos que se han tratado en este capítulo e identificar la información y los datos que se deben incluir en estas calculadoras.
PUNTOS CLAVE • Todo estudio epidemiológico conlleva, en la fase de diseño, la determinación del tamaño muestral necesario para la ejecución del mismo, y de ello puede depender el éxito del estudio y obtener conclusiones válidas. • El cálculo de muestra es una estimación a priori, y pueden estimarse parámetros a partir de una muestra (diseños observacionales descriptivos) o estudios para contraste de hipótesis (diseños observacionales transversales, analíticos y experimentales). • El resultado del cálculo debe considerarse como orientativo, ya que se basa en asunciones que pueden ser incorrectas.
200
3.4. Tamaño de la muestra
BIBLIOGRAFÍA Argimón J, Jiménez J. Métodos de investigación. Madrid, Harcourt, 2000. Gordis L. Epidemiology. Philadelphia, Saunders-Elsevier, 4ª ed., 2009. Szklo M, Nieto J. Epidemiología Intermedia. Conceptos y aplicaciones. Madrid, Ediciones Díaz Santos, 1a ed., 2003. Milton S. Estadística para Biología y Ciencias de la Salud. Madrid, McGraw Hill-Interamericana, 3ª ed., 2001. Montesano JR. Manual del protocolo de investigación. México, Editorial Auroch, 1999. Lwanga SK, Lemeshow S. Sample size determination in health studies. A practical manual. Ginebra, Organización Mundial de la Salud, 1991. Laupacis A, Sackett DL, Roberts RS. An assesment of clinically useful measures of treatment. N Engl J Med. 1988;318(26):1728-1733. Guyatt GH, Sackett DL, Cook DJ. Users´ guides to the medical literature. II. How to use an article about therapy or prevention. B. What were the results and will they help in caring for my patients? Evidence Based Medicine Working Group. JAMA 1994; 271(1):59-63. Cook RJ, Sackett DL. The number needed to treal: a clinically useful measure of treatment effect. BMJ. 1995;310(6977):452-454.
201
Manual del Investigador Novel
TABLAS Y FIGURAS Tabla 3.4.1. Valores de Zα y Zβ más frecuentemente utilizados Zα α
Test unilateral
Test bilateral
0.200 0.150 0.100 0.050 0.025 0.010
0.842 1.036 1.282 1.645 1.960 2.326
1.282 1.440 1.645 1.960 2.240 2.576
Potencia β
(1-β)
Zβ
0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45
0.99 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55
2.326 1.645 1.282 1.036 0.842 0.674 0.524 0.385 0.253 0.126
Tabla 3.4.2. Tipos de error aleatorio en una prueba estadística de contraste de hipótesis H0
Aceptamos
Rechazamos
Verdadera
3 Decisión correcta
Error tipo I α
Falsa
Error tipo II β
3 Decisión correcta
202
3.5. Creación y medición de variables. Fuentes de información
3.5. CREACIÓN Y MEDICIÓN DE VARIABLES. FUENTES DE INFORMACIÓN Dr. Jordi Giner Donaire
Una vez diseñado el protocolo de investigación, con la hipótesis y objetivos del estudio, definida la población diana, la población a estudio y la determinación del tamaño de la muestra con la que se realizará la investigación, el siguiente paso será determinar qué necesitamos medir. Todo cuanto midamos durante el estudio constituyen las variables. Variable, del latín variabilis, es una palabra que representa aquello que varía o que está sujeto a algún tipo de cambio. Una variable se caracteriza por ser inestable, inconstante y mudable, o sea, es un símbolo que permite identificar un elemento dentro de un determinado conjunto. Este conjunto suele ser definido como universo de la variable, y cada elemento incluido en este universo constituye un valor de la variable. Por ejemplo, si “a” es una variable del universo compuesto por los números “2, 4, 6, 8”, el valor de “a” puede ser cualquiera de los números mencionados, por lo cual es posible reemplazar la “a” por cualquier número impar que sea inferior a 9. Un aspecto muy importante antes de empezar la investigación es tener el visto bueno del comité ético del centro o centros en que se realice (CEIC). En cuanto a las variables, debemos tener en cuenta que con ellas en ningún caso se pueda identificar al paciente o individuo del cual las tomamos, quien además habrá firmado, antes de comenzar la recogida de los datos o hacer ninguna intervención, un consentimiento informado.
TIPOS DE VARIABLES Las variables con las que trabajaremos se pueden clasificar como cuantitativas, cualitativas y dependientes de su influencia (Tabla 3.5.1). Variables cuantitativas Son las variables que toman como argumento cantidades numéricas que se expresan mediante números, por lo que con ellos se podrán realizar operaciones aritméticas. Además, las variables cuantitativas pueden ser: • Variables discretas, las que toman valores aislados, no admitiendo valores intermedios, como por ejemplo el número de ingresos en el último año, que pueden ser 1, 2, 3, etc.
203
Manual del Investigador Novel
• Variables continuas, las que pueden adquirir cualquier valor comprendido entre dos números, como por ejemplo la altura de los individuos estudiados, que puede ser: 1,64 m, 1,65 m, 1,66 m, etc., o el peso. Este tipo de variables sólo está limitado por la precisión de la medición. Variables cualitativas Son variables que, como su nombre indica, expresan distintas cualidades, características o modalidades que no pueden medirse con números. Cada modalidad que se presenta se denomina atributo o categoría, y la medición consiste en una clasificación de dichos atributos. Dependiendo de los valores que tomen, se pueden distinguir dos tipos: • Variable ordinal: puede tomar distintos valores ordenados siguiendo una escala establecida y presenta modalidades no numéricas que no admiten un criterio de orden; por ejemplo, el estado civil, que puede ser: soltero, casado, separado, divorciado, o viudo. • Variable nominal, cuyos valores presentan modalidades no numéricas, en las que existe un orden, como por ejemplo la gravedad del asma de los pacientes estudiados, que podría ser: intermitente, persistente-leve, persistente-moderada o persistente-grave. Variables según su influencia Según la influencia que asignemos en la investigación a cada una de las variables sobre otras, podrán ser: • Variables independientes, aquellas cuyo valor no depende de otra variable. Son las que el investigador escoge para establecer agrupaciones en el estudio y que, intrínsecamente, clasifican los casos de la investigación. Son variables independientes aquellas características o propiedades que se supone que son la causa del fenómeno estudiado. • Variables dependientes, aquellas cuyos valores dependen de los que tomen otras variables. Son las variables de respuesta que se observan en el estudio y que podrían estar influidas por los valores de las variables independientes. Se definen como propiedades o características que se trata de cambiar mediante la manipulación de la variable independiente. La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente. Por ejemplo: Si quiero ir desde casa hasta el trabajo, distante a 10 kilómetros, el tiempo que tarde en cubrir el trayecto dependerá de la velocidad con la que me desplace. De este modo, podemos establecer una función donde la velocidad es la variable independiente que determina la duración del viaje (variable dependiente). En algunos casos, y según el tipo de análisis que se desee realizar, las variables pueden ser modificadas. Así, por ejemplo, la variable cuantitativa “edad” la podemos convertir en variable cualitativa definiendo categorías: “niño” (entre 0 y 14 años); “adolescente” (entre 14 y 18 años); “adulto” (entre 19 y 60 años); “viejo” (mayor de 60 años). En estos casos, es imprescindible definir muy bien cada uno de los atributos de la variable, la edad en el ejemplo utilizado. Siempre es preferible recoger estas variables de forma cuantitativa para transformarlas posteriormente en cualitativas. Al revés, normalmente, será casi imposible realizar la transformación. Por ello, es imprescindible que antes de empezar el estudio se definan detalladamente todas y cada una de las variables a utilizar, ya que una vez iniciada la recogida de datos difícilmente podremos rescatar variables olvidadas o, en el caso de que se pueda hacer, se corre el riesgo de que provoquen un sesgo en los resultados finales.
204
3.5. Creación y medición de variables. Fuentes de información
MEDICIÓN DE LAS VARIABLES La medición es un proceso habitual en la práctica clínica y en la investigación. A pesar de que algunas variables son relativamente sencillas de medir, como la edad o el sexo, otras comportan cierto grado de subjetividad que dificulta especialmente su medición, como la intensidad de dolor o el concepto de calidad de vida. En cualquier caso, el proceso de medición conlleva siempre algún grado de error. Existen otros factores asociados a los individuos, al observador u observadores o al instrumento de medida, por ejemplo en variables fisiológicas en las que intervienen instrumentos, que pueden influir en la variación de las mediciones. Cualquier estudio de investigación debe garantizar la calidad de sus mediciones, ya que, por un lado, condicionará la validez de sus conclusiones, y por otro, por la importancia de las decisiones clínicas que de él se concluyan. La calidad de una medida depende de dos factores: la validez y la fiabilidad. La validez expresa el grado en que realmente se mide el fenómeno investigado. La fiabilidad indica hasta qué punto se obtienen los mismos valores al efectuar la medición en más de una ocasión, bajo condiciones similares. Que una medida sea muy precisa no implica que sea necesariamente exacta. Así, si se realizan dos espirometrías en un mismo paciente con un espirómetro mal calibrado, o sin seguir las recomendaciones establecidas para su realización, los valores obtenidos pueden ser parecidos (hay precisión en los resultados), pero inexactos. La figura 3.5.1 nos muestra un ejemplo de la diferencia entre precisión y exactitud. Por tanto, al protocolizar las mediciones a realizar debe tenerse en cuenta: • La repetibilidad de las mediciones, que indicará hasta qué punto un instrumento proporciona resultados similares cuando se aplica a una misma persona en más de una ocasión pero en idénticas condiciones. • La concordancia intraobservador, que tiene por objetivo evaluar el grado de coherencia de un observador consigo mismo al efectuar la medición a lo largo del tiempo. • La concordancia interobservador, que se refiere a la coherencia entre dos observadores distintos cuando evalúan una misma medida en un mismo o en diferentes individuos. Este tipo de concordancia es muy importante en el caso de que haya más de un observador.
FUENTES DE INFORMACIÓN Dependiendo del tipo de investigación que realicemos, tendremos a nuestra disposición diferentes fuentes de información. En el caso de estudios clínicos, las principales fuentes de información son las siguientes: Cuestionarios. Debemos utilizar cuestionarios validados anteriormente por otros autores o, en su defecto, definir muy bien cada uno de los aspectos que intervienen en el cuestionario a utilizar. En lo posible, estará compuesto por preguntas cerradas (sí, no) o respuestas categorizadas, que no permitan términos medios. Por ejemplo, el Test de Morisky-Green, el Cuestionario de Control del Asma, etc. Entrevistas y encuestas estructuradas. Al igual que los cuestionarios, si se utilizan entrevistas o encuestas para obtener datos de nuestra investigación, éstas deben contener preguntas cerradas con una opción a escoger clara. Las preguntas abiertas complicarán su posterior tabulación. Observaciones directas (análisis clínicos). Son las mediciones más habituales en los ensayos de investigación. En estos casos, deberá definirse cómo se realizan las calibraciones de los equipos a utilizar, las mediciones que se obtengan y las escalas a utilizar para garantizar unos datos homogéneos. Estas observaciones pueden obtenerse, entre otros, de la gasometría arterial, talla, peso, analítica, presión arterial, ECG, espirometría, etc.
205
Manual del Investigador Novel
Registro de datos (historia clínica). Generalmente, el registro de datos, en nuestro caso la historia clínica, se utilizará sobre todo en investigaciones retrospectivas. Este tipo de información puede adolecer de una uniformidad en su recogida, y por ello en ocasiones su validez puede ser menor que la obtención de los datos prospectivamente, que sí permite una recogida uniforme. Un aspecto importantísimo en la recogida de datos es la preservación de la información personal de los individuos participantes, tal como se indica en la Declaración de Helsinki. Una vez definidos los pasos anteriores, y antes de empezar el estudio, es interesante realizar una prueba piloto con un grupo pequeño de individuos, a los que se les realizará todo el procedimiento protocolizado. Recogiendo los datos de estos individuos evaluados y realizando un análisis, podremos comprobar la validez de las variables y valorar si disponemos de todas las necesarias; en caso contrario, aún estaremos a tiempo de realizar los cambios oportunos.
PUNTOS CLAVE Tipos de variables: • Cuantitativas: indican cantidad o Discretas: toman valores aislados sin admitir valores intermedios. o Continuas: pueden adquirir cualquier valor comprendido entre dos números. • Cualitativas: expresan cualidades o Ordinal: toman valores ordenados siguiendo una escala. o Nominal: toman valores no numéricos pero que siguen un orden. • Según su influencia o Independientes: aquellas que no dependen de otra variable. o Dependientes: aquellas cuyo valor depende de otra variable. * Algunas variables continuas pueden ser modificadas y categorizadas, pasando a ser variables cualitativas. Medición de las variables. Para que una variable sea válida, debe comportar: • Precisión y exactitud. Para ello, las mediciones deben presentar: o Repetibilidad: resultados similares. o Concordancia intraobservador: coherencia de la medición por un mismo observador. o Concordancia interobservador: coherencia entre distintos observadores. Fuentes de información: • • • •
Cuestionarios: a ser posible validados. Entrevistas y encuestas estructuradas: con preguntas cerradas y con opción clara a escoger. Observaciones directas: análisis clínicos. Registro de datos: generalmente de la historia clínica.
206
3.5. Creación y medición de variables. Fuentes de información
BIBLIOGRAFÍA Argimon Pallán JM, Jiménez Vill J. Métodos de investigación clínica y epidemiológica. Madrid, Harcorurt, 2ª ed., 2000. Hernández Aguado I, Porta Serra M, Miralles M, García Benavides F, Bolúmar F. La cuantificación de la variabilidad en las observaciones clínicas. Med Clin. 1990;95:424-429. Sackett DL. A primer on the precision and accuracy of the clinical examination. JAMA. 1992;267(19):26382644. Latour J, Abraira V, Cabello JB, López Sánchez J. Métodos de investigación en cardiología clínica (IV). Las mediciones en clínicas en cardiología: validez y errores de medición. Rev Esp Cardiol. 1997;50(2):117-128. Pita Fernández S, Pértega Díaz S. Pruebas diagnósticas. Cad Aten Primaria. 2003;10:120-124.
207
Manual del Investigador Novel
TABLAS Y FIGURAS Tabla 3.5.1. Tipos de variables Variables cuantitativas: indican cantidad Discretas: toman valores aislados y no admiten valores intermedios
Continuas: pueden adquirir cualquier valor comprendido entre dos números
Variables cualitativas: expresan distintas cualidades, características o modalidades que no pueden medirse con números Ordinal: toman valores ordenados siguiendo una escala establecida, sin un orden
Nominal: valores no numéricos, en los que existe un orden
Variables según su influencia Independientes: los valores no dependen de otra variable
Dependientes: los valores dependen de otra variable
Figura 3.5.1.
208
3.6. Trabajo de campo
3.6. TRABAJO DE CAMPO Máster María Ángeles Gimeno Peribáñez
La expresión trabajo de campo es la traducción del término inglés field-work, introducido por Haddon, naturalista y antropólogo británico. Dicho término hace referencia, en los aspectos esenciales, a la estancia continuada y prolongada de un investigador especializado entre un grupo humano, consecuencia inherente a las experiencias viajeras de exploración a principios de siglo XX. De ahí que las referencias sobre trabajo de campo de la literatura científica suelan estar relacionadas con la antropología, la etnografía y la observación participante. Un ejemplo de ello es la definición de trabajo de campo de Stocking (1993): “El trabajo de campo es la experiencia constitutiva de la antropología, porque distingue la disciplina, cualifica a sus investigadores y crea el cuerpo primario de sus datos empíricos”. En este contexto, el trabajo de campo es considerado más que una técnica y más que un conjunto de técnicas, “es una situación metodológica y también en sí un proceso, una secuencia de acciones, de comportamientos y de acontecimientos, no todos controlados por el investigador”.1-2 La investigación de campo se apoya en informaciones que provienen de otras informaciones, entrevistas, cuestionarios, encuestas y observaciones. En todo caso, es importante realizar siempre la confirmación documental con el fin de evitar duplicidades. Es importante reconocer la existencia de investigaciones anteriores efectuadas sobre la misma materia y cuyas conclusiones se puedan usar como insumos iniciales de la investigación más actual. Por todo ello, e intentando simplificar, el trabajo de campo se podría definir como el conjunto de acciones para obtener, en forma directa, los datos de las fuentes primarias de información (personas en el lugar y tiempo en qué suceden los hechos o acontecimientos de interés para la investigación).
CARACTERÍSTICAS DEL TRABAJO DE CAMPO Talor y Bogdan enumeran las características del trabajo de campo o investigación cualitativa que se especifican a continuación. 1. La metodología es inductiva: Se desarrollan conceptos y se establecen teorías a partir de la información recogida. Por ello se dice que su diseño es flexible y elástico, ya que se debe adaptar a los hallazgos de la recogida de datos. También se dice que es un diseño emergente, ya que puede ser modificado si, al analizar la recogida de datos, el investigador se plantea la posibilidad de usar técnicas de recogida diferentes a las previstas.
209
Manual del Investigador Novel
2. El investigador ve el escenario y a las personas desde una perspectiva holística, es decir, considerados como un todo y no como una variable. Las personas son sometidas a la investigación en su contexto, sin ser sometidas a distorsiones ni controles experimentales. 3. Los investigadores son naturalistas, interactúan con los sujetos de un modo natural y, por tanto, no intrusivo.3-4
TIPOS DE DISEÑO DE TRABAJO DE CAMPO Diseño experimental Consiste en simplificar el objeto de estudio en forma de variables. Así, las condiciones son controladas y conocidas por el investigador para observar los resultados que cada variable ejerce sobre el objeto del estudio. No se puede aplicar a estudios sociales. Experimento post-facto Consiste en que el investigador realice una prueba donde no controla ni regula el entorno. Posteriormente, se observan los efectos de los hechos. Diseño encuesta Consiste en preguntar de forma directa y simple a determinadas personas representativas de la población en estudio, para conocer su comportamiento. Es de aplicación frecuente en ciencias sociales. Diseño panel Consiste en encuestas que se aplican a una misma muestra para observar la evolución, efectuándose en lapsos prefijados y regulares de tiempo. Sin embargo, la progresiva reducción del tamaño de la muestra por diversas causas (fatiga, traslado, etc.) ocasiona que el error muestral se incremente progresivamente afectando de forma negativa la calidad de los resultados. Estudio de casos Consiste en profundizar el estudio en uno o varios objetos de investigación (casos).5-6
TÉCNICAS Y FASES DEL TRABAJO DE CAMPO Las técnicas básicas del trabajo de campo se pueden diferenciar en técnicas cuantitativas y técnicas cualitativas. Cada grupo de técnicas, con sus ventajas y limitaciones, se puede usar con distintos propósitos pero, con frecuencia, acaban siendo mutuamente complementarias. Varios autores, como Valles, han explicado las diferentes fases de la investigación cualitativa en relación con el trabajo de campo. No obstante, hay que distinguir las fases previas de aquellas que se realizan durante el periodo de trabajo de campo y determinar cuáles son las tareas completadas por el investigador después de “abandonar el campo” (Tabla 3.6.1).5-8,11-13
210
3.6. Trabajo de campo
Proceso en la investigación de campo I.
Concebir la idea a investigar: Son muchos los interrogantes que el investigador se puede plantear en el momento de elegir un tema de investigación. La primera pregunta es: ¿Qué investigar? Aunque este interrogante parece fácil, no lo es. En el complejo mundo del investigador existe un universo de problemas que solo él deberá descifrar. El primer problema será el de establecer prioridades en el momento de enfrentarse a lo que, de ahora en adelante, se llamará objeto de investigación, problema de investigación o tema de investigación. El investigador deberá seleccionar el problema que mejor responda a múltiples condiciones, como se explica a continuación. a) Objetividad: Escogerá el problema y lo investigará tratando de que los aspectos subjetivos no interfieran a priori. Aunque desprenderse de la subjetividad no es tarea fácil, se debe procurar para no distorsionar la investigación. Es inevitable y útil, por otro lado, aplicar los conocimientos previos del investigador para interpretar los datos recogidos por diferentes técnicas de recolección. Esa información requerirá la capacidad de interpretación del investigador para completar los logros que se pretenden alcanzar, utilizando los referentes empíricos (datos, hechos) que él mismo deberá identificar dentro del proceso de investigación. b) Entusiasmo por el tema: Es parte importante del éxito de la investigación. Cuando el tema no es del agrado del investigador, existirá una predisposición a que todo lo que vaya a hacer pueda salir mal, hay desaliento y desmotivación. Por ello, es recomendable que el investigador se compenetre con el tema. c) Conocimientos previos sobre el tema: Es muy deseable poseer un buen conocimiento previo del tema objeto de estudio, pues ello permitiría comparar y discriminar cuáles serán las fuentes principales o más fiables de la investigación. d) Apoyo documental o bibliográfico: Es la mejor ayuda para lo que se pretende investigar. Disponer de material de apoyo significa que el tema ha sido estudiado por otros autores. Aunque con variables distintas, pueden tener conclusiones coincidentes, por lo que deberán considerarse en el contexto de periodos de tiempo diferentes y la presencia de otros indicadores o referentes empíricos, dentro de las mismas variables. Esta revisión hará que el tema de estudio no sea igual al de otras investigaciones y que se disponga de un mayor conocimiento para abordar, desde cualquier punto de vista, la temática seleccionada en ese momento.
II.
Selección de la muestra: La muestra es, en esencia, un subgrupo de la población. Se puede decir que es un subconjunto de elementos que pertenecen a ese conjunto definido en sus necesidades al que llamamos población general. De esta población (universo) es conveniente extraer una muestra que sea representativa. En el plan de estudio, se debe definir y justificar los universos en estudio, el tamaño de la muestra, el método a utilizar y el proceso de selección de las unidades de análisis. En realidad, pocas veces es posible medir la población general, por lo que debemos seleccionar una muestra que esperamos sea un reflejo adecuado y fiel de la población. Básicamente, el proceso de selección de la muestra consiste en categorizar dos grandes ramas: las probabilísticas y las no probabilísticas. Se entiende por muestras probabilísticas aquellas en las que todos los elementos de la población tienen la misma probabilidad de ser escogidos. Por el contrario, las muestras no probabilísticas se constituyen cuando la elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características de la investigación o del investigador. La selección de la muestra también se puede realizar desde dos puntos de vista: muestra cuantitativa y muestra cualitativa. La muestra cuantitativa es un subgrupo de la población del cual se recolectan los datos y debe ser proporcionalmente representativa de dicha población. La muestra cualitativa es la unidad de análisis o conjunto de personas, contextos, eventos o sucesos sobre la cual se recolectan los datos sin que, de manera necesaria, guarden una proporcionalidad numérica con la población de la que proceden. 211
Manual del Investigador Novel
III.
Marco teórico: Representa el soporte inicial de la investigación. También se le denomina marco teórico conceptual, marco referencial, marco estructural conceptual de la investigación o marco conceptual. Aborda las características del fenómeno en estudio. Estas características no son más que las diferentes proposiciones y conocimientos que permitirán estudiar el problema, que nos permiten seleccionar las técnicas metodológicas más adecuadas. Los conceptos para organizar los datos así como la metodología para la investigación son de fundamental importancia. Por ello se deberá planear un procedimiento ordenado que nos permita discriminar lo más significativo de los hechos y datos que nos llevan a conseguir el objetivo de la investigación.
IV.
Definir el tipo de investigación: Cada tipo de investigación amerita una estrategia metodológica diferente, según sea una investigación histórica, descriptiva o experimental, un estudio causal, exploratorio o productivo.
V.
Establecer las hipótesis: La hipótesis es el nexo entre la teoría y la realidad, lo que nos lleva al descubrimiento o explicación de nuevos hechos y/o a la investigación de otros. La hipótesis puede estar basada en una presunción o en el resultado final de otros estudios, o también puede plantear la posibilidad de una relación semejante entre dos o más variables de otro estudio. A veces, también puede estar basada en un proceso deductivo derivado de la presentación de ciertas condiciones que nos conducen a obtener ciertos resultados, es decir, a establecer una relación causa-efecto. Una hipótesis bien descrita nos indicará la forma en que debe ser estructurada y el tipo de estudio más adecuado para la obtención de los datos.
VI.
Selección de la muestra: Es el procedimiento por el cual se delimitan las muestras de una población de elementos mediante unos criterios de decisión. El muestreo es importante porque a través de él podemos hacer análisis de situaciones de una empresa o de algún aspecto de la sociedad. La muestra debe ser suficientemente representativa para que sirva para describir fielmente las características de esa población. Los métodos para seleccionar una muestra representativa son múltiples y dependen del tiempo, dinero y habilidad disponibles para seleccionar la muestra y la naturaleza de los elementos individuales de la población. Por lo tanto, se requiere un gran volumen para incluir todos los tipos de métodos de muestreo.
VII. Recolección de datos: La investigación no tiene sentido sin las técnicas de recolección de datos. Estas técnicas conducen a la verificación del problema planteado. Cada tipo de investigación determinará las técnicas más adecuadas, y éstas, a su vez, las herramientas, instrumentos o medios que serán empleados. Todo lo que va a realizar el investigador se basa en la técnica de la observación. Aunque utilice métodos diferentes, su marco metodológico se centra en la técnica de la observación, y el éxito o fracaso de la investigación dependerá del método empleado. Después de la obtención de los datos, la siguiente fase es el procesamiento de los mismos. Para dar respuesta a los indicadores de estudio, el analista utiliza instrumentos que conforman los sistemas de información, como la entrevista, la encuesta, el cuestionario, la observación, el diagrama de flujo y el diccionario de datos. Todos estos instrumentos se aplicarán en un momento en particular con la finalidad de conseguir la información que será útil a una investigación. VIII. Análisis de datos: Los cuadros de datos elaborados deberán ser analizados e interpretados para describir las conclusiones. IX.
Presentación de los resultados: Con todos los datos ya recogidos, se deberá darles sentido e integrar su explicación con los resultados obtenidos. La culminación de este proceso de análisis e interpretación 212
3.6. Trabajo de campo
nos permitiría demostrar la validez de las proposiciones iniciales, es decir, confirmar o desmentir las hipótesis según el diseño seleccionado.6-9,11,13
PREPARACIÓN DEL INVESTIGADOR PARA INICIAR EL TRABAJO DE CAMPO Antes de realizar el trabajo de campo (entendido como la fase de generación de información), los investigadores deben tomarse su tiempo para prepararlo. La preparación depende, en primer lugar, de las estrategias metodológicas o método seleccionado (etnografía, fenomenología, teoría fundamentada...). En segundo lugar, y en relación con el método, de las técnicas de generación de información que se utilizarán (observación participante, grupos focales, entrevistas individuales...). En tercer lugar, la preparación deberá considerar el tipo de terreno, los informantes clave, las características de los participantes, etc. Así, cada abordaje metodológico y cada técnica de generación de información requerirán una preparación específica.
RECOGIDA DE DATOS EN EL TRABAJO DE CAMPO Encuestas Instrumento de observación formado por una serie de preguntas formuladas y cuyas respuestas son anotadas por el “empadronador”. Por otra parte, el diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que, si queremos conocer algo sobre el comportamiento de las personas, lo más directo y simple es preguntárselo. El proceso de diseño de encuestas deriva de los objetivos formulados y la hipótesis de trabajo, y se desarrolla descomponiendo las variables que se identifican en el estudio, las mismas que se detallaban en la exposición del marco teórico.10,14 Actualmente y gracias a las nuevas tecnologías, existen diferentes aplicaciones para realizar encuestas on-line, algunas de forma gratuita, como Survio, Survey Monkey, Google Drive… Cada una de ellas tiene sus ventajas y limitaciones. Por otra parte, debe tenerse en cuenta que los diseños de encuesta se dividen en entrevistas y cuestionarios. La diferencia entre ambos radica en que en la entrevista se formulan las preguntas verbalmente y se requiere un entrevistador. En el cuestionario, las respuestas son registradas por escrito y no se requiere la presencia de un entrevistador. Cuestionario “Instrumento formado por una serie de preguntas que se contestan por escrito a fin de obtener la información necesaria para la realización de una investigación”. Con la aplicación de este instrumento no puede obtenerse toda la información requerida en la investigación, es decir, sólo parte de la misma. La totalidad de los datos requeridos en la investigación serán conseguidos aplicando las diversas técnicas y estrategias (fichas de investigación documental, de observación directa o indirecta, etc.). El mismo informante escribe las respuestas, no siendo necesaria la presencia del entrevistador. Entrevista Es una técnica de recopilación que va desde la interrogación estandarizada hasta la conversación libre. En ambos casos se recurre a una “guía”, que puede ser un formulario o un bosquejo de cuestiones para orientar la conversación. La correcta interpretación y valoración de estos datos exige un procesamiento adecuado. 213
Manual del Investigador Novel
Para ello, se requiere el instrumento respectivo –boleta o guía– según los objetivos marcados y el fundamento teórico-conceptual del que se disponga. La entrevista ofrece la posibilidad de interacción verbal entre dos personas: una persona (encuestador) solicita información a otra (informante) para obtener los datos sobre un problema determinado. Una vez definidas las variables, se procede a diseñar el instrumento respectivo estructurándolo en secciones mayores. En esta etapa deben tenerse en cuenta las posibles respuestas, así como la distribución que mejor posibilite una tabulación rápida y efectiva de los datos, codificando los diferentes segmentos en forma jerárquica y organizada. El instrumento que concreta la técnica de la entrevista (el formulario o boleta) se adapta al estudio en función de la información que se necesite del informante. 1. Las entrevistas de opinión o de personalidad. Tienen por fin conocer las opiniones o las actitudes de la persona entrevistada. Esta técnica posibilita “conocer el conjunto de la personalidad del individuo interrogado, su carácter, sus tendencias, su perfil psicoanalítico”. Con los datos recolectados es posible efectuar inferencias, generalizaciones e interpretaciones de la realidad estudiada. 2. Las entrevistas documentales. Se aplican a personas, con la diferencia de que con este último procedimiento se pretende conocer lo que los individuos saben, no así lo que son o hacen. Grupos de enfoque Reuniones de grupos reducidos, generalmente homogéneos, de personas con el perfil de los segmentos de la población en estudio que, conducidos por un moderador y conforme a una guía, facilitan la expresión espontánea de los participantes en su propio lenguaje. Además, permiten identificar aspectos que generan consensos o disensos y enriquecer con matices y posibles variantes el análisis del tema en estudio. Por su propia naturaleza, este tipo de estudios no permite predicciones numéricas ni tiene validez estadística pero aporta, en cambio, valiosa información de profundidad, imposible de obtener con las técnicas cuantitativas. Las ventajas de usar ambas técnicas en combinación resultan evidentes. Observación Básicamente, consiste en ver, oír y percibir los hechos que se desean estudiar y las circunstancias en que se dan éstos. La observación se clasifica de la siguiente manera: • Según los medios utilizados: o Observación no estructurada. o Observación estructurada. • Según la participación del observador: o Observación no participante. o Observación participante. • Según el número de observadores: o Observación individual. o Observación en equipo. • Según el lugar donde se efectúa: o Observación efectuada en la vida real.
PUNTOS CLAVE Ver figura 3.6.1.
214
3.6. Trabajo de campo
BIBLIOGRAFÍA 1. Stocking GW “La magia del etnógrafo. El trabajo de campo en la antropología británica desde Tylor a Malinowski”, en Velasco HM, García FJ (ed.), 1993. 2. Nure Investigación, núm. 28, Mayo-Junio 07. 3. Taylor SJ, Bogdan R. Introducción a los métodos cualitativos de investigación. Editorial Paidós, 1987, capítulo 1, p. 20-23. 4. Valles MS. Técnicas cualitativas de investigación social. Reflexión metodológica y práctica profesional. Madrid, Síntesis, 2000. 5. Sampieri R, et al. Metodología de la Investigación. México, Mc. Graw - Hill, 2ª ed., 1998. 6. Ander EGG. Técnicas de Investigación Social. Buenos Aires, Editorial Humanitas, 19ª ed., 1978. 7. Arias FG. El Proyecto de Investigación: Guía para su elaboración. Venezuela, Editorial Episteme, 1999. 8. Bavaresco De Pietro AM. Proceso Metodológico de la Investigación (Como hacer un Diseño de Investigación). Maracaibo, Editorial de la Universidad del Zulia, 1997. 9. Bunge M. La investigación científica. Barcelona, Editorial Ariel, 2ª ed., 1985. 10. Carvajal L. Metodología de la Investigación. Curso General y Aplicado. Cali, Editorial Fald, 17ª ed., 1999. 11. Ragusso S. Manual de Metodología para Universitarios. Mérida, Talleres Gráficos ULA, 1978. 12. Suárez De Paredes N. La Investigación Documental Paso a Paso. Mérida, Consejo de Publicaciones. Facultad de Humanidades y Educación, 1999. 13. Tamayo Tamayo M. El Proceso de investigación científica. México. Editorial Limusa, 1981. 14. Otros recursos utilizados: http://www.ing.ula.ve/~fatima/metodo.html http://www.rrppnet.com.ar/tecnicasdeinvestigacion www.encuestas-internet.com
215
Manual del Investigador Novel
TABLAS Y FIGURAS Tabla 3.6.1. Técnicas cualitativas de investigación social Fases y tareas: decisiones de diseño Antes de iniciar el trabajo de campo
Durante el trabajo de campo
Al final del estudio
Etapa de reflexión y preparaión del proyecto
Etapa de entrada y realizaicón Etapa de inicio y realización del trabajo de campo
Etapa de finalización, análisis final y escritura
Tareas: • Gestión (cartas, visitas de presentación...) • Ajuete en las técnicas de generación de información • Ejecución del trabajo de campo • Archivo y análisis preliminar
Tareas: • Finalización o interrupción del trabajo de campo • Análilsis intenso final • Redacción y presentación del informe
Tareas: • Formulación del problema • Selección de estrategia metodológica • Selección de casos, contextos, fechas.
Tabla 1. Modificada de Valles MS. Técnicas cualitativas de investigación social. Reflexión metidológica y práctica profesional. Madrid: Sintesis; 2000.
Figura 3.6.1.
PROBLEMA
ACERCAMIENTO INICIAL AL CAMPO
DISEÑO DE INVESTIGACIÓN
4
4
4
4
4
ANÁLISIS DATOS
MARCO REFERENCIAL
4
4
4
4
BIBLIOGRAFÍA EXISTENTE
4
PRESENTACIÓN RESULTADOS
4
4
4
4
IDEA
RECOGIDA DE DATOS
216
DEFINICIÓN DE DE MUESTRAS INICIAL Y ACCESO A ELLA
3.7. Procesamiento y gestión de muestras biológicas. Biobancos
3.7. PROCESAMIENTO Y GESTIÓN DE MUESTRAS BIOLÓGICAS. BIOBANCOS Dra. Isabel Novoa García
MUESTRAS BIOLÓGICAS PARA INVESTIGACIÓN BIOMÉDICA La investigación biomédica se basa principalmente en el estudio de las enfermedades humanas para identificar sus causas y posibles tratamientos, con el objetivo principal de mejorar la salud y la calidad de vida de los seres humanos. La identificación de la causa o causas de las enfermedades a nivel molecular/celular lleva a la determinación de biomarcadores de enfermedades, los cuales son clave para comprender cómo funciona un organismo en condiciones normales y por qué su alteración conduce al desarrollo de enfermedades. Las muestras biológicas humanas más frecuentemente utilizadas para la determinación del estado de salud son la sangre y la orina, pero el abanico ha ido aumentando hasta incluir cualquier tejido del cuerpo humano (tejidos de diferentes órganos o localizaciones) o fluido (líquido cefalorraquídeo, exudados, etc.). La diversidad de muestras obtenidas y analizadas para proyectos de investigación biomédica queda patente especialmente en enfermedades pulmonares, para las que el repertorio de muestras analizadas incluye además muestras tales como el esputo, el lavado broncoalveolar, el frotis nasal y el frotis faríngeo. El proceso de estudio de biomarcadores de enfermedades pasa por diferentes etapas desde la fase de descubrimiento, pasando por la validación del biomarcador, hasta su aplicación clínica para diagnóstico, predicción, pronóstico o tratamiento de la enfermedad en cuestión. La fase de descubrimiento de biomarcadores requiere un número de muestras menor que las fases más avanzadas de este proceso. Sin embargo, en esta fase de descubrimiento se suelen analizar muchos potenciales biomarcadores a través de técnicas de gran alcance, técnicas “ómicas” tales como la proteómica, la genómica, etc. Al contrario, las fases de validación se centran en un menor número de biomarcadores, pero precisan un mayor número de muestras y múltiples procedencias.1 El tipo de muestras necesarias para este proceso de estudio de biomarcadores viene determinado por factores como los tres que se enuncian a continuación. 1. Los órganos o sistemas a los que afecte dicha enfermedad: enfermedad localizada en un órgano (cerebro) vs enfermedad sistémica (enfermedad presente en el sistema circulatorio). 2. Lo invasiva o no invasiva que pueda ser la toma de la muestra: biopsia vs orina.
217
Manual del Investigador Novel
3. La estabilidad del tipo de muestra frente a la degradación de las moléculas que la componen. Por ejemplo, cuanto más pequeño sea el trozo de tejido pulmonar, más rápida será su degradación, es decir, una muestra de biopsia de pulmón es menos estable que el pulmón entero (explante de pulmón de receptores de trasplante). Estos factores anteriormente citados son clave para establecer qué muestras serán obtenidas a la hora de estudiar biomarcadores de enfermedades. Finalmente, el formato en el cual se obtiene la muestra y se preserva depende del tipo de muestra (sangre, tejido, orina, etc.), del tipo de biomoléculas o células que se pretenden analizar (proteínas, eritrocitos, etc.) y del tipo de técnica de análisis. Por ejemplo, se puede obtener sangre en tubo con EDTA para aislar y analizar el ADN por técnicas de genómica, o se puede obtener una biopsia de tejido para analizar la expresión de proteínas por inmunohistoquímica. Por todo ello, actualmente existen más tipos diferentes de tubos para obtener las muestras de sangre y más variedad de agentes estabilizantes de tejidos. Los diferentes tipos de tubos de sangre se han desarrollado para obtener, a partir de las muestras de sangre, diferentes componentes, tales como suero, plasma, ADN genómico, ADN libre, ARN, células sanguíneas, etc. De la misma manera, las muestras de tejido se pueden obtener y fijar con reactivos tales como formol, paraformaldehído, glioxal u otras soluciones, o se pueden congelar por diferentes procedimientos de enfriamiento (congelación gradual con isopentano, congelación rápida con nitrógeno líquido, etc.).
PROCESAMIENTO Y ALMACENAMIENTO DE MUESTRAS Y DATOS ASOCIADOS Procesamiento y almacenamiento de muestras La búsqueda de biomarcadores requiere analizar los subproductos que se derivan de las muestras obtenidas originalmente. Por tanto, es necesario establecer qué subproducto/s se quiere analizar para determinar qué muestras se deben obtener y almacenar y, en consecuencia, definir en qué tipo de recipiente y solución estabilizadora serán necesarios y qué procesamiento habrá que aplicar. Por ejemplo, el suero, el plasma y el ADN genómico son subproductos de la sangre. Para separar suero se utilizan tubos de sangre sin agentes coagulantes, y para aislar plasma y ADN genómico se pueden utilizar tubos de sangre EDTA, que permiten aislar estos dos subproductos. Existen guías, recomendaciones y artículos que ayudan a establecer cuál es la mejor manera de obtener las muestras y sus respectivos subproductos.2-4 El protocolo técnico (procedimiento) que se utiliza para procesar las muestras también es clave, ya que las diferencias en el procesamiento de las muestras pueden introducir artefactos que nada tienen que ver con las características originales de las mismas, y ello puede conducir a encontrar “falsos” biomarcadores de enfermedad. Por este motivo, también es importante reducir al mínimo las diferencias debidas al procesamiento de las muestras, para lo que será crucial utilizar procedimientos normalizados de trabajo (PNTs) o kits de casas comerciales o equipos robotizados para procedimientos repetitivos. Entre los equipos robotizados, es común disponer de robots de dispensación de líquidos (robot para generar alícuotas de plasma, suero, etc.) o equipos extractores de ácidos nucleicos (equipos extractores de ADN). El proceso de investigación en biomarcadores es un proceso largo que requiere años de investigación, por lo que también es clave preservar las muestras durante el máximo tiempo posible en un formato que garantice su estabilidad a lo largo del tiempo. En la mayoría de casos, las muestras se suelen preservar a muy bajas temperaturas porque así son más estables, de ahí que sean necesarios congeladores de -80 ºC para guardar sueros y plasmas, o tanques de nitrógeno líquido, que mantienen las células a temperaturas de -150 ºC o inferiores. Muchos tejidos son almacenados durante muchos años a temperatura ambiente tras ser fijados en formol y embebidos en parafina, aunque los tejidos también se pueden almacenar congelados a -80 ºC.
218
3.7. Procesamiento y gestión de muestras biológicas. Biobancos
Debido a que las muestras humanas pueden contener potencialmente agentes patógenos, es necesario disponer de equipos de protección individual (EPIs), también conocidos como equipos de protección personal (EPPs), que protejan al personal que manipula las muestras, y de instalaciones de laboratorio y salas de almacenamiento de muestras de acceso restringido a personal cualificado para reducir la exposición accidental de personal no cualificado.
DATOS ASOCIADOS A LAS MUESTRAS Los datos asociados a las muestras se pueden clasificar en función de a quién o a qué corresponden los datos. Así, se pueden distinguir las siguientes categorías. Datos del biobanco/biorepositorio Son los datos que permiten saber a qué institución está vinculado el biobanco o biorepositorio en el cual están disponibles las muestras para investigación biomédica. Datos del paciente o donante de muestras Suelen incluir datos de identidad (nombre, apellidos), datos de edad o fecha de nacimiento, datos de identificación como el DNI, el número de historia clínica (NHC), etc. Datos de la donación Son los datos del estado de salud correspondientes a una fecha determinada. Por ejemplo: donación en el momento del trasplante se refiere al conjunto de datos del estado de salud de un paciente que ha sido trasplantado de pulmón; donación 3 meses posttrasplante se refiere al conjunto de datos tras 3 meses posttrasplante pulmonar, etc. Datos de la muestra Conjunto de datos que caracterizan/describen una muestra. Por ejemplo, tipo de muestra, concentración y pureza del ADN, tejido tumoral o no tumoral, etc. Datos de análisis de las muestras Conjunto de datos que resultan del análisis de la muestra. Por ejemplo, niveles de glucosa en sangre, datos del genotipo del donante/paciente, resultado de análisis genómicos, etc. Los datos asociados a las muestras también se pueden clasificar en otras categorías, como las siguientes: • Datos biométricos: altura, peso, etc. • Datos del estilo de vida: dieta alimentaria, consumo de diferentes sustancias (alcohol, tabaco, etc.), actividad física, etc. • Datos del estado de salud del paciente, comúnmente llamados datos clínicos o datos de diagnóstico (por ejemplo: diabetes, niveles de glicemia, etc.).
219
Manual del Investigador Novel
APLICATIVOS DE GESTIÓN DE MUESTRAS Los aplicativos desarrollados para gestionar muestras y datos de laboratorios se denominan Laboratory Information Management Systems (LIMS). Están diseñados para disponer de las muestras y los datos con dos finalidades principales: 1) localizar las muestras y los datos que puedan ser solicitadas por investigadores para realizar proyectos de investigación y 2) dar respuesta a las peticiones de donantes/pacientes que soliciten ejercer sus derechos.5-7 Estos aplicativos están en desarrollo continuo para dar respuesta a las nuevas necesidades, tales como: 1) registrar cada vez más datos asociados a las muestras, 2) visibilizar parte de la información de forma segura permitiendo a los investigadores saber más de las muestras disponibles para investigación, 3) interaccionar con otros sistemas de información y 4) comunicarse con equipos de procesamiento de muestras para actualizar la información de trazabilidad o de análisis de las muestras, etc.
GESTIÓN DE MUESTRAS BIOLÓGICAS Aunque el muestreo tiene como fin obtener una muestra que sea representativa de la población, esto nunca La gestión de las muestras humanas para investigación biomédica hace referencia a todos los aspectos que se deben tener en cuenta a la hora de disponer y utilizar estas muestras para la realización de investigación biomédica. Desde la publicación de la primera versión de la Declaración de Helsinki8 y hasta nuestros días, para realizar investigación con muestras humanas hay que cumplir las condiciones que se enumeran a continuación. 1. Que el paciente/donante haya sido informado del proyecto de investigación y que consienta en donar sus muestras para investigación. 2. Que la obtención de las muestras no suponga un riesgo para la salud del paciente/donante. 3. Que el proyecto de investigación haya sido aprobado por los comités éticos responsables de esta función (CEIm, comités de ética de investigación con medicamentos, o CEI, comités de ética de investigación). 4. Que se den garantías de trazabilidad de las muestras para que los pacientes/donantes puedan ejercer sus derechos de cambiar de opinión y solicitar destruir sus muestras (derecho de revocación del consentimiento y de destrucción de las muestras). 5. Que se den garantías de trazabilidad de las muestras para que los pacientes/donantes puedan solicitar información sobre qué resultados se han obtenido fruto de la investigación con sus muestras (derecho de información). 6. Que los responsables de disponer de muestras para investigación, ya sean investigadores o instituciones, hagan públicos en revistas científicas los resultados de sus investigaciones. 7. Que los responsables de disponer de muestras para investigación, ya sean investigadores o instituciones, hagan difusión de los avances clave de la investigación en un lenguaje asequible para el público general (responsabilidad social de la investigación). Los aspectos anteriormente mencionados han conducido a que sea necesario legislar esta actividad para garantizar su cumplimiento5-7 y gestionar muestras biológicas humanas para investigación biomédica.
BIOBANCOS Tanto el aumento de la actividad de investigación biomédica (que implica analizar un mayor número de muestras, disponer de muestras con garantías de calidad y colaborar a nivel nacional o internacional) como el requisito de respetar los derechos de los donantes/pacientes y de la sociedad en general, han contribuido 220
3.7. Procesamiento y gestión de muestras biológicas. Biobancos
a la creación y desarrollo de unidades especializadas en la gestión de muestras biológicas para investigación biomédica, denominadas biobancos. Los biobancos son unidades de apoyo a la investigación. En su mayoría, forman parte de instituciones públicas de investigación biosanitaria, principalmente vinculadas a hospitales. En España, para poder operar los biobancos deben ser previamente autorizados. Existe un registro centralizado público donde se puede consultar el listado de biobancos autorizados (Registro Nacional de Biobancos). Estos trabajan en redes colaborativas para aunar esfuerzos en estrategias comunes con el fin de apoyar la investigación biomédica (Red de Banco de Tumores de Cataluña o Red Nacional de Biobancos). Los biobancos ofrecen un catálogo de servicios y de colecciones de muestras disponibles a través de sus páginas web. A continuación se enumeran algunos de los servicios que ofrecen normalmente. 1. Servicios de asesoramiento en aspectos técnicos, éticos, legales, metodológicos y científicos en relación a la obtención, procesamiento, almacenamiento y distribución de muestras humanas para investigación biomédica. 2. Servicios de obtención, procesamiento y almacenamiento de muestras humanas para investigación biomédica. 3. Servicios de distribución de muestras (cesión de muestras) en respuesta a peticiones de investigadores. El catálogo de muestras de un Biobanco varía y depende de múltiples factores, pero se pueden clasificar los biobancos en las siguientes categorías. 1. Biobancos monográficos de una enfermedad o conjunto de enfermedades: por ejemplo, biobancos especializados en enfermedades raras o en patologías renales. 2. Biobancos con múltiples bancos que no están especializados en ninguna patología: por ejemplo, biobancos que disponen de banco de tumores, banco pulmonar, banco de inmunología, etc. Este es el caso de muchos biobancos vinculados a hospitales o centros de investigación en entornos hospitalarios. 3. Biobancos con poblaciones de referencia que disponen de donantes de la población general de una zona geográfica o país. Los biobancos deben disponer de una estructura mínima, consistente en un director/a, un titular del biobanco y dos comités externos de supervisión de su actividad, el comité científico externo y el comité ético externo. El personal de los biobancos está especializado en aspectos técnicos y metodológicos de procesamiento de muestras y de su análisis, en aspectos de calidad, integridad y seguridad de datos asociados a las muestras (datos del donante y datos de características de su enfermedad) y en aspectos éticos y legales del uso de muestras humanas para investigación biomédica. Por lo tanto, requiere una formación multidisciplinar en biomedicina, gestión de datos, gestión de bases de datos, bioética y legislación. Finalmente, cabe destacar que en los últimos años los biobancos y redes colaborativas de biobancos han realizado una intensa actividad para facilitar el acceso de los investigadores a las muestras almacenadas en sus instalaciones, siempre garantizando el cumplimiento de los derechos de los donantes. Todo ello, en conjunto, está haciendo que la contribución de los biobancos a la investigación biomédica y a la medicina del futuro sea clave.
221
Manual del Investigador Novel
PUNTOS CLAVE • La identificación de las causas de las enfermedades humanas se basa en la identificación de biomarcadores mediante la realización de proyectos de investigación biomédica. • Las muestras más utilizadas para investigación son la sangre, la orina y los tejidos. • Los tipos de muestras necesarios para la realización de proyectos de investigación dependen de varios factores, tales como: enfermedad localizada o extendida por todo el cuerpo, riesgo de la toma de ese tipo de muestras y estabilidad del tipo de muestra frente a la degradación de sus componentes. • Para el desarrollo de un proyecto de investigación biomédica, es necesario definir: o el tipo de subproductos que se quieren analizar (ej. ADN) o el tipo de muestras que se deberán obtener (ej. sangre) y el tipo de agente estabilizante óptimo para ese tipo de muestra (ej. EDTA) o el procedimiento para procesar todas las muestras de la misma manera o el modo de almacenaje de las muestras y la temperatura adecuada para garantizar la estabilidad a largo plazo. • Los datos asociados a las muestras son tan importantes como las muestras en sí, porque definen las características de los donantes, su estado de enfermedad, el tipo de muestras disponibles y los resultados del análisis de las muestras. • La gestión de las muestras para investigación biomédica comprende: o informar y pedir el consentimiento a los donantes de las muestras. o Disponer de la aprobación del proyecto de investigación emitida por comités que velen por el cumplimiento de requisitos legales y consensos bioéticos. o Garantizar la trazabilidad para que los donantes puedan ejercer sus derechos. o Hacer difusión de los resultados obtenidos del análisis de las muestras. • Los biobancos ofrecen servicios especializados de obtención, procesamiento, almacenamiento de muestras humanas para investigación biomédica en cumplimiento con la legislación vigente y para promover una investigación de calidad y competitiva.
222
3.7. Procesamiento y gestión de muestras biológicas. Biobancos
BIBLIOGRAFÍA 1. Silajdžić E, Björkqvist MA. Critical Evaluation of Wet Biomarkers for Huntington’s Disease: Current Status and Ways Forward. J Huntingtons Dis. 2018;7(2):109-135. 2. Guerin JS, Murray DW, McGrath MM, Yuille MA, McPartlin JM, Doran PP. Molecular medicine Ireland guidelines for standardized biobanking. Biopreserv Biobank. 2010;8(1):3-63. 3. Esteva-Socias M, Artiga MJ, Bahamonde O, Belar O, Bermudo R, Castro E, Escámez T, Fraga M, Jauregui-Mosquera L, Novoa I, Peiró-Chova L, Rejón JD, Ruiz-Miró M, Vieiro-Balo P, Villar-Campo V, Zazo S, Rábano A, Villena C. In search of an evidence-based strategy for quality assessment of human tissue samples: report of the tissue Biospecimen Research Working Group of the Spanish Biobank Network. J Transl Med. 2019;17(1):370. 4. 2012 best practices for repositories collection, storage, retrieval, and distribution of biological materials for research international society for biological and environmental repositories. Biopreserv Biobank. 2012;10(2):79-161. 5. Gobierno de España. Ley 14/2007, de 4 de julio, de Investigación biomédica. 6. Gobierno de España. RD 1716/2011, de 18 de noviembre, por el que se establecen los requisitos básicos de autorización y funcionamiento de los biobancos con fines de investigación biomédica y de tratamiento de las muestras biológicas de origen humano, y se regula el funcionamiento y organización del Registro Nacional de Biobancos para investigación biomédica. 7. Gobierno de España. Ley Orgánica 3/2018, de 5 de diciembre, de Protección de Datos Personales y garantía de los derechos digitales. 8. Declaración de Helsinki de la Asociación Médica Mundial (AMM) - Principios éticos para las investigaciones médicas en seres humanos. Disponible en: http://www.wma net/es/30publications/10policies/b3/.
223
Manual del Investigador Novel
224
3.8. Financiación de un proyecto. Memoria económica
3.8. FINANCIACIÓN DE UN PROYECTO. MEMORIA ECONÓMICA Dr. José Luis López-Campos Bodineau
La realización de proyectos de investigación requiere dos pilares fundamentales. El primero y más importante es la presencia de un grupo de investigación con conocimientos sobre un tema concreto e interés para invertir esfuerzo personal en desarrollar un trabajo de investigación que permita responder a una pregunta relevante que sirva para avanzar en el conocimiento actual de la patología concreta en estudio. Este aspecto de la investigación es el más importante y, en muchas ocasiones, el único necesario. Gran parte de la investigación actual se inicia sin financiación externa. Existen numerosos proyectos de investigación que han originado publicaciones relevantes con avances en el conocimiento de diversas enfermedades que se han llevado a cabo gracias al trabajo y al esfuerzo de los investigadores como único recurso. En este campo tenemos ejemplos en investigación epidemiológica y en investigación clínica. Sin embargo, cuando una línea de investigación tiene un cierto grado de complejidad o necesita recursos añadidos, necesitamos un segundo pilar, que es la financiación de los proyectos. La mayoría de los proyectos de investigación conllevan un coste, que puede ser de diversa índole e importancia según su magnitud. Por este motivo, el investigador, durante la fase de planificación de su proyecto, no sólo deberá tener en cuenta los aspectos metodológicos del mismo. Además, deberá hacer una planificación de los recursos necesarios y de la fuente de financiación para garantizar la viabilidad económica del proyecto. Este aspecto es crucial en el desarrollo de proyectos de investigación, por un doble motivo. Por un lado, porque los materiales necesarios para llevar a cabo un buen proyecto son, por lo general, caros, y por el otro, porque obtener financiación de las agencias financiadoras puede ser complicado, ya que la mayoría tiene un alto grado de competitividad y no siempre se obtiene una respuesta positiva. Durante las próximas líneas abordaremos la financiación de proyectos de investigación –las fuentes disponibles, las normas a tener en cuenta para solicitarla y algunos aspectos prácticos sobre la elaboración de la memoria económica del proyecto– con el objeto de proporcionar al profesional sanitario las nociones básicas sobre las herramientas necesarias para la captación de fondos para el desarrollo de su línea de investigación.
NORMAS GENERALES Para obtener los recursos económicos necesarios para una investigación, es importante que se planifique previamente la estrategia de financiación. Esta planificación debe seguir unas normas generales.
225
Manual del Investigador Novel
En primer lugar, debe hacerse con tiempo. Es importante tener presente que los tiempos inherentes al proceso de solicitud, concesión y reclamación de ayudas son prolongados. Normalmente, desde el momento en que un investigador decide pedir una ayuda hasta el momento en que se la conceden suelen pasar varios meses, e incluso algún año. Este proceso se puede duplicar si el proyecto no obtiene la financiación en una primera convocatoria y los investigadores deciden volver a solicitarla en la misma o en otra agencia financiadora. De este modo, la búsqueda de una nueva financiación debe comenzarse meses antes de que salga la convocatoria y debe desarrollarse paralelamente a la concepción metodológica del proyecto. Se suele decir que si ya está abierta la convocatoria, probablemente el investigador va tarde. Una opción puede ser preparar una buena memoria del proyecto a principios de año o en el momento en que se tenga la idea madura, y estar atento a la publicación de convocatorias para que sólo haya que adaptarla a las normas concretas y enviar el proyecto. En segundo lugar, debe dársele la mayor importancia. Los evaluadores de proyectos no sólo hacen una valoración metodológica del mismo, sino también una valoración denominada estratégica (sobre la adecuación de la propuesta a las líneas u objetivos de la convocatoria) y una valoración de la memoria económica del proyecto. Estos tres aspectos de un proyecto tienen una importancia similar, por lo que es necesario prestar atención a la justificación económica de las necesidades. En tercer lugar, es importante indicar qué se solicita, pero también qué no se solicita por ya disponer de ello. Una parte crucial de un proyecto es identificar los recursos de los que ya se dispone y los recursos nuevos que son necesarios. Por lo general, si un proyecto se enmarca en una línea consolidada de investigación, los autores ya tendrán parte del material, puesto que lo habrán obtenido de proyectos previos. Igualmente, si se trata de un grupo consolidado, con frecuencia estará ubicado en un instituto de investigación o una institución acreditados que ya cuentan con una infraestructura para realizar el proyecto. Este aspecto es importante, ya que aporta solidez al grupo, la institución y la propuesta. Por tanto, es importante reseñar bien los recursos con los que se cuenta. En cuarto lugar, la memoria económica debe ceñirse a las necesidades. Para esto es necesario hacer una estimación lo más exacta posible del coste. Los evaluadores son investigadores con experiencia y conocen con frecuencia cómo está el mercado de los materiales de investigación. Lo normal es que los materiales tengan un coste determinado, que no suele ser un número redondo. Es necesario que la suma de lo que se pide sea la suma real de las necesidades. No es una buena tarjeta de presentación poner en un proyecto que se necesitan, por ejemplo, 10.000 euros para kits de ELISA. Esta cifra redonda da la impresión de ser una estimación aproximada, no un coste real. Al contrario, en la memoria económica es necesario hacer una estimación del número de kits necesarios, ver el coste real de cada uno y poner el precio final real, y no una estimación redondeada. Como norma general, no se debe presupuestar aquello que no sabemos cuánto costará. En quinto lugar, como consecuencia, el presupuesto debe ser razonable. En ocasiones, las agencias financian un proyecto, pero no al 100%, sino que aportan una parte del mismo. Si el presupuesto es demasiado caro, los evaluadores podrían considerar que con los recursos que podrían adjudicar los investigadores no podrían llevar a cabo el proyecto y, por tanto, descartarían financiarlo. Por el contrario, si el presupuesto es demasiado barato y esto no está justificado, es muy probable que los evaluadores duden de su veracidad. Finalmente, si el proyecto ya está parcialmente financiado por otra entidad, es necesario decirlo. En primer lugar, por honestidad. En segundo lugar, porque un proyecto ya parcialmente financiado y bien justificado tiene un valor añadido, pues eso significa que ya ha pasado y superado una evaluación externa. Además, si el proyecto es muy caro, es más fácil que entonces otra entidad aporte un porcentaje de su coste porque sabe que el proyecto es económicamente viable.
226
3.8. Financiación de un proyecto. Memoria económica
FUENTES DE FINANCIACIÓN Hoy en día, existen numerosas fuentes de financiación para una línea de investigación. Las posibilidades de financiación y el número de entidades que financian diversos aspectos de la investigación son considerables. Por lo general, los gobiernos nacionales y regionales disponen de partidas presupuestarias para investigación. Por otro lado, muchas sociedades científicas tienen convocatorias específicas para proyectos de investigación. Además, cada día aumenta el número de empresas que apuestan por hacer convocatorias de investigación como parte de su compromiso social corporativo. Estas convocatorias son públicas y, por lo general, se anuncian con suficiente tiempo de antelación. Por este motivo, el equipo de investigación debe conocer sus potenciales agencias financiadoras y las fechas de las convocatorias para programar la solicitud en tiempo y forma. Para ayudar a tener esta información, existen entidades que sintetizan todas las convocatorias y mantienen a los investigadores actualizados e informados de las convocatorias durante todo el año. Un ejemplo es la Fundación Progreso y Salud de la Junta de Andalucía (http://www.juntadeandalucia. es/fundacionprogresoysalud/), que periódicamente edita un manual con todas las convocatorias que tiene registradas (Figura 3.8.1). Además, emite un boletín informativo por correo electrónico que alerta a los investigadores de las convocatorias abiertas. Las convocatorias pueden clasificarse de diversas formas. Dependiendo de la naturaleza de la convocatoria, existen varios tipos. Estas oportunidades se agrupan en: • Convocatorias de ayudas. Financiación en concurrencia tanto competitiva como no competitiva de entidades públicas y privadas. • Colaboraciones. Se trata principalmente de integrarse en una red de colaboración para colaborar en sus objetivos y compartir fondos. Actualmente existen redes de colaboración que tienen este fin. El ejemplo más claro es el Centro de Investigación Biomédica en Red (CIBER) del Ministerio de Economía y Competitividad. Además, para desarrollar demandas tecnológicas, algunas empresas privadas buscan grupos de investigación que lleven a cabo búsqueda de socios para participar en convocatorias nacionales o internacionales. • Donaciones o patrocinios para actividades concretas. Los grupos de investigación, a través de las fundaciones de investigación de su institución, pueden recibir fondos de patrocinios o donaciones para sus fines de investigación. Las entidades patrocinadoras pueden ser públicas o privadas. Las entidades públicas suelen tener más recursos disponibles para la financiación. Sin embargo, suelen ser muy competitivas y no siempre se obtiene una valoración positiva, ya que, como los recursos son limitados, la aprobación de un proyecto no depende sólo de la calidad del mismo, sino también de la calidad de los demás proyectos. Dentro de las instituciones privadas, existen empresas que, como parte de su compromiso social corporativo, hacen convocatorias, generalmente anuales, para financiar algún aspecto de la investigación biomédica. Las industrias farmacéuticas son especialmente importantes para obtener financiación, ya que pueden destinar recursos a la investigación, no sólo por responsabilidad social corporativa, sino también como parte de su desarrollo como empresa. Las colaboraciones entre industria farmacéutica e investigación son frecuentes, siempre que se cumplan los requisitos éticos para proyectos de investigación y se reconozca esta colaboración en las publicaciones o comunicaciones a congresos que resulten. Finalmente, las sociedades científicas son entidades privadas que suelen tener la investigación como uno de sus fines fundacionales y que suelen hacer convocatorias anuales. Según la competencia para conseguir financiación, las convocatorias se dividen en competitivas o no competitivas. Lógicamente, las competitivas suelen ser mejor valoradas y disponer de más recursos, aunque no siempre es el caso. 227
Manual del Investigador Novel
Según su objetivo, las convocatorias pueden ser genéricas o específicas. La mayoría de las convocatorias públicas son genéricas, es decir, financian proyectos de investigación de diversos temas. Sin embargo, existen convocatorias, generalmente en el ámbito privado, que financian proyectos de investigación de una patología concreta. Por este motivo, es necesario leerse bien las normas de la convocatoria antes de realizar la solicitud.
QUÉ SE PUEDE FINANCIAR La investigación es una actividad compleja que requiere apoyo en diversos aspectos. Todas las necesidades se pueden dividir en los siguientes apartados: recursos humanos, recursos materiales, contratación de servicios y viajes y dietas. Recursos humanos. En el apartado de recursos humanos se incluye la contratación de personal investigador para trabajar en el proyecto. En función de las características del proyecto, se puede solicitar contratar a un técnico de laboratorio o a un licenciado pre o postdoctoral. La concesión de personal para un proyecto de investigación suele ser complicada, puesto que consume gran parte del coste de un proyecto. Por este motivo, debe estar siempre muy bien justificada. En la justificación de la necesidad de contratar personal es importante tener presente la composición del grupo de investigación, ya que con frecuencia se solicita personal para realizar una actividad que ya se podría realizar por tener miembros del equipo de investigación que pueden llevarla a cabo. Por tanto, es importante tener bien justificada la necesidad de recursos humanos. Debido a la dificultad de conseguir financiación para personal, existen convocatorias específicas para financiarlo. Para ello, suele ser requisito imprescindible tener un proyecto de investigación previamente financiado al que se adscribiría el investigador contratado. Una convocatoria especial de recursos humanos son las denominadas becas de intensificación de la actividad investigadora. En estas convocatorias, se financia el centro sanitario para que con ese dinero se contrate a una persona a tiempo parcial para que haga el trabajo clínico del investigador de modo que este quede liberado de su actividad clínica rutinaria y pueda concentrarse en investigar. Por lo general, el médico intensificado suele quedar liberado en un 50% de su tiempo, que podrá dedicar a investigación. Recursos materiales. Suelen ser material inventariable y/o fungible. El material inventariable es aquel que tras su utilización en el proyecto queda a disposición del equipo investigador y del centro como parte de su inventario; por ejemplo, un congelador o una centrifugadora. Suele ser de un precio elevado y, en ocasiones, con dispositivos excesivamente costosos. Puede ser que el propio centro disponga de este material inventariable y lo ponga a disposición de los investigadores, generalmente bajo la fórmula de pago por uso. En cuanto al material fungible, es aquel que se consume durante la ejecución del proyecto y se extingue con el mismo. Suelen ser kits de reactivos o material para experimentos. Contratación de servicios. En ocasiones, es necesario contratar a una persona o una entidad para que desarrolle parte de la ejecución del proyecto. No consiste en contratar una persona para el proyecto (que sería de recursos humanos), sino en contratar un servicio concreto. Los más habituales son servicios de traducción de artículos y algún servicio de laboratorio en una institución de investigación. Viajes y dietas. En este apartado se incluyen los gastos derivados del desplazamiento de los investigadores para la ejecución del proyecto de investigación. Generalmente incluye dos situaciones principales: presentar los resultados de la investigación en congresos y simposios y hacer reuniones de investigadores en los estudios multicéntricos. 228
3.8. Financiación de un proyecto. Memoria económica
MEMORIA ECONÓMICA Con todo lo anteriormente expuesto, el paso final es hacer la memoria económica del proyecto. En esta memoria se deben tener en cuenta todos los principios enumerados en las páginas anteriores. La distribución de las partidas presupuestarias varía en cada convocatoria según las reglas de esta, pero por lo general sigue el esquema del apartado anterior y suele tener al menos tres apartados: personal, gastos de ejecución y viajes y dietas. Los gastos de ejecución incluyen material inventariable, material fungible y contratación de servicios. Es importante recordar que la memoria debe quedar pormenorizada para que el evaluador sepa en qué conceptos se va a invertir cada partida presupuestaria.
PUNTOS CLAVE • Para obtener los recursos económicos necesarios para una investigación, es importante que se planifique previamente la estrategia de financiación. • La planificación de la memoria económica debe realizarse con tiempo, dándole la importancia necesaria, indicando qué se solicita y qué no se solicita, ciñéndose a las necesidades reales y elaborando un presupuesto razonable. • Las posibilidades de financiación y el número de entidades, tanto públicas como privadas, que financian diversos aspectos de la investigación son considerables. • Las convocatorias pueden ser en forma de ayudas, de colaboraciones o de donaciones, e incluyen recursos humanos, recursos materiales, contratación de servicios y viajes y dietas.
229
Manual del Investigador Novel
TABLAS Y FIGURAS Figura 3.8.1.
230
3.8. Financiación de un proyecto. Memoria económica
231
Manual del Investigador Novel
Manual del INVESTIGADOR NOVEL
Con el patrocinio de:
232