7 minute read
Open Access Data: Un recurso clave para la investigación en salud
DATOS DE ACCESO ABIERTO (OPEN ACCESS DATA)
¿QUÉ ES OPEN DATA?
Advertisement
En un mundo impulsado por la información, los datos se han convertido en un recurso valioso. Esta creciente demanda de acceso a la información ha llevado a un movimiento global hacia la apertura y la democratización de los datos [1]. El open access data promueve el acceso y uso colaborativo de información relevante para la investigación en salud. Esto impulsa el avance científico, la transparencia de los algoritmos y la reproducibilidad de resultados. Sin embargo, se requiere un marco normativo y ético que regule el uso y proteja la privacidad. La gobernanza colaborativa establece políticas y procedimientos para salvaguardar la seguridad y transparencia en el acceso a los datos. Existen dos tipos principales de datos: los intra-open access, disponibles para grupos específicos, y los extra-open access, disponibles para la comunidad internacional. Ambos requieren el cumplimiento de acuerdos de uso, protección de la identidad de los pacientes y promoción de la colaboración. En resumen, el open access data en salud impulsa la investigación, pero con un enfoque en la privacidad y la colaboración interdisciplinaria.
Principios Fair
Los principios FAIR (Findable, Accessible, Interoperable, and Reusable) son fundamentales en los repositorios de datos sanitarios públicamente disponibles. Estos principios buscan garantizar una gestión y un intercambio abierto y accesible de los datos [2]. Se destaca la importancia de que los datos sean "encontrables", es decir, contar con documentación descriptiva que facilite su localización. Los datos deben ser "accesibles" para las personas interesadas, aunque en el ámbito de la salud se requieren restricciones adicionales para proteger la confidencialidad. La “interoperabilidad” es otro principio clave, asegurando que los datos estén estructurados de manera que puedan combinarse con otros conjuntos de datos. Por último, los datos deben ser "reutilizables", lo que implica una preparación y documentación adecuadas para su uso en diferentes contextos. Estos principios promueven la transparencia, la colaboración y el avance de la investigación, fomentando una cultura de datos abiertos y compartidos.
El uso de conjuntos de datos masivos, herramientas de Big Data e Inteligencia Artificial (IA) tiene un enorme potencial en el campo de la salud. Los repositorios de datos de acceso abierto en investigación clínica desempeñan un papel fundamental al proporcionar una plataforma transparente y colaborativa para abordar diversas preguntas clínicas. Durante la pandemia de COVID-19, estos datos clínicos fueron especialmente valiosos para mejorar la comprensión de la enfermedad y facilitar decisiones y tratamientos más efectivos [3].
Mediante el uso de técnicas de machine learning y modelos de deep learning, los investigadores lograron predecir con mayor precisión la evolución de los pacientes, lo que abre oportunidades para un cuidado personalizado y optimizado [4], [5]. Esto demuestra el poder transformador de los datos en el ámbito de la salud y su capacidad para mejorar la calidad de vida. En resumen, el acceso abierto a los datos, tanto intra como extra, fomenta la colaboración y el intercambio de conocimientos clínicos. Al abrir los datos y compartir el código fuente utilizado para su análisis, se facilita la sinergia entre investigadores de diferentes niveles de experiencia, lo que maximiza el potencial de nuevos descubrimientos y avances científicos. Además, un acceso seguro y controlado a los datos, junto con la optimización de la infraestructura y la transparencia en el entrenamiento de modelos, acelera el proceso de validación de hipótesis y la obtención de algoritmos confiables.
Casos De Xito
Se han desarrollado diversas iniciativas tanto a nivel internacional como nacional en el ámbito del open data sanitario. A nivel internacional, destacan proyectos como ‘MIMIC’ (Medical Information Mart in Intensive Care), una base de datos clínica colaborativa entre el Beth Israel Deaconess Medical Center y el MIT, que contiene datos de más de 300,000 pacientes. Otros ejemplos son ‘eICU’, una base de datos de investigación colaborativa que recopila información de múltiples unidades de cuidados críticos en Estados Unidos, con datos de más de 200,000 admisiones en UCI; ‘AMDS’, con datos desidentificados de ingresos en UCIs europeas creada por el Consorcio de Hospitales Universitarios de Amsterdam; y el proyecto colaborativo ‘The Dutch ICU Data Warehouse’, el cual comparte datos de pacientes con COVID-19 graves de más de 35 UCIs en Países Bajos. En cuanto a iniciativas nacionales, destacan ‘Covid Data Save Lives’, que proporciona un dataset anonimizado con información clínica de pacientes tratados por COVID-19 en HM Hospitales; y OPEN DATA COVID Sanitas, que ofrece datos demográficos y clínicos de pacientes ingresados por COVID-19 en los centros médicos de Sanitas de forma segura y anonimizada para la investigación científica. Por último, el proyecto CARMEN-I del Hospital Clínic Barcelona consiste en la digitalización de historiales clínicos para crear una base de datos anonimizada de salud de acceso público, con el objetivo de promover el desarrollo tecnológico y las aplicaciones de IA en salud.
Modelos De Inteligencia Artificial Abiertos
El futuro de la IA abierta en salud se muestra prometedor, ya que empresas como Google, OpenAI y Meta están impulsando la innovación y el avance de la IA. Meta ha utilizado el código abierto para su modelo de lenguaje 'LLaMA', lo que ha facilitado la colaboración y la creación de innovaciones por parte de la comunidad global de desarrolladores. Esta estrategia ha sido exitosa al cubrir necesidades clínicas y fomentar un enfoque colaborativo. Además, las tecnologías de IA abierta permiten reentrenar modelos en entornos seguros utilizando open data sanitario, lo que mejora la calidad de las predicciones, promueve la transparencia y la equidad en la atención médica, y garantiza la seguridad de la información médica sensible. Estas aplicaciones de IA abierta en salud ofrecen un potencial significativo para diagnósticos precisos, tratamientos personalizados y predicciones clínicas, al tiempo que aseguran un acceso equitativo a la salud [6].
ÁREA DE BIG DATA, PMC
El Área de Big Data de la Plataforma de Medicina Computacional busca facilitar el uso de datos de salud de la Consejería de Salud y Familias a través de una infraestructura humana y tecnológica en procesamiento de datos masivos e IA. Su objetivo es aplicar estos datos en la investigación, desarrollo e innovación en salud, así como en la práctica clínica y gestión. Para lograrlo, se emplea una filosofía de colaboración abierta distribuida basada en cinco principios: seguridad, integración, operatividad, colaboración y conocimiento.
ODACI, UNA INICIATIVA DE OPEN DATA ANDALUZ
ODACI es un repositorio abierto de datos de unidades de cuidados intensivos andaluzas que se lanzará en 2023 para mejorar el conocimiento sobre pacientes andaluces en UCIs. Su objetivo es mejorar el diagnóstico y tratamiento de estos pacientes. ODACI se rige por los principios FAIR, que garantizan el uso responsable de los datos abiertos en salud. A través de una apertura gradual a la comunidad científica y medidas estrictas de protección de datos, esta base de datos clínica se alinea con otras iniciativas de datos abiertos similares a nivel nacional e internacional, que han mejorado la atención médica mediante la aplicación de herramientas de Big Data e IA para la toma de decisiones clínicas.
Praetoria
PRAETORIA (PlatafoRma Andaluza de dEsarrollo de sisTemas de sOpoRte decIsión clínicA) es una plataforma innovadora y necesaria que busca mejorar la calidad de atención, la eficiencia en el uso de recursos y la reducción de costos en el Sistema Sanitario Público Andaluz. Esta iniciativa utiliza algoritmos y modelos computacionales para proporcionar información precisa y actualizada a los profesionales de la salud, facilitando así la toma de decisiones informadas en el diagnóstico, tratamiento y seguimiento de los pacientes. Además, se basa en la Base Poblacional de Salud (BPS), un sistema de información que conecta datos de múltiples registros sanitarios en Andalucía [7]. Esta conexión de datos permite aprovechar la información para diferentes propósitos y fortalece la capacidad de mejorar la atención médica y el bienestar de la población andaluza. PRAETORIA se beneficia del ecosistema favorable de Andalucía, gracias a Diraya, una historia clínica electrónica propia e interoperable que almacena información de numerosos hospitales y centros de atención primaria. El enfoque open y transparente de PRAETORIA impulsa la investigación y el desarrollo en el campo de la medicina, posicionando a Andalucía como líder en el uso de datos para la salud.
Evias
EVIAS (Evaluación y Validación de Inteligencia Artificial Sanitarias) es un servicio implementado en Andalucía para abordar los desafíos planteados por las tecnologías de salud digital y la IA. En colaboración con la Agencia de Evaluación de Tecnologías Sanitarias de Andalucía (AETSA) y la Oficina de Transferencia de Tecnologías del Sistema Sanitario Público de Andalucía (OTT-SSPA), EVIAS tiene como objetivo evaluar y validar algoritmos de IA en el ámbito sanitario. Este servicio busca proteger la seguridad del paciente y garantizar la eficacia y seguridad de los algoritmos en la práctica clínica. Además, EVIAS se rige por regulaciones de privacidad y protección de datos, implementando medidas tecnológicas y organizativas para salvaguardar la integridad de los datos sensibles. Siguiendo un protocolo híbrido que combina criterios de evaluación de tecnologías sanitarias y validación basada en la ciencia de datos, EVIAS se esfuerza por desarrollar nuevos procedimientos y metodologías que impulsen la adopción sostenible de tecnologías innovadoras en el sistema sanitario andaluz, mejorando así la calidad de la atención y los resultados para los pacientes.
Bibliograf A
[1] R. Beckers, Z. Kwade, y F. Zanca, «The EU medical device regulation: Implications for artificial intelligence-based medical device software in medical physics», Phys. Med., vol. 83, pp. 1-8, mar. 2021, doi: 10.1016/j. ejmp.2021.02.011.
[2] M. D. Wilkinson et al., «The FAIR Guiding Principles for scientific data management and stewardship», Sci. Data, vol. 3, n.o 1, Art. n.o 1, mar. 2016, doi: 10.1038/sdata.2016.18.
[3] «Worldwide study of ICU data to provide insight into best COVID-19 treatments». https://www.news-medical.net/news/20200513/Worldwide-study-of-ICU-data-to-provide-insight-into-best-COVID-19-treatments. aspx (accedido 24 de mayo de 2023).
[4] S. Romero-Brufau et al., «Using machine learning to improve the accuracy of patient deterioration predictions: Mayo Clinic Early Warning Score (MC-EWS)», J. Am. Med. Inform. Assoc., vol. 28, n.o 6, pp. 1207-1215, jun. 2021, doi: 10.1093/jamia/ocaa347.
[5] T. Manders, «Deep Prognosis: Predicting Mortality in the ICU», Medium, 19 de octubre de 2019. https:// towardsdatascience.com/icu-mortality-5d0e80539b9e (accedido 24 de mayo de 2023).
[6] «ChatGPT no importa: Google afirma en un informe filtrado que su gran rival en la IA es otro, y que OpenAI tiene el mismo problema». https://www.genbeta.com/ actualidad/chatgpt-no-importa-google-afirma-informe-filtrado-que-su-gran-rival-ia-otro-que-openai-tiene-problema (accedido 24 de mayo de 2023).
[7] D. Muñoyerro-Muñiz et al., «Conexión de registros sanitarios: base poblacional de salud de Andalucía», Gac. Sanit., vol. 34, n.o 2, pp. 105-113, abr. 2020, doi: 10.1016/j. gaceta.2019.03.003.