17 minute read
Interoperabilidad semántica y federación de datos como habilitadores del uso del Big Data y la Inteligencia Artificial en el ámbito de la Salud
2.
3.
Advertisement
4.
La digitalización de la medicina promete grandes avances para la salud global. Los registros médicos electrónicos, las aplicaciones de salud móvil, las imágenes médicas, la secuenciación genómica de bajo coste, así como los nuevos sensores y dispositivos portátiles, proporcionan un flujo cada vez mayor de datos digitales de salud.
Combinados con la inteligencia artificial y el análisis de big data , esta gran cantidad de datos tiene un enorme potencial para la atención médica y puede mejorar la vida de millones de pacientes en todo el mundo, mediante un mejor diagnóstico, tratamientos personalizados y la prevención temprana de enfermedades . Para ello es fundamental el uso de los datos de salud más allá de su aplicación asistencial, el denominado uso secundario para investigación, ya que se han convertido en un componente fundamental para la investigación biomédica. La investigación basada en datos de salud permite a los científicos y médicos identificar patrones, tendencias y factores de riesgo que de otra manera podrían pasar desapercibidos. Al analizar grandes conjuntos de datos de diferentes pacientes, se pueden descubrir correlaciones y asociaciones que ayuden a comprender mejor las enfermedades, identificar biomarcadores y desarrollar métodos de detección temprana. Estos hallazgos pueden conducir a tratamientos más efectivos, protocolos de atención personalizados y estra- tegias de prevención más precisas así como la evaluación de la efectividad de intervenciones médicas y del seguimiento de terapias.
Sin embargo, en la actualidad, la mayoría de estos datos se encuentran almacenados en bases de datos aisladas, en sistemas incompatibles y de software propietario, lo cual dificulta su intercambio, análisis e interpretación.
Esta falta de interoperabilidad, entendida como la capacidad de los diferentes sistemas y aplicaciones de salud para comunicarse y compartir información de manera efectiva y comprensible , ralentiza ese esperado avance, ya que las tecnologías que dependen de estos datos, como las mencionadas inteligencia artificial o el big data, no pueden ser aprovechadas en su máximo potencial. La interoperabilidad es por tanto un requisito fundamental para las innovaciones digitales previstas en el futuro de la medicina personalizada de precisión.
Más allá de las barreras técnicas que resultan del uso de sistemas y formatos diferentes para almacenar y gestionar la información, existen otras barreras como diferencias en las normas y los procesos internos de cada institución o las diferentes culturas y enfoques hacia la recopilación, el uso y la compartición de datos. En general existe una preocupación en relación con el uso justo y la seguridad por parte de los responsables de los datos. Dicha preocupación se añade a las relacionada con la privacidad y la confidencialidad de los datos tanto por parte de la ciudadanía como por parte de los responsables políticos y se plasma en las estrictas aunque necesarias leyes de privacidad de datos y los acuerdos de protección de datos institucionales que contribuyen a la creación de silos de datos. Es necesario por tanto fomentar una cultura de colaboración y confian- za, así como promover la conciencia sobre los beneficios del intercambio de datos así como establecer protocolos claros y robustos para garantizar que se cumplan los requisitos éticos y legales al compartir estos datos. Para contribuir a ello se están proponiendo soluciones tecnológicas, como el uso de aprendizaje federado o la generación de datos sintéticos, que deberían facilitar el uso de datos de salud a nivel europeo.
En este artículo, exploraremos cómo estos elementos, junto con el acceso federado a los datos, sirven como habilitadores fundamentales para la aplicación de soluciones de la inteligencia artificial (IA) y big data en el ámbito de la salud.
Outline
• Datos FAIR
• ¿Por qué? ¿Qué beneficios ofrece?
• Potencial del uso de la Inteligencia Artificial en Salud
• Retos
• Interoperabilidad semántica en Salud: un lenguaje común para compartir datos
• FHIR, OpenEHR, OMOP
• Privacidad y seguridad del dato
• Federación de datos
• Apredizaje federado
• Datos sintéticos
• El Espacio Europeo de Datos de Salud: impulsando la colaboración de datos.
Introducci N
En los últimos años, el potencial de la inteligencia artificial (IA) y el big data para revolucionar la atención médica se ha vuelto cada vez más evidente. Estas tecnologías de vanguardia tienen un enorme potencial en áreas como el diagnóstico basado en imágenes, la genómica, la medicina personalizada y la telemedicina han demostrado posibles aplicaciones en varios dominios de la medicina, incluidos algoritmos para interpretar radiografías de tórax, detectar cáncer en mamografías, predecir el desarrollo de la enfermedad de Alzheimer a partir de la tomografía por emisión de positrones o identificar lesiones cutáneas cancerosas. Varias compañías están desarrollando plataformas que aprovechan la IA como un medio para identificar variantes genéticas en las raíces de enfermedades raras, o incluso para identificar condiciones genéticas en función de los rasgos faciales del paciente y cada vez hay más noticias sobre el avance en los modelos de lenguaje (LLM, por sus siglas en inglés), como es el caso del conocido ChatGPT o el recientemente presentado MedPalm-2.
Uno de los factores que ha permitido el rápido desarrollo de la inteligencia artificial en los últimos años ha sido la disponibilidad de gran - des conjuntos de datos, textos o imágenes accesibles a través de Internet. Estos conjuntos de datos masivos han permitido entrenar y mejorar los algoritmos de aprendizaje automático, especialmente aquellos basados en el aprendizaje profundo o "deep learning", que han demostrado ser muy efectivos en multitud de aplicaciones, pero también han fomentado el desarrollo de comunidades y el intercambio de conocimientos, facilitado la colaboración entre investigadores, científicos de datos y desarrolladores, acelerando aún más el progreso en el campo.
En el campo de la salud, la disponibilidad de grandes volúmenes de datos para la investigación secundaria presenta desafíos significativos debido a la necesidad de integración de conjuntos de datos heterogéneos. Estos desafíos incluyen: la diversidad de tipos de datos; la distribución geográfica de los centros de datos, que se encuentran en diferentes instituciones y jurisdicciones nacionales y regionales; la existencia de diversos estándares de codificación y almacenamiento; los distintos modelos de gobernanza que rigen el acceso a los datos; la variabilidad en los niveles de detalle, que van desde estudios a gran escala hasta datos de pacientes individuales; y por último, la calidad variable del contenido de los datos, incluyendo la anotación y la estructuración de los mismos. Esta fragmentación y variabilidad dificultan la explotación eficiente de los datos por parte de los investigadores y el desarrollo de soluciones eficaces. (Capella-Gutiérrez S., 2021).
DATOS FAIR: IMPULSANDO LA INNOVACIÓN Y LA COLABORACIÓN
Los beneficios de estratégia de datos abiertos , es decir, la puesta a a disposición en las condiciones adecuadas, de una comunidad más amplia de interesados, incluidos investigadores, desarrolladores de herramientas y responsables de políticas; de datos de pacientes anonimizados, hallazgos de investigación y otra información relevante son múltiples. Permiten a los investigadores basarse en el conocimiento y los conjuntos de datos existentes, acelerando el ritmo de los descu - brimientos y avances. Facilitan el desarrollo de algoritmos y modelos de IA que pueden aprender de diversas poblaciones de pacientes, lo que lleva a intervenciones de atención médica más precisas y personalizadas. Además, los datos abiertos fomentan la colaboración entre instituciones y permiten iniciativas de investigación transfronteriza, mejorando el impacto global de las innovaciones en atención médica.
Pero no basta solo con producir y compartir estos datos, éstos deben cumplir un conjunto de principios para su digitalización, reproducibilidad y reciclaje. Los principios FAIR (Findable, Accesible, Interoperable and Reusable por sus siglas en inglés) buscan lograr conjuntos de datos localizables, accesibles, interoperables y reutilizables, así como la eliminación de barreras organizativas, culturales y técnicas en su acceso y utilización. Se debe definir cómo se localizan inequívocamente los datos y los metadatos asociados, establecer los protocolos neceasarios que permitan acceder a los datos y metadatos, favorecer el uso de ontologías conocidas y vocabularios controlados para describir los datos y metadatos y asegurar las correspondientes licencias de uso así como la disponibilidad de documentación sobre los datos y los formatos asociados a los mismos.
La adopción gradual de estos principios en el ámbito de la investigación en salud puede contribuir a un mejor uso de los recursos al evitar la replicación de investigaciones con resultados negativos, favorece la reutilización de datos y la generalización de los resultados mediante la combinación de los mismos. Proyectos como FAIR4Health, liderados desde el Servicio de Salud, o la publicación de extensiones a los principios FAIR focalizados en el uso de datos de salud (Holub et al, 2018 ) son ejemplos claros de los beneficios de la adopción de estos principios y su impacto en la activdad investigadora.
INTEROPERABILIDAD SEMÁNTICA: UN LENGUAJE COMÚN PARA COMPARTIR DATOS
Cuando el COVID-19 golpeó Europa en marzo de 2020, los hospitales se vieron sumidos en una crisis de salud que todavía se entendía mal. Los médicos no sabían realmente cómo tratar a estos pacientes. La comunidad de investigadores se apresuró a desarrollar metodologías y software que muchos creían que permitirían a los hospitales diagnosticar o clasificar a los pacientes más rápidamente, brindando el apoyo que tanto necesitan a los profesionales que luchaban contra la enfermedad en primera línea. Se crearon cientos de herramientas de inteligencia artificial y se publicaron multitud de artículos durante esos dos años describiendo nuevos modelos basados en el aprendizaje automático para tratar el COVID-19. Estos modelos de predicción se podían dividir en tres categorías: modelos sobre la población general para predecir el riesgo de padecer COVID-19 o ser hospitalizado por COVID-19; modelos para mejorar el diagnóstico de COVID-19 en pacientes con sospecha de infección; y modelos para apoyar el pronóstico de pacientes con COVID-19. Todos los modelos informaron un rendimiento predictivo de moderado a excelente en la fase de investigación, y sin embargo, una exhaustiva revisión de un gran numero de estudios concluyó que ninguno de ellos era apto para uso clínico. (Wynants et al 2020, Roberts etal. 2021). Ambos equipos encontraron que los investigadores repitieron los mismos errores básicos en la forma en que entrenaron o probaron sus herramientas. Muchos de los problemas que se descubrieron estaban relacionados con la mala calidad de los datos que los investigadores utilizaron para desarrollar sus herramientas.
Obtener datos de calidad actualizados hubiera sido más fácil si los formatos utilizados en los distintos hospitales estuvieran estandarizados. Imaginemos un escenario en el que los proveedores de atención médica, los investigadores y las organizaciones puedan compartir y analizar datos de diversas fuentes de manera fluida, sin importar los sistemas y formatos en los que se almacenen los datos. La interoperabilidad semántica es la clave para desbloquear este potencial. Implica el uso de modelos de datos comunes y terminologías estandarizadas que permiten que los datos de fuentes dispares se comprendan, integren y analicen de manera significativa.
Un ejemplo de ello es el Modelo Común de Datos (CDM por sus siglas en inglés) de la Observational Medical Outcomes Partnership (OMOP), adoptado y distribuido por la red de investigación de Observational Health Data Sciences and Informatics (OHDSI), que proporciona un marco estandarizado para organizar y armonizar datos de atención médica de diversos sistemas de registros electrónicos de salud. Al adoptar un modelo de datos común como OMOP, los investigadores y los médicos pueden combinar y analizar datos de múltiples fuentes, lo que conduce a conocimientos más sólidos y confiables.
Estos datos, analizados adecuadamente, tienen un enorme potencial para generar evidencia realmente relevante y, lo que es más importante, lo suficientemente utilizable como para incorporarse en la práctica clínica.
Este enfoque estandarizado permitió que los centros integrados en el modelo OMOP CDM pudieran ejecutar el mismo código analítico de manera distribuida o federada, donde cada hospital ejecutaba los análisis por separado internamente y devolvía un conjunto de datos de resultados sin compartir datos a nivel de paciente.
Un primer estudio usando este enfoque tuvo como objetivo describir las características de los pacientes hospitalizados con COVID-19 (Burn et al., 2020). Un segundo estudio para investigar el uso de fármacos adyuvantes y reutilizados en pacientes ingresados por COVID-19 se pudo realizar en menos de tres semanas con datos de más de 300.000 pacientes en tres continentes (Prats-Uribe et al., 2021).
El éxito del enfoque de un modelo común de OHDSI y OMOP llevó a la creación de la Red Europea de Datos y Evidencia Sanitarios (EHDEN).
El objetivo de la red es la estandarización a gran escala de las metodologías de investigación sobre datos del mundo real, armonizando más de 100 millones de registros sanitarios para 2024 para convertirse en el ecosistema de investigación observacional de referencia en Europa.
El futuro de la medicina basada en la evidencia del mundo real requiere del uso de modelos de datos comunes para agilizar el análisis de los re- gistros médicos electrónicos (EHR por sus siglas en inglés) casi en tiempo real, así como de herramientas de código abierto para su análisis. Dada la heterogeneidad de los sistemas de manejo de datos clínicos, el objetivo primordial debe ser garantizar la interoperabilidad de estos datos, entendida como la posibilidad de usar datos de la misma naturaleza provenientes de distintas fuentes, así como la posibilidad de combinar datos de distinta naturaleza gracias al manejo de ontologías y vocabularios controlados.
ACCESO FEDERADO A DATOS: EQUILIBRANDO LA PRIVACIDAD Y LA UTILIZACIÓN DE DATOS
Como hemos visto, la disponibilidad de datos abiertos es crucial, pero es igualmente importante proteger la privacidad de los pacientes y cumplir con las regulaciones legales y éticas.
Aquí es donde entra en juego el acceso federado a los datos. En lugar de centralizar todos los datos en un solo lugar, el acceso federado a los datos permite el almacenamiento distribuido de los datos al tiempo que permite compartir de manera segura y controlada entre múltiples entidades.
En un modelo de acceso federado a los datos, los datos permanecen dentro de las organizaciones que los generan o almacenan. En lugar de transferir los datos a un repositorio centralizado, los algoritmos y los procesos analíticos se envían a las fuentes de datos. Generalmente, es necesario contar con entornos de investigación de confianza (TRE por sus siglas en inglés para Trusted Research Environment). Estos entornos suelen basarse en 5 principios de seguridad que tienen que ver con el acceso autorizado del investigador a determinado conjunto de datos en el contexto de un proyecto de investigación para que pueda realizar determinadas operaciones, y que solo los resultados agregados del mismo puedan ser extraídos de dicho entorno. Existen distintas implementaciones de esta aproximación, pero todas ellas deben seguir estos principios.
Este enfoque minimiza el riesgo de violacio - nes de datos y garantiza el cumplimiento de regulaciones de privacidad, como el Reglamento General de Protección de Datos (GDPR) en Europa.
La escasa cobertura o un diseño deficiente de los datos de entrenamiento de los sistemas de aprendizaje automático puede además reflejar sesgos sociales, con el riesgo de errores en su aplicación a grupos minoritarios, a lo que se suma el riesgo de amplificar los sesgos existentes en los datos históricos. Diversos estudios indican que muchos sistemas de IA afectan desproporcionadamente a grupos que ya están en desventaja por factores como la raza, el género y los antecedentes socioeconómicos. En medicina, los ejemplos incluyen algoritmos de predicción de mortalidad hospitalaria con una precisión variable según el origen étnico y algoritmos que pueden clasificar imágenes de lunares benignos y malignos con una precisión similar a la de los dermatólogos profesionales, pero que fallan con imágenes de lesiones en pacientes con la piel más oscura. La capacidad de detectar y corregir estos sesgos en los datos hace que sea importante confiar en fuentes de datos diferentes y ricas para que la amplitud y la profundidad de los datos expongan las sutilezas correspondientes a cada grupo de pacientes.
Datos Sint Ticos
Otra manera de obtener datos de calidad cumpliendo con el GDPR que sólo permite la explotación de datos reales de salud en entornos de investigación muy específicos y limitados, es el uso de datos sintéticos. Los datos sintéticos son datos artificiales que se generan a partir de datos reales, de modo que se mantienen la distribución estadística y las características de los datos originales, a fin de que puedan ser analizadas para extraer patrones y conclusiones equivalentes a las que los modelos obtendrían con los datos reales. En otras palabras, los datos sintéticos permiten el entrenamiento de modelos de inteligencia artificial, de forma menos intrusiva para la privacidad de los individuos, porque los datos utilizados en el proceso de entrenamiento no se refieren directamente a ninguna persona identificada o identificable. Los datos sintéticos permiten abordar otro elemento clave en el uso de sistemas de inteligencia artificial en medicina como es el de la interpretabilidad de los algoritmos, ya que existe actualmente un compromiso entre el rendimiento de los sistemas y su interpretabilidad que puede resolverse en parte con la disponibilidad de una mayor cantidad de datos de calidad.
Los datos sintéticos pueden crearse mediante modelos de simulación clásica, como el popular SYNTHEA, pero cada vez de manera más frecuente se crean con la ayuda de técnicas de inteligencia artificial generativa como las redes neuronales generativas adversarias (GAN por sus siglas en inglés) y los autoencoders variacionales (VAE por sus siglas en inglés).
EL ESPACIO EUROPEO DE DATOS DE SALUD: IMPULSANDO LA COLABORACIÓN DE DATOS
Reconociendo el potencial transformador de la IA y el big data en la atención médica, la Unión Europea ha dado pasos significativos para establecer un marco de colaboración de datos. El Espacio Europeo de Datos de Salud (EHDS por sus siglas inglés) tiene como objetivo facilitar el acceso seguro y autorizado a los datos de salud en toda la UE, promoviendo la interoperabilidad, la estandarización y el intercambio de datos transfronterizo.
El EHDS sienta las bases para un ecosistema paneuropeo donde los datos de salud pueden compartirse y utilizarse para la investigación, la innovación y la toma de decisiones políticas. Fomenta la colaboración entre los Estados miembros, las organizaciones de investigación, los actores de la industria y los pacientes, enfatizando la importancia de la privacidad, la transparencia y la confianza. Al permitir el acceso transfronterizo a conjuntos de datos diversos, el EHDS allana el camino para descubrimientos innovadores, intervenciones de atención médica personalizadas y mejores resultados para los pacientes.
El Espacio Europeo de Datos de Salud representa tanto una oportunidad para la mejora de la actividad científica gracias al uso intensivo del dato sanitario, como para su traducción a la asistencia sanitaria en todos los niveles: desde la salud pública a la medicina personalizada, de la que es importante destacar su apertura a la participación de la industria, desde la pequeña y mediana empresa proveedora de soluciones específicas hasta las grandes tecnológicas y farmacéuticas, cuya colaboración es necesaria para la implementación y en último término el éxito de este espacio común.
Conclusi N
La inteligencia artificial en medicina se presenta por tanto como una valiosa herramienta para los profesionales del área, al optimizar los procesos de prevención, diagnóstico y tratamiento de enfermedades. Sin embargo, su implementación exitosa dependerá en gran medida de dos factores críticos: la disponibilidad de datos abiertos, la interoperabilidad semántica y disponibilidad de herramientas que permitan el analisis de manera federada.
Comprender y abordar estos desafíos es fundamental si queremos aprovechar al máximo las oportunidades que ofrecen las nuevas tecnologías y que las expectativas del uso de la inteligencia artificial para optimizar la experiencia de la atención médica, mejorar la salud global de la población y reducir los costos de la atención médica se conviertan en una realidad.
Bibliograf A
Will ChatGPT Transform Healthcare? Nature Medicine 2023, 29 (3), 505–506. https://doi.org/10.1038/s41591023-02289-5.
Holly, L.; Thom, S.; Elzemety, M.; Murage, B.; Mathieson, K.; Iñigo Petralanda, M. I. Strengthening Health Data Governance: New Equity and Rights-Based Principles. International Journal of Health Governance 2023. https:// doi.org/10.1108/ijhg-11-2022-0104.
Moor, M.; Banerjee, O.; Abad, Z. S. H.; Krumholz, H. M.; Leskovec, J.; Topol, E. J.; Rajpurkar, P. Foundation Models for Generalist Medical Artificial Intelligence. Nature 2023, 616 (7956), 259–265. https://doi.org/10.1038/s41586023-05881-4.
Arora, A. The Promise of Large Language Models in Health Care. The Lancet 2023, 401 (10377), 641. https:// doi.org/10.1016/s0140-6736(23)00216-7.
Rajpurkar, P.; Chen, E.; Banerjee, O.; Topol, E. J. AI in Health and Medicine. Nature Medicine 2022, 28 (1), 31–38. https://doi.org/10.1038/s41591-021-01614-0.
Lehne, M.; Sass, J.; Essenwanger, A.; Schepers, J.; Thun, S. Why Digital Medicine Depends on Interoperability. npj Digital Medicine 2019, 2 (1). https://doi.org/10.1038/ s41746-019-0158-1.
Agrawal, R.; Prabakaran, S. Big Data in Digital Healthcare: Lessons Learnt and Recommendations for General Practice. Heredity 2020, 124 (4), 525–534. https://doi. org/10.1038/s41437-020-0303-2.
Kelly, C. J.; Karthikesalingam, A.; Suleyman, M.; Corrado, G.; King, D. Key Challenges for Delivering Clinical Impact with Artificial Intelligence. BMC Medicine 2019, 17 (1). https://doi.org/10.1186/s12916-019-1426-2.
Ali, O.; Abdelbaki, W.; Shrestha, A.; Elbasi, E.; Alryalat, M. A. A.; Dwivedi, Y. K. A Systematic Literature Review of Artificial Intelligence in the Healthcare Sector: Benefits, Challenges, Methodologies, and Functionalities. Journal of Innovation & Knowledge 2023, 8 (1), 100333. https://doi.org/10.1016/j.jik.2023.100333.
Rajkomar, A.; Oren, E.; Chen, K.; Dai, A. M.; Hajaj, N.; Hardt, M.; Liu, P. J.; Liu, X.; Marcus, J.; Sun, M.; Sundberg, P.; Yee, H.; Zhang, K.; Zhang, Y.; Flores, G.; Duggan, G. E.; Irvine, J.; Le, Q.; Litsch, K.; Mossin, A.; Tansuwan, J.; Wang, D.; Wexler, J.; Wilson, J.; Ludwig, D.; Volchenboum, S. L.; Chou, K.; Pearson, M.; Madabushi, S.; Shah, N. H.; Butte, A. J.; Howell, M. D.; Cui, C.; Corrado, G. S.; Dean, J. Scalable and Accurate Deep Learning with Electronic Health Records. npj Digital Medicine 2018, 1 (1). https://doi. org/10.1038/s41746-018-0029-1.
Wynants et al. Prediction models for diagnosis and prognosis of covid-19: systematic review and critical appraisal. BMJ 2020 https://doi.org/10.1136/bmj.m1328.
Roberts, M.; Driggs, D.; Thorpe, M.; Gilbey, J.; Yeung, M.; Ursprung, S.; Aviles-Rivero, A. I.; Etmann, C.; McCague, C.; Beer, L.; Weir-McCall, J. R.; Teng, Z.; Gkrania-Klotsas, E.; Ruggiero, A.; Korhonen, A.; Jefferson, E.; Ako, E.; Langs, G.; Gozaliasl, G.; Yang, G.; Prosch, H.; Preller, J.; Stanczuk, J.; Tang, J.; Hofmanninger, J.; Babar, J.; Sánchez, L. E.; Thillai, M.; Gonzalez, P. M.; Teare, P.; Zhu, X.; Patel, M.; Cafolla, C.; Azadbakht, H.; Jacob, J.; Lowe, J.; Zhang, K.; Bradley, K.; Wassin, M.; Holzer, M.; Ji, K.; Ortet, M. D.; Ai, T.; Walton, N.; Lio, P.; Stranks, S.; Shadbahr, T.; Lin, W.; Zha, Y.; Niu, Z.; Rudd, J. H. F.; Sala, E.; Schönlieb, C.-B. Common Pitfalls and Recommendations for Using Machine Learning to Detect and Prognosticate for COVID-19 Using Chest Radiographs and CT Scans. Nature Machine Intelligence 2021, 3 (3), 199–217. https://doi.org/10.1038/ s42256-021-00307-0.
Burn, E.; You, S. C.; Sena, A. G.; Kostka, K.; Abedtash, H.; Abrahão, M. T. F.; Alberga, A.; Alghoul, H.; Alser, O.; Alshammari, T. M.; Aragon, M.; Areia, C.; Banda, J. M.; Cho, J.; Culhane, A. C.; Davydov, A.; DeFalco, F. J.; Duarte-Salles, T.; DuVall, S.; Falconer, T.; Fernandez-Bertolin, S.; Gao,
W.; Golozar, A.; Hardin, J.; Hripcsak, G.; Huser, V.; Jeon, H.; Jing, Y.; Jung, C. Y.; Kaas-Hansen, B. S.; Kaduk, D.; Kent, S.; Kim, Y.; Kolovos, S.; Lane, J. C. E.; Lee, H.; Lynch, K. E.; Makadia, R.; Matheny, M. E.; Mehta, P. P.; Morales, D. R.; Natarajan, K.; Nyberg, F.; Ostropolets, A.; Park, R. W.; Park, J.; Posada, J. D.; Prats-Uribe, A.; Rao, G.; Reich, C.; Rho, Y.; Rijnbeek, P.; Schilling, L. M.; Schuemie, M.; Shah, N. H.; Shoaibi, A.; Song, S.; Spotnitz, M.; Suchard, M. A.; Swerdel, J. N.; Vizcaya, D.; Volpe, S.; Wen, H.; Williams, A. E.; Yimer, B. B.; Zhang, L.; Zhuk, O.; Prieto-Alhambra, D.; Ryan, P. Deep Phenotyping of 34,128 Adult Patients Hospitalised with COVID-19 in an International Network Study. Nature Communications 2020, 11 (1). https://doi. org/10.1038/s41467-020-18849-z.
Prats-Uribe A, Sena A G, Lai L Y H, Ahmed W, Alghoul H, Alser O et al. Use of repurposed and adjuvant drugs in hospital patients with covid-19: multinational network cohort study BMJ 2021; 373 :n1038 doi:10.1136/bmj.n1038
Wilkinson, M. D.; Dumontier, M.; Aalbersberg, Ij. J.; Appleton, G.; Axton, M.; Baak, A.; Blomberg, N.; Boiten, J.-W.; da Silva Santos, L. B.; Bourne, P. E.; Bouwman, J.; Brookes, A. J.; Clark, T.; Crosas, M.; Dillo, I.; Dumon, O.; Edmunds, S.; Evelo, C. T.; Finkers, R.; Gonzalez-Beltran, A.; Gray, A. J. G.; Groth, P.; Goble, C.; Grethe, J. S.; Heringa, J.; ’t Hoen, P. A. C.; Hooft, R.; Kuhn, T.; Kok, R.; Kok, J.; Lusher, S. J.; Martone, M. E.; Mons, A.; Packer, A. L.; Persson, B.; Rocca-Serra, P.; Roos, M.; van Schaik, R.; Sansone, S.-A.; Schultes, E.; Sengstag, T.; Slater, T.; Strawn, G.; Swertz, M. A.; Thompson, M.; van der Lei, J.; van Mulligen, E.; Velterop, J.; Waagmeester, A.; Wittenburg, P.; Wolstencroft, K.; Zhao, J.; Mons, B. The FAIR Guiding Principles for Scientific Data Management and Stewardship. Scientific Data 2016, 3 (1). https://doi.org/10.1038/sdata.2016.18.
Walonoski, J.; Kramer, M.; Nichols, J.; Quina, A.; Moesel, C.; Hall, D.; Duffett, C.; Dube, K.; Gallagher, T.; McLachlan, S. Synthea: An Approach, Method, and Software Mechanism for Generating Synthetic Patients and the Synthetic Electronic Health Care Record. Journal of the American Medical Informatics Association 2017, 25 (3), 230–238. https://doi.org/10.1093/jamia/ocx079.
Salvador Capella-Gutiérrez, Enrique Bernal-Delgado, Sandra García-Armesto, Alba Jene, Arcadi Navarro, Carlos Luis Parra-Calderón, Jordi Rambla, Alfonso Valencia, Juan González-García. Bases de la Estrategia Europea para la Explotación Masiva y Distribuida de Datos en Salud. Revista I+S 143 (Febrero 2021)
Petr Holub, Florian Kohlmayer, Fabian Prasser, Michaela Th. Mayrhofer, Irene Schlünder, Gillian M. Martin, Sara Casati, Lefteris Koumakis, Andrea Wutte, Łukasz Kozera, Dominik Strapagiel, Gabriele Anton, Gianluigi Zanetti, Osman Ugur Sezerman, Maimuna Mendy, Dalibor Valík, Marialuisa Lavitrano, Georges Dagher, Kurt Zatloukal, GertJan B. van Ommen, and Jan-Eric Litton Enhancing Reuse of Data and Biological Material in Medical Research: From FAIR to FAIR-Health Biopreservation and Biobanking.Apr 2018.97-105. http://doi.org/10.1089/ bio.2017.0110.