7 minute read
Pangenoma Humano: hacia una nueva era del diagnóstico genético
Científicos financiados por el Instituto Nacional de Investigación del Genoma Humano (NHGRI) lanzaron una colección completa y mejorada de secuencias genómicas que captura significativamente más diversidad humana.La secuenciación del ADN de 47 personas de orígenes diversos dio luz al primer pangenoma humano, es decir, a la compilación de muestras de ADN distintas que servirán a partir de ahora de referencia para una investigación científica que tenga en cuenta la diversidad de la humanidad. Se espera que estos hallazgos permitan comprender mejor los vínculos entre la genética y varias enfermedades, como el cáncer.
El trabajo fue dirigido por el Consorcio Internacional de Referencia del Pangenoma Humano, un grupo financiado por el Instituto Nacional de Investigación del Genoma Humano (NHGRI), parte de los Institutos Nacionales de Salud.
Advertisement
La nueva referencia “pangenoma” incluye secuencias del genoma de 47 personas, y los investigadores persiguen el objetivo de aumentar ese número a 350 para mediados de 2024. Dado que cada persona porta un par de cromosomas, la referencia actual en realidad incluye 94 secuencias genómicas distintas, con el objetivo de llegar a 700 secuencias genómicas distintas para la finalización del proyecto.
El trabajo, que aparece en la revista Nature , es uno de varios artículos publicados por los miembros del consorcio.
Un genoma es el conjunto de instrucciones de ADN que ayuda a cada ser vivo a desarrollarse y funcionar. Las secuencias del genoma difieren ligeramente entre los individuos. En el caso de los humanos, los genomas de dos personas son, en promedio, más del 99% idénticos. Las pequeñas diferencias contribuyen a la singularidad de cada persona y pueden brindar información sobre su salud, ayudar a detectar enfermedades, predecir resultados y guiar tratamientos médicos.
Todo el mundo tiene un genoma único, por lo que utilizar una única secuencia genómica de referencia para cada persona puede generar inequidades en los análisis genómicos. Por ejemplo, predecir una enfermedad genética podría no funcionar tan bien para alguien cuyo genoma es más diferente del genoma de referencia.
Para comprender estas diferencias genómicas, los científicos crean secuencias del genoma humano de referencia para usarlas como “estándar”: una fusión digital de secuencias del genoma humano que se puede usar como comparación para alinear, ensamblar y estudiar otras secuencias del genoma humano.
La secuencia del genoma humano de referencia original tiene casi 20 años y se ha actualizado periódicamente a medida que avanza la tecnología y los investigadores corrigen errores y descubren más regiones del genoma humano. Sin embargo, está demasiado limitada en su representación de la diversidad de la especie humana, ya que consta de genomas de solo unas 20 personas, y la mayor parte de la secuencia de referencia es de una sola persona.
“Todo el mundo tiene un genoma único, por lo que el uso de una única secuencia genómica de referencia para cada persona puede generar inequidades en los análisis genómicos”, dijo Adam Phillippy, Ph.D., investigador principal en la Rama de Genómica Computacional y dentro Estadística del Programa de Investigación Intramural del NHGRI y coautor del estudio principal. “Por ejemplo, predecir una enfermedad genética podría no funcionar tan bien para alguien cuyo genoma es más diferente del genoma de referencia”.
La nueva referencia “ pangenoma “ incluye secuencias del genoma de 47 personas, y los investigadores persiguen el objetivo de aumentar ese número a 350 para mediados de 2024.
Las pequeñas diferencias contribuyen a la singularidad de cada persona y pueden brindar información sobre su salud, ayudar a detectar enfermedades, predecir resultados y guiar tratamientos médicos.
La secuencia del genoma humano de referencia actual tiene lagunas que reflejan información faltante, especialmente en áreas que eran repetitivas y difíciles de leer.
Los avances tecnológicos secuenciales recientes, como la secuenciación de ADN de lectura larga, que lee tramos más largos del ADN a la vez, ayudaron a los investigadores a llenar esos vacíos para crear la primera completa del genoma humano .Esta secuencia completa del genoma humano, publicada el año pasado como parte del consorcio Telómero a telómero (T2T) financiado por NIH, se incorpora a la referencia pangenoma actual. De hecho, muchos de los investigadores de T2T también son miembros del Consorcio de Referencia del Pangenoma Humano.
Usando técnicas computacionales avanzadas para alinear las diversas secuencias del genoma, los investigadores construyeron una nueva referencia de pangenoma humano con cada ensamblaje en el pangenoma cubriendo más del 99% de la secuencia esperada con más del 99% de precisión. También se basa en la secuencia del genoma de referencia anterior, agregando más de 100 millones de nuevas bases o “letras” en el ADN. Mientras que la secuencia del genoma de referencia anterior era única y lineal, el nuevo pangenoma representa muchas versiones diferentes de la secuencia del genoma humano al mismo tiempo. Esto brinda a los investigadores una gama más amplia de opciones para usar el pangenoma en el análisis de otras secuencias del genoma humano.
“Al usar la referencia del pangenoma, podemos identificar con mayor precisión variantes genómicas más grandes llamadas variantes estructurales”, dijo Mobin Asri, Ph.D. estudiante de la Universidad de California Santa Cruz y co-primera autora del artículo. “Podemos encontrar variantes que no se identificaron con métodos anteriores que dependen de secuencias de referencia lineales”.
Las variantes estructurales pueden involucrar miles de bases. Hasta ahora, los investigadores no han podido identificar la mayoría de las variantes estructurales que existen en cada genoma humano usando secuenciación de lectura corta debido al sesgo de usar una sola secuencia de referencia.
“La referencia del genoma humano del pangenoma nos permitirá representar decenas de millas de variantes genómicas novedosas en regiones del que antes eran inaccesibles”, dijo Wen-Wei Liao, Ph.D. estudiante de la Universidad de Washington en St. Louis, afiliado de investigación de la Universidad de Yale y coautor del artículo. “Con una referencia de pangenoma, podemos acelerar la investigación clínica al mejorar nuestra comprensión del vínculo entre los genes y los rasgos de la enfermedad”. El aporte crucial del nuevo pangenoma podría ser mejores formas de diagnosticar enfermedades raras, aunque las aplicaciones prácticas no son fáciles de nombrar. Por otra parte, los científicos dicen que principalmente les está dando una idea de parte de la “materia oscura” del genoma que antes era difícil de ver, incluidas regiones extrañas de cromosomas que parecen compartir e intercambiar genes.
Se proyecta que el costo total de apoyar el trabajo del Consorcio de Referencia del Pangenoma Humano sea de aproximadamente $40 millones durante cinco años, lo que incluye esfuerzos para crear la referencia del pangenoma humano, mejorar la tecnología de secuenciación del ADN, operar un centro de coordinación, llevar a cabo actividades de divulgación y crear recursos para la comunidad de investigación para utilizar la referencia del pangenoma.
Muchos de los individuos cuyos genomas fueron secuenciados para construir la nueva referencia del pangenoma humano fueron reclutados originalmente como parte del Proyecto 1000 Genomas, un esfuerzo colaborativo e internacional financiado en parte por NIH que tenía como objetivo mejorar el catálogo de variantes genómicas en diversas poblaciones. Debido a que la referencia del pangenoma humano es un trabajo en progreso, los investigadores del Consorcio internacional de referencia del pangenoma humano obtendrán agregando más secuencias genómicas para mejorar cada vez más la calidad de la referencia del pangenoma.
La secuencia del genoma humano de referencia original tiene casi 20 años y se ha actualizado periódicamente a medida que avanza la tecnología y los investigadores corrigen errores y descubren más regiones del genoma humano.
El mapa del pangenoma es diferente a la secuencia lineal que existía hasta la fecha. La investigación arroja algo que el grupo de investigadores describe como un “mapa de líneas de metro”, donde no hay un único camino marcado, sino que se reconocen las variantes que pueden existir en cada genoma humano: algunas partes se repiten, otras desaparecen, otras ocupan un lugar levemente distinto o incluso se invierten.
“Los investigadores básicos y los médicos que utilizan la genómica necesitan acceder a una secuencia de referencia que refleja la notable diversidad de la población humana. Esto ayudará a que la referencia sea útil para todas las personas, lo que ayudará a reducir las posibilidades de propagar las disparidades en la salud”, dijo Eric Green, MD, Ph.D., director del NHGRI. “La creación y mejora de una referencia del pangenoma humano se alinea con el objetivo del NHGRI de luchar por la diversidad global en todos los aspectos de la investigación genómica, que es crucial para avanzar en el conocimiento genómico e implementar la medicina genómica de manera equitativa ”.
En línea con este esfuerzo, el Consorcio de Referencia del Pangenoma Humano incluye un grupo de ética integrado que está trabajando para anticipar desafíos y ayudar a guiar el consentimiento informado, priorizar el estudio de diferentes muestras, explorar posibles problemas regulatorios relacionados con la adopción clínica y trabajar con expertos internacionales y Comunidades indígenas a incorporar sus secuencias genómicas en estos esfuerzos más amplios.
Las instituciones involucradas en el Consorcio de Referencia del Pangenoma Humano se pueden encontrar en la página principal del proyecto .
El aporte crucial del nuevo pangenoma podría ser mejores formas de diagnosticar enfermedades raras, aunque las aplicaciones prácticas no son fáciles de nombrar.
Gráfico del pangenoma
La nueva referencia de pangenoma es una colección de diferentes genomas a partir de los cuales comparar una secuencia de genoma individual. Al igual que un mapa del sistema de metro, el gráfico del pangenoma tiene muchas rutas posibles para que tome una secuencia, representadas por los diferentes colores.
Los caminos de desvío en la parte superior de la imagen representan variantes de un solo nucleótido (SNV), que son diferencias de una sola letra. El camino amarillo que gira alrededor de sí mismo y repite los mismos nucleótidos representa una variante de duplicación. El camino rosa que gira en sentido contrario a las agujas del reloj y sigue la secuencia de nucleótidos hacia atrás representa una variante de inversión. En la parte inferior, los caminos verde y azul oscuro pierden el nucleótido C en su ruta y representan una variante de eliminación. La ruta azul claro, que tiene nucleótidos adicionales en su ruta, representa una variante de inserción. Crédito: Darryl Leja, NHGRI.
¿Cuándo se secuenció el primer genoma humano?
Secuenciar el primer genoma humano fue una tarea titánica que tardó más de 20 años en realizarse y que no se completó del todo hasta el año pasado. Durante este tiempo, ese genoma fue la única referencia para que médicos y científicos desarrollaran sus investigaciones alrededor de la salud. Esa secuencia de ADN pertenece, en un 70%, a una persona blanca. El resto, lo completa el material genético de 19 individuos más, la inmensa mayoría también de ascendencia europea. Durante años, voces de la comunidad científica han criticado que esa falta de diversidad puede sesgar las investigaciones y la ciencia.
Hasta ahora, el genoma de referencia estaba hecho principalmente con ADN de una persona blanca. © Nature
La secuencia de referencia original tiene casi 20 años y se ha actualizado regularmente a medida que avanza la tecnología y los investigadores corrigen errores y descubren más regiones. Sin embargo, tiene limitaciones en su representación de la diversidad de la especie humana, ya que consta de genomas de solo unas 20 personas, y la mayor parte de la secuencia de referencia es de un solo individuo*