9 minute read
blanco y amarillo del Noroeste y Bajío de México
proporciona una gran cantidad de información para los mejoradores. Cuando éstos son razonablemente informativos pueden ayudar a seleccionar genotipos con rasgos de importancia agronómica. Adicionalmente, permite utilizar otras técnicas de mejoramiento como la Selección Asistida por Marcadores (MAS por sus siglas en inglés) o Análisis de Asociación Genómica, para determinar que marcadores están asociados significativamente con rasgos de importancia económica, tales como alto rendimiento, elevado contenido de aceite y de proteína en grano. Esta información es muy util para el mejorador, quien puede utilizarla para seleccionar los genotipos que tengan los rasgos deseados para la producción de cruzas por un menor costo y en un menor tiempo en comparación con esquemas de mejoramiento convencional. Además le permite realizar predicciones de las cruzas a realizar entre los genotipos más contrastantes genéticamente, buscando producir semilla en un menor tiempo, a menor precio y con mayor valor nutricional.
8.2 Objetivo 2. Obtener la estructura genética de las poblaciones de maíz blanco y amarillo del Noroeste y Bajío de México.
Advertisement
Los resultados de STRUCTURE permitieron separar a las líneas por su grado de heterocigosidad, separando a las líneas parentales de las cruzas y mestizos. Aunque estas líneas parentales pertenecen a dos regiones de adaptación ambiental contrastantes (el Bajío y el Noroeste de México), y con color del grano distinto (blanco y amarillo), los resultados del Structure no mostraron ninguna subagrupación ni por el ambiente de adaptación ni por su color de grano.
En el análisis de estructura poblacional de Wu et al. (2016) se definen claramente tres poblaciones, separando a las 538 CMLs según su zona de adaptación, teniendo como tal CMLs tropicales de tierras bajas, subtropicales de tierras medias, y tropicales de tierras altas, con un valor de poblaciones más probables igual a 3 (K = 3). A diferencia de este trabajo, no tenemos esa separación de los individuos por su región de origen, posiblemente se deba a los tipos de líneas analizados, en el trabajo anterior se utilizaron solamente líneas endogámicas que son utilizadas como parentales, teniendo muy baja variabilidad genetcia, en cambio en el panel de INIFAP las líneas utilizados son líneas endogámicas utilizadas como parentales y además cruzas simples que surgen del
cruzamiento de estas líneas parentales de forma inter e intra poblacional, por lo que el definir la pertenencia de los 120 individuos tiene una mayor dificultad, el software STRUCTURE agrupa a los individuos que presenten las frecuencias alélicas mas parecidas, por lo que la variabilidad genética existente en las cruzas simples y mestizos propicia una diferenciación en estas frecuencias en contra de las líneas parentales, mostrando estos dos principales grupos.
Mengesha et al. (2017) muestran en sus resultados del análisis de Structure que las 128 líneas endogámicas del esquema de mejoramiento del Instituto de Agricultura Tropical de África tienen un número más probable de agrupaciones igual a 4 (K = 4). Los resultados del análisis de estructura de la población en este estudio claramente separaron las líneas endogámicas en cuatro grupos de acuerdo con sus antecedentes genéticos, estableciendo poblaciones biparentales resistentes a S. hermonthica y tolerantes a la sequía.
El análisis de estructura poblacional al ser utilizado con líneas endogámicas, puede ser utilizado para determinar la procedencia de cada línea, ya sea por el lugar de adaptación geográfica en que se cultiva, o por el pedigrí que cada una de las líneas presenta, o incluso si un individuo pertenece a una mezcla de ambas poblaciones. La principal desventaja del STRUCTURE es su tiempo de ejecución, llegando a durar hasta un mes utilizando el número de repeticiones recomendado por el autor.
Se construyó un dendograma a partir de la matriz de distancia genética de Rogers calculada para el total de 120 líneas de maíz y los 61 parentales. Este dendograma separó a los 120 individuos en tres principales poblaciones, la Población Blanca del Noroeste, la Población Blanca del Bajío, y en un mismo grupo a las Poblaciones Amarillas del Bajío y del Noroeste. Esto se debe a que existen individuos que son progenie de las líneas parentales, e incluso son cruzas interpoblacionales (cruzas de individuos del Noroeste con el Bajío) lo cual dificulta la asignación a alguna población. Cuando se analizó un dendograma creado a partir de las 61 líneas parentales, excluyendo cruzas y mestizos, se marca una clara diferenciación entre los individuos que pertenecen a cada una de las cuatro poblaciones base. La presencia de diferente número de marcadores e incluso marcadores específicos en cada individuo permite su separación en los diferentes grupos, agrupando aquellos que comparten más marcadores entre sí.
En el trabajo de Wu et al. (2016) se calculó de igual forma una matriz de distancia genética a partir de los 362,008 SNPs para las 538 CMLs y las 6 líneas templadas como grupo externo. A partir de esta matriz de distancia genética se construyó un dendograma, mostrando una separación de las CMLs por la zona de adaptación geográfica de cada uno de los genotipos, se encontraron tres grupos principales, maíces tropicales de tierras bajas, maíces subtropicales de tierras medias, y los maíces tropicales de tierras altas. El grupo externo correspondiente a los maíces de tierras templadas, se basó principlamente en líneas endogámicas comerciales de Estados Unidos (B37, B73, B84, Mo17, C103, Oh43). Estas se situaron cerca de las líneas tropicales de tierras altas, posiblemente al ser mayor la altura sobre el nivel del mar, las temperaturas en esas localizaciones es baja al igual que en las zonas templadas.
Mengesha et al. (2017) calcularon una matriz de distancia genética de 128 líneas endogámicas a partir de 3,297 SNPs. Sus resultados mostraron en el análisis de Structure cuatro grupos principales. La separación de las líneas de acuerdo a la distancia genética entre ellas, permitió definir cuatro grupos heteróticos de líneas endogámicas biparentales resistentes a S. hermonthica y tolerantes a sequía.
Chen et al. (2016) realizaron un análisis de MDS para 561 CMLs a partir de 18,082 SNPs identificados para este panel. El análisis permitió definir tres principales agrupaciones según el ambiente de adaptación, logrando definir que líneas pertenecen a maíces de clima tropical adaptadas a tierras bajas, maíces de clima subtropical adaptadas a tierras medias, y maíces de clima tropical adaptadas a tierras altas.
En el presente estudio, se realizó un análisis MDS a partir de los 35,770 SNPs identificados en los 120 individuos para poder visualizarlos en un plano de 3D para definir los grupos heteróticos presentes. El análisis de escalamiento multidimensional o MDS se basa en las similitudes que tienen los objetos que se están evaluando para establecer un sistema de coordenadas en 3D, posicionando más cerca a aquellos individuos que presentaron un mayor número de marcadores similares entre sí. Los resultados muestran que al analizar sólo a las líneas parentales, estas se agruparon en tres poblaciones, la primera integrada por maíces blancos del Bajio, la segunda por maíces blancos del noroeste y la 59
tercera agrupando a los maíces amarillos del Bajío y del Noroeste. Al analizar las 61 líneas parentales junto con las 40 cruzas progenie de estos mismos parentales, las líneas parentales se agruparon de forma similar, mientras que las cruzas se posicionaron cerca de las líneas parentales que las conforman. Al analizar el panel completo de 120 individuos conteniendo líneas parentales, cruzas y mestizos; las líneas parentales se agruparon de forma similar a los otros dos análisis, mientras que los mestizos al igual que las cruzas se posicionaron cerca de al menos uno de los parentales que conforman la cruza.
El uso de marcadores moleculares de tipo SNP permite definir grupos heteróticos entre las líneas caracterizadas genéticamente. El establecer estos grupos heteróticos ayuda a seleccionar a los individuos que presentan características diferentes entre cada grupo y poder realizar cruzas biparentales esperando características deseables de cada parental en el híbrido. Además de los análisis de estructura, el uso de la matriz de distancia genética permite seleccionar a aquellos genotipos más contrastantes de acuerdo a su composición genética. Por tal motivo se seleccionaron aquellos genotipos que presentaron la mayor distancia genética entre sí, para la realización de las predicciones de cruzas simples, buscando que la cruza de estos genotipos produzca un valor mayor de la heterosis en rendimiento de grano. En el trabajo realizado por Pavlov et al. (2016) reportan que existe una correlación positiva (r = 0.57) entre la distancia genética y la heterosis con respecto de los parentales para el rendimiento de grano. Aunque la correlación no es muy alta, la tendencia indica que a mayor distancia genética, la heterosis tiende a incrementar. Además de la distancia genética existente entre los genotipos se buscó que estos pertenecieran a grupos heteróticos distintos, realizando la predicción para cruzas simples interpoblacionales, es decir cruzar maíces del Bajío con maíces del Noroeste de México.
Tanto en el dendograma como en el grafico 3D se muestran claramente 3 principales agrupamientos, la población blanca del Noroeste, la población blanca del Bajío, y las poblaciones amarillas del Noroeste y el Bajío. Tanto la población blanca del Noroeste como la del Bajío presentaron un mayor número de marcadores en comparación con las poblaciones amarillas del Noroeste y Bajío de México, lo que indica que existe una diferencia de marcadores que puede
ayudar a diferenciar mejor dichas poblaciones. Si tomamos en cuenta el número de marcadores que pertenecen a cada individuo dentro de las predicciones de cruzas, tenemos que la posible cruza simple de maíz amarillo entre los individuos PAN146-DH14-Us y PAB226 comparten el 68.1 % de los marcadores mientras que cada uno de ellos presentan el 20.2 % y el 11.7% de marcadores únicos para cada línea respectivamente. Estas diferencias en la presencia de marcadores en cada línea hace que la asignación según los loci que presenten cada uno de ellos los haga más similares o más contrastantes genéticamente, lo cual permite separarlos en los diferentes grupos.
El uso de marcadores moleculares para la caracterización genética de líneas de maíz pertenecientes al INIFAP ha permitido determinar la pureza genética de cada una de las líneas, así como la diversidad genética que existe entre ellas y el nivel de informatividad que existe en estos mismos. Estos marcadores fueron de utilidad para determinar la estructura poblacional presente en este estudio, determinando grupos heteróticos para las poblaciones de maíces blancos y amarillos del Noroeste y Bajío de México, permitiendo además establecer un sistema de predicción de cruzas en base a la distancia genética que existe entre cada genotipo y la pertenencia a alguna de las poblaciones, buscando la cruza entre los genotipos más contrastantes genéticamente, esperando que la heterosis para el rendimiento en grano aumente. La identificación de estos marcadores moleculares más la medición de valores fenotípicos de importancia agronómica, serán de utilidad para realizar posteriores análisis de asociación genómica entre el genotipo y los rasgos deseables para estas líneas de selección como el alto contenido de aceite, mayor contenido de proteína y mayores rendimientos en producción de grano. Identificar marcadores que están significativamente asociados a alguna de estas características es de suma importancia ya que permitirá aprovechar la tecnología de mejoramiento conocida como selección asistida por marcadores, la cual permite seleccionar rasgos de interés agronómico que estén asociados a estas variaciones puntuales dentro del genoma.
En este caso los marcadores moleculares identificados por el CIMMYT por medio de la tecnología de genotipado por DArTSeq-GBS, permitieron solamente determinar la diversidad genética y la estructura poblacional de los individuos
pertenecientes a cada población, debido a que en la identificación de SNPs no se proporciona la posición física de cada marcador al compararlo con un genoma de referencia, durante este trabajo se realizo una identificación de SNPs para su posterior imputación (rellenado de datos faltantes) y análisis de asociación genómica en trabajos futuros.