¿QUÉ ES EL GENOTIPADO? El análisis de las variaciones individuales en la secuencia de DNA
¿QUÉ APLICACIONES TIENE? - Identificar marcadores de susceptibilidad/ protección a enfermedades complejas - Identificar marcadores para predecir la respuesta individual a fármacos - Estudios evolutivos para trazar la historia de las poblaciones - Identificación de individuos - Aplicaciones prácticas en diagnóstico y tratamiento de enfermedades
POLIMORFISMOS EN EL GENOMA HUMANO
- 3.000 millones de pares de bases - 99.9% idéntico entre individuos - 0.1% de diferencias/ polimorfismos: Macro: Grandes duplicaciones, inversiones y deleciones Medio: VNTRS (Variable Number of Tandem Repeats) o minisatélites STRs (Short Tandem Repeats) o microsatellites Micro: Single Nucleotide Polymorphisms (SNPs) Single Nucleotide Insertions and Deletions (Indels)
MICROSATÉLITES O STRs (SINGLE TANDEM REPEATS)
- repeticiones de 1-5 nucleótidos - el número de repeticiones varía entre individuos - altamente polimórficos - distribuídos por todo el genoma - fácilmente detectables por PCR
GAACGTACTCACACACACACACATTTGAC TTCGATGATAGATAGATAGATAGATACGT
MICROSATÉLITES O STRs
MICROSATÉLITES O STRs: Multiplexing
SNPs (Single Nucleotide Polymorphism) - 1 SNP cada 200-300 pb -10-30 millones de SNPs (10 millones en dbSNP) - Frecuencia >1% - Baja tasa de mutación: 10-8 - Típicamente bialélicos - 2 de cada 3 SNPs son transiciones C-T - Distribuidos por todo el genoma: -Regiones codificantes: sinónimos y no sinónimos -Regiones no codificantes GTGGACGTGCTT[G/C]TCGATTTACCTAG
¿CÓMO SE IDENTIFICAN LOS SNPs? - Se alinean secuencias de una misma región y se identifican posiciones variables GCATGCAAGCAGATA GCATGCACGCAGATA GCATGCAAGCAGATA GCATGCAAGCAGATA GCATGCAAGCAGATA GCATGCAAGCAGATA - Posición variable 8 (A|C), ¿es realmente un SNP?
Dos tipos de errores en la identificación de SNPs: Las secuencias alineadas son parálogas y no homólogas (PSV y no SNP) Errores de secuenciación
dbSNP Build 124 (enero 2005)
Organism
Nยบ SNPs (validated)
Homo sapiens / geneReport
10,054,521 (5,054,675)
Gallus gallus / geneReport
3,291,672 (3,281,479)
Oryza sativa
3,899,916 (22,057)
Anopheles gambiae
1,136,268 (0)
Mus musculus / geneReport
581,577 (535,237)
Canis familiaris
957,828 (12,315)
Rattus norvegicus
43,229 (702)
Saccharum hybrid cultivar
42,853 (0)
Danio rerio
2,025 (1,903)
Sus scrofa
1,521 (24)
Bos indicus x Bos taurus
2,425 (0)
Bos taurus
2,058 (45)
Caenorhabditis elegans
1,065 (0)
Pinus pinaster
32 (0)
Cooperia oncophora
426 (96)
Ovis aries
614 (66)
Glycine max
278 (3)
281
Arabidopsis thaliana
184 (184)
184
Plasmodium falciparum
203 (0)
199
Zea mays
146 (80)
90
Ficedula albicollis
37 (18)
37
Ficedula hypoleuca
20 (10)
28
Hydroides elegans
7 (1)
Gorilla gorilla gorilla
4 (0)
Nยบ SNPs with frequency
488,391
2,7
545,5 17 669
2,031
54
425
http://www.ncbi.nlm.nih.gov/SNP
dbSNP
dbSNP
dbSNP
Métodos para el genotipado de SNPs - Más de 100 métodos distintos - Plataforma ideal para el genotipado de SNPs Alta capacidad de genotipo (nº genotipos/ día): throughput Precios asequibles Alta capacidad de multiplexing Diseño simple Robustez Baja tasa de error Sistema automático de asignación de los alelos Adecuada para la mayoría de SNPs Adecuada para proyectos con distinto nº de SNPs y de muestras
Protocolo típico para el genotipado de SNPs
Amplificación del fragmento diana
PCR
Discriminación de los dos alelos
Hibridación específica de alelo Extensión del primer específica de alelo Ligación específica de alelo Corte enzimático específico de alelo
Identificación del producto específico de alelo
Intensidad de la fluorescencia /FRET/ FP Electroforésis Espectrometría de masas Citometría de flujo
Combinaciรณn de distintas estrategias de discriminaciรณn, formato y detecciรณn para el genotipado de SNPs
Métodos bioquímicos para la discriminación de los dos alelos de un SNPs
HIBRIDACIÓN ESPECÍFICA DE ALELO (ASO)
EXTENSIÓN DEL PRIMER ESPECÍFICA DE ALELO (ASE)
LIGACIÓN DE OLIGOS ESPECÍFICA DE ALELO (OLA)
EXTENSIÓN DEL PRIMER CON UN NUCLEÓTIDO (SBE O MINI SECUENCIACIÓN) CORTE ESPECÍFICO DE ALELO
Métodos bioquímicos para la discriminación de los dos alelos de un SNPs: ASO
HIBRIDACIÓN ESPECÍFICA DE ALELO (ASO)
-Homodúplex termodinámicamente más estable - Para aumentar la precisión se utilizan muchas sondas para cada alelo y se toma como resultado el promedio de todas ellas (microarray). -Desventajas: baja especificidad
Métodos bioquímicos para la discriminación de los dos alelos de un SNPs: ASE
EXTENSIÓN DEL PRIMER ESPECÍFICA DE ALELO (ASE)
-La polimerasa extiende el primer con un missmatch a 3’ entre con una eficiencia entre 100 y 10.000 menor - ASE-PCR: un tercer primer reverso permite a la vez amplificar la región. - Ventajas: los oligos no tienen que estar marcados, se puede realizar en formato microarray - Desventaja: no es tan específico como el SBE, especialmente el ASE-PCR.
Métodos bioquímicos para la discriminación de los dos alelos de un SNPs: SBE
EXTENSIÓN DEL PRIMER CON UN NUCLEÓTIDO (SBE O MINISECUENCIACIÓN)
- Ventajas: altamente específico
Métodos bioquímicos para la discriminación de los dos alelos de un SNPs: OLA
LIGACIÓN DE OLIGOS ESPECÍFICA DE ALELO (OLA)
-La DNA ligasa es más sensible a detectar missmatches en el extremo 3’ - Ventajas: altamente específico
Métodos bioquímicos para la discriminación de los dos alelos de un SNPs: Invader CORTE ESPECÍFICO DE ALELO (ENSAYO INVADER)
- Endonucleas que utilizan como sustrato una doble cadena bifurcada con el extremo 5’ libre y que cortan sólo cuando detectan 1 o más bases de solapamiento - Ventaja: no necesita de la amplificación previa por PCR - Desventaja: necesita grandes cantidades de DNA
Formatos
Homogeneos: todos los ractivos juntos en un tubo, no hay pasos de purificación. Fáciles de automatizar, baja capacidad de multiplexing. Semihomogeneos: los productos no están separados ni existe un suporte sólido, pero los reactivos se añaden secuencialmente. Sólidos: Productos en soporte sólido y con pasos de purificación. Más sensibles y con alta capacidad de multiplexing.
Formatos microarrays
microesferas
Mecanismos para la detección e identificación
Transferencia de energía por resonancia de fluorescencia (FRET): interacción entre dos fluoróforos muy cercanos (10-200 amstrongs) El fluoróforo excitado transfiere la energía al fluoróforo aceptor que por tanto actúa como inhibidor de la emisión de fluorescencia. La eficiencia del proceso es inversamente proporcional a la distancia entre el fluoróforo i el quencher. Polarización de la fluorescencia. Se marca una pequeña molécula con un fluoróforo, de forma que cuando se une a una molécula mayor se modifica su velocidad de rotación que se puede detectar utilizando luz polarizada y midiendo la polarización de la fluorescencia emitida.
MĂŠtodos mĂĄs populares para genotipado de SNPs
Ensayo nucleasa 5’ (TaqMan)
Transferencia de energía por resonancia de fluorescencia (FRET):
Ensayo nucleasa 5’ (TaqMan)
Ensayo nucleasa 5’ (TaqMan)
- Dos sondas marcadas con distintos fluoróforors - El incremento de la fluorescencia es proporcional a la cantidad de producto formado. -Ventaja: un único paso, sin purificaciones -Desventajas: 1 SNP/ reacción, difícil de optimizar
Ensayo nucleasa 5’ (TaqMan)
Espectrometría de masas (MALDI-TOF)
MALDI-TOF: Matrix-Associated Laser Desorption time-Of Flight Mass spectrometry) - Permite determinar de forma precisa la masa de una molécula (diferencias de 3 Daltons) - Equipo complejo: nanodispensador, espectrómetro con ionizador, analizador.
Espectrometría de masas: MassExtend - Diferencias pequeñas entre el peso molecular entre las 4 bases, especialmente entre A y T. - Reacción de extensión del primer con dNTPs y ddNTPs. - Productos de los dos alelos con distinto nº de bases.
EspectrometrĂa de masas: multiplexing
Primers con distintos pesos moleculares
Espectrometría de masas: multiplexing Hasta 12 SNPs en una única reacción utilizando primers con distintos pesos moleculares
Genotipado como T GA C ( los picos ‘P’ son primers de extensión no extendidos)
Espectrometría de masas: resultados El software de análisis asigna genotipos a los SNPs en cada ensayo en función de las masas obtenidas.
SNPlex PROTOCOLO DE SNPlex PARA LA DETECCIÓN DE SNPs 1. 2. 3. 4. 5. 6. 7. 8. 9.
Activación de los oligonucleótidos Ligación de los oligonucleótidos Purificación de los oligonucleótidos ligados Amplificación con primers universales Captura del DNA biotinilado Hibridación con sondas ZipChute Elución de las sondas ZipChute Electroforesis capilar para la detección de las sondas ZipChute Análisis de los resultados con GeneMapper
GENOTIPOS
SNPlex: Activación de los oligonucleótidos LINKERS
N
N
N
N NN N
OLIGONUCLEÓTIDOS
primer universal F N N
N ASO1 NN NNNNNNNNNNNNN N N N N N NN NN NN
N
N
N
N NN N
fosforilación
P NNNNNNNNNCTTAGCATACTAGATTCCGA P
primer universal F N N
N NN ASO2 NNNNNNNNNNNNN N N N N N NN NN NN N NN N N N N N N N NNNNNNNNNNNNN NN N N N N N NNNN NN
LSO
ZipCode1
ZipCode2
fosforilación
P NNNNNNNNNCTTAGCATACTAGATTCCGC P
fosforilación
primer universal R
CACCTAGGGATCCATTAGTGTNNNNNNNNN P P
SNPlex: Ligación de los oligonucleótidos primer universal F NN NN NN NN ZipCode1 NN NN N ASO1 NN NN NN NN NN NN NN NN CTTAGCATACTAGATTCCGA NN NN NN NN NCTTAGCATACTAGATTCCGC ZipCode2
primer universal R N NN N N NN CACCTAGGGATCCATTAGTGT NN
LSO
ASO2
ligación de oligonucleótidos
DNA genómico TTTGGACGCGATCGAATCGTATGATCTAAGGCGGTGGATCCCTAGGTAATCACAGATATCC AAACCTGCGCTAGCTTAGCATACTAGATTCCGCCACCTAGGGATCCATTAGTGTCTATAGG desnaturalización
SNPlex: Purificaciรณn de los oligonucleรณtidos ligados
primer universal F
NN NN NN NN ZipCode1 NN NN NN NN NN NCTTAGCATACTAGATTCCGA
primer universal F
NN primer universal R NN actividad exonucleasa NN ZipCode2 NN NN N NN NN NN N NN NN NN NCTTAGCATACTAGATTCCGC CACCTAGGGATCCATTAGTGT NNN DNA genรณmico TTTGGACGCGATCGAATCGTATGATCTAAGGCGGTGGATCCCTAGGTAATCACAGATATCC
AAACCTGCGCTAGCTTAGCATACTAGATTCCGCCACCTAGGGATCCATTAGTGTCTATAGG
SNPlex: Amplificación con primers universales primer universal R
primer universal F NNNNNNNN
NNNNNNN
NNNNNNNN
NNNNNNN
síntesis NNNNNNNNCTTAGCATACTAGATTCCGCCACCTAGGGATCCATTAGTGTNNNNNNN NNNNNNNNGAATCGTATGATCTAAGGCGGTGGATCCCTAGGTAATCACANNNNNNN NNNNNNNNNNNNNNNNCTTAGCATACTAGATTCCGCCACCTAGGGATCCATTAGTGTNNNNNNN
ZipCode2
NNNNNNNNNNNNNNNNGAATCGTATGATCTAAGGCGGTGGATCCCTAGGTAATCACA
SNPlex: Captura del DNA biotinilado
Primer con biotina NNNNNNNNNNNNNNNCTTAGCATACTAGATTCCGCCACCTAGGGATCCATTAGTGTNNNNNNN NNNNNNNNNNNNNNNGAATCGTATGATCTAAGGCGGTGGATCCCTAGGTAATCACANNNNNNN
desnaturalizaciรณn lavados
Placa con estreptavidina
SNPlex: Hibridaciรณn con sondas ZipChute
Marcador fluorescente Modificadores de movilidad ZipCode2
ZipCode1
NNNNNNNNN
NNNNNNNNN
sondas Zipchute
hibridaciรณn NNNNNNNNNNNNNNNNNNGAATCGTATGATCTAAGGCGGTGGATCCCTAGGTAATCACA NNNNNNNN
ZipCode2 Placa con estreptavidina
SNPlex: Eluciรณn de las sondas ZipChute
ZipCode2 eluciรณn NNNNNNNNN NNNNNNNNNNNNNNNNNNGAATCGTATGATCTAAGGCGGTGGATCCCTAGGTAATCACA NNNNNNNN
ZipCode2 Placa con estreptavidina
SNPlex: Electroforesis capilar ZipCode1 ZipCode1
ZipCode2 ZipCode2
NNNNNNNNN NNNNNNNNN
NNNNNNNNN NNNNNNNNN
electroforesis electroforesis
A A11A A11
A A11A A22
A A22A A22
SNPlex: AnĂ lisis de los resultados
SNPlex: AnĂ lisis de los resultados
A2A2
A1A2
A1A1 Ctrol -
Diagrama cartesiano
SNPlex: AnĂ lisis de los resultados
Microarrays: minisecuenciaciรณn
Arrayed Primer Extension (APEX).
Primer Extension en soluciรณn: oligos con tags (secuencias identificadoras) y arrays universales
Microarrays: array of arrays
Array con distintas cรกmaras que permite hacer reacciones separadas (muchos SNPs en muchas muestras
BeadArray
Array Matrix 96 haces
1 Haz 50.000 fibras
1 haz tiene 50.000 microesferes
1 fibra 1 microesfera (ensamblaje al azar)
BeadArray
Array Matrix 96 haces
Cada microesfera tiene unos oligos unidos que permite decodificarla medainte hibridaciones secuenciales
Existen 1520 microesferas distintas 1 haz tiene 50.000 microesferas
30% redundancia
BeadArray DNA inmovilizado mediante estreptavidina/ biotina
OLA: tres oligos (ASO1, ASO2 y LSO). LSO tiene una secuencia que hibrida con la secuencia identificadora de una determinada microesfera.
PCR con primers universales P1 i P2 marcados con dos fluorรณforos distintos
BeadArray
BeadArray
Ejemplos de estudios de genotipado
Ejemplo de estudios de genotipado agran escala: HapMap
Poblaciones SNPs genotipados
CEU 956,730
HCB 412,669
JPT 412,608
Affymetrix platform (Broad) BeadArray platform (Broad, Illumina, Sanger, McGill, Beijing, Shanghai/Taipei) FP-TDI platform (UCSF/WashU) Invader platform (used by RIKEN) MIP platform (used by Baylor) Perlegen platform (used by Perlegen) Sequenom platform (used by Broad, Beijing, HongKong)
YRI 432,523
Estudios de asociación a escala genómica
50.000 tagging SNPs - 500.000 SNPs necesarios Affymetrix GeneChip® Mapping 10K Set: 10.000 SNPs (1/100 kb) GeneChip® Mapping 100K Set: 100.000 SNPs (1/10 kb) Paral.lel 10.000 cSNPs
Estudios de asociaciรณn a escala genรณmica
Molecular Haplotyping - PCR a partir de una única molécula - Clonaje de fragmentos de PCR - Híbridos somáticos - Microscopía de alta resolución
AutomatizaciĂłn: robots de manejo de lĂquidos
Automatizaciรณn: robots para la extracciรณn de DNAs
Automatizaciรณn: cรณdigos de barras
LIMS: Laboratory Information Management Solutions
LIMS: Laboratory Information Management Solutions
Conclusiones
•
El genotipado de SNPs a gran escala es una área emergente
•
Numerosas tecnologías con ventajas y desventajas
•
La tecnología del futuro – No debería tener un paso de PCR – Podría basarse en el análisis de moléculas únicas de DNA (molecular haplotyping) – Una tecnología barata y con un elevado throughput tendrá consecuencias importante en investigación y diagnóstico.
Nodo de Barcelona del CEGEN
CRG
PRBB
Nodo de Barcelona del CEGEN ÆDirector del nodo: Dr. Xavier Estivill ÆResponsable de la Plataforma: Dra. Mònica Bayés ÆResponsable de Análisis de Datos: Dr. Rafael de Cid ÆPersonal Técnico: Carles Arribas, Anna Carreras, Cecilia García, Kristín Hildur Kristjánsdóttir, Anna Puig
Nodo de Barcelona del CEGEN Genotipado a media-gran escala mediante SNPlex