Operaci贸ns sinxelas con secuencias
Vanessa Nov谩s Velo LACC2
EBT/CSLACC2/04 Operacións sinxelas con secuencias
Secuencia de ADN ATGTGCGACCATACCAAGCTGAAAATACTGCATCCCGTCTGATCTGCACAGTCAAGCAGCTTAGGGCCCA GTCAGTAGTGCGGTGGGGGACCATGCGCGAACATTGTGGTGTTGCACTTATGTGCGACCATACCAAGCTG AAAATACTGCATCCCGTCTGATCTGCACAGTCAAGCAGCTTAGGGCCCAGTCAGTAGTGCGGTGGGGGAC CATGCGCGAACATTGTGGTGTTGCACTTATGTGCGACCATACCAAGCTGAAAATACTGCATCCCGTCTGA TCTGCACAGTCAAGCAGCTTAGGGCCCAGTCAGTAGTGCGGTGGGGGACCATGCGCGAACATTGTGGTGT TGCACTTATGTGCGACCATACCAAGCTGAAAATACTGCATCCCGTCTGATCTGCACAGTCAAGCAGCTTA GGGCCCAGTCAGTAGTGCGGTGGGGGACCATGCGCGAACATTGTGGTGTTGCACTT
Secuencia reversa TTCACGTTGTGGTGTTACAAGCGCGTACCAGGGGGTGGCGTGATGACTGACCCGGGATTCGACGAACTGA CACGTCTAGTCTGCCCTACGTCATAAAAGTCGAACCATACCAGCGTGTATTCACGTTGTGGTGTTACAAG CGCGTACCAGGGGGTGGCGTGATGACTGACCCGGGATTCGACGAACTGACACGTCTAGTCTGCCCTACGT CATAAAAGTCGAACCATACCAGCGTGTATTCACGTTGTGGTGTTACAAGCGCGTACCAGGGGGTGGCGTG ATGACTGACCCGGGATTCGACGAACTGACACGTCTAGTCTGCCCTACGTCATAAAAGTCGAACCATACCA GCGTGTATTCACGTTGTGGTGTTACAAGCGCGTACCAGGGGGTGGCGTGATGACTGACCCGGGATTCGAC GAACTGACACGTCTAGTCTGCCCTACGTCATAAAAGTCGAACCATACCAGCGTGTA
Secuencia complementaria TACACGCTGGTATGGTTCGACTTTTATGACGTAGGGCAGACTAGACGTGTCAGTTCGTCGAATCCCGGGT CAGTCATCACGCCACCCCCTGGTACGCGCTTGTAACACCACAACGTGAATACACGCTGGTATGGTTCGAC TTTTATGACGTAGGGCAGACTAGACGTGTCAGTTCGTCGAATCCCGGGTCAGTCATCACGCCACCCCCTG GTACGCGCTTGTAACACCACAACGTGAATACACGCTGGTATGGTTCGACTTTTATGACGTAGGGCAGACT AGACGTGTCAGTTCGTCGAATCCCGGGTCAGTCATCACGCCACCCCCTGGTACGCGCTTGTAACACCACA ACGTGAATACACGCTGGTATGGTTCGACTTTTATGACGTAGGGCAGACTAGACGTGTCAGTTCGTCGAAT CCCGGGTCAGTCATCACGCCACCCCCTGGTACGCGCTTGTAACACCACAACGTGAA
Transcrito de ADN AUGUGCGACCAUACCAAGCUGAAAAUACUGCAUCCCGUCUGAUCUGCACAGUCAAGCAGCUUAGGGCCCA GUCAGUAGUGCGGUGGGGGACCAUGCGCGAACAUUGUGGUGUUGCACUUAUGUGCGACCAUACCAAGCUG AAAAUACUGCAUCCCGUCUGAUCUGCACAGUCAAGCAGCUUAGGGCCCAGUCAGUAGUGCGGUGGGGGAC CAUGCGCGAACAUUGUGGUGUUGCACUUAUGUGCGACCAUACCAAGCUGAAAAUACUGCAUCCCGUCUGA UCUGCACAGUCAAGCAGCUUAGGGCCCAGUCAGUAGUGCGGUGGGGGACCAUGCGCGAACAUUGUGGUGU UGCACUUAUGUGCGACCAUACCAAGCUGAAAAUACUGCAUCCCGUCUGAUCUGCACAGUCAAGCAGCUUA GGGCCCAGUCAGUAGUGCGGUGGGGGACCAUGCGCGAACAUUGUGGUGUUGCACUU
Proteína codificada -
Marco de lectura Rf 1:
MCDHTKLKILHPV*SAQSSSLGPSQ*CGGGPCANIVVLHLCATIPS*KYCIPSDLHSQAA*GPVSSAVGD HARTLWCCTYVRPYQAENTASRLICTVKQLRAQSVVRWGTMREHCGVALMCDHTKLKILHPV*SAQSSSL GPSQ*CGGGPCANIVVLH -
Marco de lectura Rf 2:
CATIPS*KYCIPSDLHSQAA*GPVSSAVGDHARTLWCCTYVRPYQAENTASRLICTVKQLRAQSVVRWGT MREHCGVALMCDHTKLKILHPV*SAQSSSLGPSQ*CGGGPCANIVVLHLCATIPS*KYCIPSDLHSQAA* GPVSSAVGDHARTLWCCT -
Marco de lectura Rf 3:
Página 1 de 2
EBT/CSLACC2/04 Operacións sinxelas con secuencias
VRPYQAENTASRLICTVKQLRAQSVVRWGTMREHCGVALMCDHTKLKILHPV*SAQSSSLGPSQ*CGGGP CANIVVLHLCATIPS*KYCIPSDLHSQAA*GPVSSAVGDHARTLWCCTYVRPYQAENTASRLICTVKQLR AQSVVRWGTMREHCGVAL -
Marco de lectura Rf -1:
KCNTTMFAHGPPPHY*LGPKLLDCADQTGCSIFSLVWSHISATPQCSRMVPHRTTDWALSCLTVQIRRDA VFSAWYGRT*VQHHNVRAWSPTALLTGP*AA*LCRSDGMQYFQLGMVAHKCNTTMFAHGPPPHY*LGPKL LDCADQTGCSIFSLVWSH -
Marco de lectura Rf -2:
SATPQCSRMVPHRTTDWALSCLTVQIRRDAVFSAWYGRT*VQHHNVRAWSPTALLTGP*AA*LCRSDGMQ YFQLGMVAHKCNTTMFAHGPPPHY*LGPKLLDCADQTGCSIFSLVWSHISATPQCSRMVPHRTTDWALSC LTVQIRRDAVFSAWYGRT -
Marco de lectura Rf -3:
VQHHNVRAWSPTALLTGP*AA*LCRSDGMQYFQLGMVAHKCNTTMFAHGPPPHY*LGPKLLDCADQTGCS IFSLVWSHISATPQCSRMVPHRTTDWALSCLTVQIRRDAVFSAWYGRT*VQHHNVRAWSPTALLTGP*AA *LCRSDGMQYFQLGMVAH Hay seis soluciones posibles para la secuencia problema, el inicio de un marco de lectura depende de donde uno empieza a leer. Una sección de lectura comienza con un codón de inicio (AUG) y uno de parada (UAA, UAG o UGA). Un marco abierto de lectura puede contener un gen completo, o los genes que se solapan; el código genético no siempre es tan ordenada como uno podría imaginar. Existen 6 sentidos en los que se puede aparecer un marco de lectura: +1, +2, +3, -1, -2, -3. Si una secuencia se empieza a leer desde el 1er carácter, entonces el marco de lectura es +1; si se empieza desde la 2da, entonces el marco de lectura es +2; Y si se comienza desde la 3era, entonces el marco de lectura es +3. Para la secuencia complementaria, si se empieza a leer desde el 1er carácter, entonces el marco de lectura es -1; si se empieza desde la 2da, entonces el marco de lectura es -2; Y si se comienza desde la 3era, entonces el marco de lectura es -3.
Estadística de secuencias a. Porcentaje nucleótidos Nucleótidos A: C: T: G:
Porcentaje
112 120 108 136
23,52% 25,21% 28,57% 22,68%
b. Porcentaje de dímeros (pareja de bases diferentes) Dímeros AA: 24 AC: 28
Porcentaje 5,04% 5,88%
Página 1 de 3
EBT/CSLACC2/04 Operaci贸ns sinxelas con secuencias
AG: AT: CA: CC: CG: CT: GA: GC: GG: GT: TA: TC: TG: TT:
32 28 48 28 20 24 20 44 32 40 19 20 52 16
6,72% 5,88% 10,08% 5,88% 4,2% 5,04% 4,2% 9,24% 6,72% 8,4% 3,99% 4,2% 10,92% 3,36% c. Porcentaje de tripletes (codones) Codones
AAA: AAC: AAG: AAT: ACA: ACC: ACG: ACT: AGA: AGC: AGG: AGT: ATA: ATC: ATG: ATT: CAA: CAC: CAG: CAT: CCA: CCC: CCG: CCT: CGA: CGC: CGG: CGT: CTA: CTC: CTG: CTT: GAA: GAC: GAG: GAT: GCA:
8 4 8 4 8 12 0 8 0 12 4 16 8 8 8 4 8 8 16 16 16 8 4 0 8 4 4 4 0 0 16 8 8 8 0 4 16
Porcentaje 1,68% 0,84% 1,68% 0,84% 1,68% 2,52% 0% 1,68% 0% 2,52% 0,84% 3,36% 1,68% 1,68% 1,68% 0,84% 1,68% 1,68% 3,36% 3,36% 3,36% 1,68% 0,84% 0% 1,68% 0,84% 0,84% 0,84% 0% 0% 3,36% 1,68% 1,68% 1,68% 0% 0,84% 3,36%
P谩gina 1 de 4
EBT/CSLACC2/04 Operaci贸ns sinxelas con secuencias
GCC: GCG: GCT: GGA: GGC: GGG: GGT: GTA: GTC: GTG: GTT: TAA: TAC: TAG: TAT: TCA: TCC: TCG: TCT: TGA: TGC: TGG: TGT: TTA: TTC: TTG: TTT:
4 16 8 4 4 16 8 4 12 20 4 0 8 8 3 8 4 0 8 8 24 8 12 7 0 8 0
0,84% 3,36% 1,68% 0,84% 0,84% 3,36% 1,68% 0,84% 2,52% 4,2% 0,84% 0% 1,68% 1,68% 0,63% 1,68% 0,84% 0% 1,68% 1,68% 5,04% 1,68% 2,52% 1,47% 0% 1,68% 0%
Fuentes de informaci贸n http://www.dnai.org/geneboy/ http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi http://www.marcoregalia.com/STUFF/UDISTRITAL/Bioinformatica/Activi dades/Resumenes%20Clases/Openreadingframes.html
P谩gina 1 de 5