ENSINO ON-LINE DE GENÉTICA DE POPULAÇÕES COSME DAMIÃO CRUZ MARCIANE DA SILVA OLIVEIRA
1
Universidade Federal de Viçosa Reitora Nilda de Fátima Ferreira Soares Vice-Reitor João Carlos Cardoso Galvão
Diretora Silvane Guimarães Silva Gomes Campus Universitário, 36570-000, Viçosa/MG Telefone: (31) 3899 2858 | Fax: (31) 3899 3352
Autores: Cosme Damião Cruz e Marciane da Silva Oliveira Layout: Lucas Kato Editoração Eletrônica: Núbya Fontes Edição de conteúdo e CopyDesk: João Batista Mota
2
Significado dos ícones da apostila Para facilitar o seu estudo e a compreensão imediata do conteúdo apresentado, ao longo de todas as apostilas, você vai encontrar essas pequenas figuras ao lado do texto. Elas têm o objetivo de chamar a sua atenção para determinados trechos do conteúdo, com uma função específica, como apresentamos a seguir.
!
Texto-destaque: são definições, conceitos ou afirmações importantes às quais você deve estar atento.
+
Glossário: Informações pertinentes ao texto, para situá-lo melhor sobre determinado autor, entidade, fato ou época, que você pode desconhecer.
?
SAIBA MAIS! Se você quiser complementar ou aprofundar o conteúdo apresentado na apostila, tem a opção de links na internet, onde pode obter vídeos, sites ou artigos relacionados ao tema.
Quando vir este ícone, você deve refletir sobre os aspectos apontados, relacionando-os com a sua prática profissional cotidiana
3
Sumário
4
6
Introdução
8
Estrutura da população
10
Equilíbrio de Hardy-Weinberg
12
Acasalamentos ao acaso resumido
14
Equilíbrio em relação a Alelos Múltiplos e a Genes ligados ao Sexo
18
Verificação das Condições de Equilíbrio
27
Ligação e Desequilíbrio de Ligação
35
Acasalamentos
44
Endogamia
51
Fixação e Oscilação na frequência gênica
60
Índice de Fixação
64
Fixação gênica – casos especiais
5
01 INTRODUÇÃO A genética de populações aplica os conhecimentos das Leis de Mendel e outros princípios da genética em populações inteiras de organismos; ou seja, enquanto a Lei de Mendel avalia a descendência de um ou poucos cruzamentos entre indivíduos contrastes (Figura 1a), a genética de populações considera todos os organismos da população (Figura 1b) e todos os possíveis cruzamentos entre eles (Figura 1c). Devido a esse amplo aspecto, a genética de populações atravessa muitos campos da biologia moderna.
A
C
B Figura 1. Representação esquemática de cruzamento, cruzamentos entre indivíduos contrastes e descendência, avaliados na Lei de Mendel (Figura 1A); todos os organismos da população considerados na genética de populações (Figura 1B) e todos os possíveis cruzamentos entre eles (Figura 1C)
6
+ !
SAIBA MAIS! Para saber mais sobre as leis de Mendel no programa GBOL, acesse o link para instalação do programa: http://www.ufv.br/ dbg/biodata.htm
No âmbito da genética de populações, a população é mais importante que indivíduos isolados. Mas qual é o conceito de população? População é um grupo de organismos pertencentes à mesma espécie, que vive numa área geográfica restrita o suficiente, possibilitando que seus membros possam se reproduzir entre si.
Portanto, ocupam a mesma dimensão de espaço e tempo. Entretanto, não envolvem necessariamente todos os indivíduos de uma mesma espécie, mas sim as populações locais, que são as unidades de cruzamentos locais, que determinamos como a Unidade Fundamental da Genética de Populações. Esse grupo de organismos da mesma espécie, além de ocupar uma área suficientemente restrita, deve ter um sistema de acasalamento definido. A frequência de formação de descendentes deve ser proporcional à contribuição gamética dos seus genitores. A população apresenta dois componentes importantes para seu estudo genético: o genético, por ser formada pela mesma espécie, e o espacial, já que todos os organismos estão na mesma área. Contudo, esse tipo de definição é difícil e varia entre espécies, devido às diferenças das estruturas das distribuições geográficas das espécies – algum padrão típico não aleatório. A distribuição homogênea no espaço dos membros de uma espécie é rara: quase sempre a população é subdividida, levando à heterogeneidade ambiental. As unidades de cruzamento local de populações grandes e geograficamente estruturadas são de grande interesse. Essa área da genética é componente central de várias metodologias modernas que têm sido empregadas na biologia populacional, conservação de recursos, evolução e melhoramento de plantas. A partir do conhecimento da estrutura genética de uma população, pode-se: • inferir quais os fenômenos ecológicos e genéticos atuantes nela; • detectar modos de reprodução e estrutura familiar; • estimar níveis de migração e dispersão; • ajudar no manejo de espécies ameaçadas de extinção; • fornecer dados para a manutenção de bancos de germoplasma; • auxiliar no diagnóstico do histórico evolutivo de um conjunto de táxons e, • no melhoramento genético, torna-se possível realizar - ou predizer - mudanças em magnitude e sentido desejados. Os modelos da genética de populações são todos fundamentados em princípios matemáticos. Um dos pioneiros foi Fisher, que deduziu as correlações esperadas entre parentes para a herança multifatorial. Dessa forma, demonstrou que o comportamento das características contínuas, além de ser compatível com a herança mendeliana, também pode ser previsto por ela.
7
02 ESTRUTURA DA POPULAÇÃO A teoria da genética de populações está preocupada, principalmente, em entender duas variáveis bastante conectadas: a frequência alélica – ou frequência gênica - e a frequência genotípica. Elas são os descritores básicos da estrutura da população, embora a ênfase possa ser dada também à heterozigosidade (diversidade gênica).
!
A frequência alélica é a proporção de um dado alelo em relação ao total de alelos situados em um mesmo loco cromossômico. A frequência genotípica é a proporção de determinado genótipo em relação ao número total de genótipos para o loco em questão. Ela está relacionada à frequência alélica, pois na reprodução são passados os alelos.
Considerando apenas o gene A/a, define-se uma população de tamanho N como sendo aquela constituída pelo agrupamento de N11 indivíduos AA, N12 Aa e N22 aa, tal como ilustrado na Tabela 1. Tabela 1 - Frequência genotípica numa população GENÓTIPOS
Nº DE INDIVÍDUOS
FREQUÊNCIA
AA
N11
D = N11/N
Aa
N12
H = N12/N
aa
N22
R = N22/N
TOTAL
N
1
em que: N = N11 + N12 +N22 = NAA + N Aa +Naa
D + H + R = 1,0
A frequência do alelo k (no caso, A ou a) na população pode ser obtida por meio da expressão:
8
Assim, lembrando que numa espécie diploide cada indivíduo apresenta dois alelos, tem-se: f(A) = p =
nA 2 NA + NAa 1 = = D+ H n 2N 2
f(a) = q =
na 2 Na + NAa 1 = =R+ H n 2N 2
e
sendo: p + q = 1
e
nA + na = n = 2N
Será considerada, como ilustração, uma população com 1.000 indivíduos, conforme descrito neste exemplo: Genótipo
Número observado
AA
200
Aa
400
aa
400
TOTAL
1000
Com os valores observados, estimam-se as frequências genotípicas, tal como apresentado: D = 200/1000 = 0,20 H = 400/1000 = 0,40 R = 400/1000 = 0,40 A partir desses valores, são obtidas as frequências dos alelos A e a, dadas por: p = f(A) = D + ½ H = 0,20 + ½ (0,40) = 0,4 q = f(a) = R + ½ H = 0,40 + ½ (0,40) = 0,6
9
03 EQUILÍBRIO DE HARDY-WEINBERG O equilíbrio de Hardy-Weinberg (também conhecido como princípio de Hardy-Weinberg ou lei de Hardy-Weinberg) é a base da genética de populações. Foi demonstrado independentemente por Godfrey Harold Hardy, na Inglaterra, e por Wilhelm Weinberg, na Alemanha, em 1908. Pelos pressupostos de Hardy e Weinberg, considera-se que, em uma população suficientemente grande e na ausência de seleção, migração e mutação, o equilíbrio é atingido após uma geração de acasalamento ao acaso (“aaa”), de maneira que a relação genotípica torna-se igual ao quadrado da frequência gênica e, com as sucessivas gerações de acasalamento ao acaso, permanece inalterada. Para ilustrar esse fato, será considerada uma população inicial com genótipos AA, Aa e aa, nas frequências D, H e R, respectivamente. As frequências alélicas são p e q, para A e a, respectivamente. Considerando que ocorre acasalamento ao acaso entre os indivíduos desta população, pode-se predizer a descendência, conforme ilustrado na Tabela 2. Tabela 2 - Frequência genotípica e alélica numa população antes e após acasalamento ao acaso (aaa) POPULAÇÃO INICIAL (P0)
POPULAÇÃO APÓS O “aaa” (P1)
AA = D
AA = D1 = p2
Aa = H aa = R
a
f(A) = p = D + H/2 f(a) = q = R + H/2
p+q=1
!
Aa = H1 = 2pq aa = R1 = q2 f(A) = p1 = p f(a) = q1 = q
p2+2pq+q2=1-
Assim, podem-se conhecer as frequências genotípica e alélica que ocorrerão numa geração futura, derivada de sucessivos acasalamentos ao acaso numa população inicial, a partir da sua frequência alélica (p e q) original.
Esse conhecimento preditivo permite aos pesquisadores estabelecer estratégias de melhoramento e manipulação de população, bem como reconhecer a dinâmica evolutiva da espécie em determinadas regiões. Uma lógica do princípio de Hardy-Weinberg, ilustrada na tabela 2, se baseia no resultado de tentativas repetidas e independentes. Com os acasalamentos ao acaso, o encontro dos gametas masculinos e femininos são tentativas independentes. Dessa forma, pares de gametas carregando os alelos AA, Aa ou AA são apresentadas nas proporções dadas por:
10
Isso pode ser facilmente demonstrado se forem considerados todos os possíveis tipos de cruzamento, na população original, ilustrados na Tabela 3. Tabela 3 - Relação dos possíveis acasalamentos numa população (P0) e predição da descendência (P1) resultante do acasalamento ao acaso Cruzamentos em P0
Frequência
Descendência em P1 AA
Aa
aa
D2
D2
-
-
AA x Aa
2DH
DH
DH
-
AA x aa
2DR
-
2DR
-
Aa x Aa
H2
Aa x aa
2HR
-
HR
HR
aa x aa
R2
-
-
R2
1
D1=(D+ ½ H)2
H1=2(D+ ½H )(R + ½H)
R1= (R+ ½ H)2
p2
2pq
q2
TOTAL
¼
H2
½
H2
¼ H2
Assim, demonstra-se que a frequência genotípica da descendência pode ser predita por meio do conhecimento da frequência alélica na população genitora. Com o acasalamento ao acaso, a frequência alélica não se altera, ou seja: f(A em P1) = p1 = p f(a em P1) = q1 = q
A relação genotípica da descendência é, portanto, dada por (p + q)2.
1. Processos que afetam a frequência gênica Há processos que podem modificar a constituição genética da população. Causando mudanças nas frequências alélicas e genotípicas. Os processos que afetam a frequência gênica de uma população. Eles são apresentados a seguir. 1.1 Processos Sistemáticos São aqueles cuja alteração na frequência gênica é conhecida tanto em magnitude quanto em direção. Consideram-se como processos sistemáticos a seleção, a migração e a mutação. A seleção promove a perpetuação diferencial e não aleatória de diferentes genótipos. Já a mutação provoca mudança na estrutura dos alelos existentes na população. A migração leva a incorporação de novos indivíduos em uma população que difira em freqüência alélica. 1.2 Processos Dispersivos S São aqueles em que é possível conhecer apenas a magnitude da alteração da frequência, mas não a direção em que ela foi alterada. Como processo dispersivo é considerada a oscilação (ou deriva) genética ou a amostragem. A deriva genética é uma amostragem aleatória e pequena de genitores da população. Sendo importante frisar que quanto menor o número de genitores, maior será a variação causada pela amostragem.
11
04 ACASALAMENTO AO ACASO RESUMIDO Em espécies sexuadas, uma das formas de manutenção da variação genética na população é a de acasalamentos ao acaso. Nessas espécies, os genótipos não são transmitidos de uma geração para outra; são quebrados na formação dos gametas pelo processo de segregação e recombinação e montados como novos a cada geração na fertilização. Ou seja, os genótipos dos genitores determinam os genótipos dos descendentes, e relações matemáticas podem ser derivadas entre as frequências de pares de genitores e de genótipos dos descendentes. No acasalamento ao acaso, a chance de um organismo, um genótipo prescrito, se acasalar com outro é igual à frequência dele na população. Ou seja, todos os organismos da população têm igual chance de se acasalarem com outro organismo da população, como se fossem gerados pela união aleatória entre indivíduos. Quando a probabilidade de acasalamento entre o genótipo (macho) e o genótipo (fêmea) for igual ao produto das probabilidades de suas frequências, têm-se o acasalamento ao acaso:
Os acasalamentos ao acaso exercem um papel importante em modelos de Genética de População por funcionar como um padrão conveniente de comparação para sistemas de cruzamentos mais complexos. O cruzamento pode ser aleatório em relação a um loco, mas não em relação a outro, ao mesmo tempo e na mesma população.
1. Descendência de acasalamentos ao acaso
!
Utilizando o princípio de Hardy-Weinberg, é possível predizer a descendência resultante do acasalamento ao acaso, considerando a população como um todo, em vez de particularizar os cruzamentos individuais, como normalmente é tratado na Genética Mendeliana.
Assim, pensando em indivíduos particulares, a frequência do alelo A, por exemplo, será igual a 1, ½ ou 0 para genótipos iguais a AA, Aa ou aa, respectivamente. Entretanto, considerando todos os indivíduos da população, a frequência de A será p ( 0 ≤ p ≤ 1 ) e a descendência, admitindo todos os acasalamentos possíveis, poderá ser predita a partir deste valor p. Como ilustração, será considerada uma população constituída por 46 indivíduos AA, 80 Aa e 74 aa. Para essa população, a frequência dos indivíduos derivados do acasalamento ao acaso será de 18,49%, 49,02% e 32,49%, de AA, Aa e aa, respectivamente. Esses valores correspondem ao que seria esperado no
12
equilíbrio, pois se têm, originalmente, os valores: D = 46/200 = 0,23 H = 80/200 = 0,40 R = 74/200 = 0,37 A partir destes valores, obtém-se: p = f(A) = D + ½ H = 0,23 + ½ (0,40) = 0,43 e q = f(a) = R + ½ H = 0,37 + ½ (0,40) = 0,57 A frequência esperada na descendência será, portanto, a seguinte: f(AA) = p2 = 0,432 = 18,49% f(Aa) = 2pq = 2x0,43x0,57 = 49,02% f(aa) = q2 = 0,572 = 32,49%
13
05 EQUILÍBRIO EM RELAÇÃO A ALELOS MÚLTIPLOS E A GENES LIGADOS AO SEXO 1. Alelos Múltiplos
!
Mesmo quando mais de dois alelos são considerados em um loco (alelos múltiplos), o equilíbrio é estabelecido após uma única geração de acasalamento ao acaso.
Também nesse caso, a relação genotípica da geração em equilíbrio é dada pelo quadrado da frequência dos alelos da geração original. Assim, considerando k alelos [sendo k = 1, 2, ..., s; e Ak com frequência f(Ak)], tem-se no equilíbrio a seguinte propriedade: Relação genotípica no equilíbrio = [f(A1) + f(A2) +...+ f(As)]2 Será considerada, a título de exemplo, uma série constituída por apenas três alelos: A1, A2 e A3, com frequência p, q e r, respectivamente. Os possíveis genótipos e as respectivas frequências genotípicas são dados na Tabela 4. Tabela 4 - Frequência genotípica numa população, considerando um loco gênico com três alelos (A1, A2 e A3) Genótipo
Nº de indivíduos
Frequência Genotípica
A1A1
N11
P11 = N11 / N
A1A2
N12
P12 = N12 / N
A1A3
N13
P13 = N13 / N
A2A2
N22
P22 = N22/ N
A2A3
N23
P23 = N23 / N
A3A3
N33
P33 = N33/ N
TOTAL
N
1,0
As frequências alélicas podem ser obtidas por meio destas expressões:
f(A1)= p=
14
2N11 + N12 + N13 (P + P13 ) = P11 + 12 2N 2
f(A 2 )= q=
2N22 + N12 + N23 (P + P23 ) = P22 + 12 2N 2
f(A 3 )= r=
2N33 + N13 + N23 (P + P23 ) = P33 + 13 2N 2
Após uma geração de acasalamento ao acaso, têm-se as frequências genotípicas descritas na Tabela 5. Tabela 5 - Frequência genotípica numa população em equilíbrio de Hardy-Weinberg, considerando um loco gênico com três alelos (A1, A2 e A3) Genótipo
Nº de indivíduos
A1A1 A1A2
p2 2pq
A1A3
2pr
A2A2
q2 2qr
A2A3 A3A3
r2 1,0
TOTAL pi2: para homozigotos : AiAi 2pipj:para heterozigotos: AiAj
2. Equilíbrio com relação a genes ligados ao sexo Quando se consideram genes ligados ao sexo, constata-se que o equilíbrio é alcançado na população quando as frequências dos alelos nos diferentes sexos são iguais, o que não é atingido, normalmente, em uma única geração de acasalamento ao acaso. Como ilustração, será admitida uma população na geração G0, numa espécie em que o macho é heterogamético (XY) e a fêmea é homogamética (XX). Se o gene A/a é ligado ao sexo, então são observados os seguintes genótipos: Fêmeas
Obs.
Freq.
Exemplo
Machos
XAXA
NAA NAa
D=NAA/N H=NAa/N
277 D=0,819
XAY
nA
nA/N
311
0,881
a
na
na/N
42
0,119
Naa
R=Naa/N
A a
X X
a a
XX
TOTAL
1
54
H=0,160
7
R=0,021
XY
338
Obs. Freq.
Exemplo
353
Assim, tem-se: a) Nas fêmeas f(A) = pf = D + ½ H = 0,819 + ½ 0,160 = 0,899 f(a) = qf = R + ½ H = 0,021 + ½ 0,160 = 0,101 b) Nos machos f(A) = pm = nA/N = 0,881 f(a) = qm = na/N = 0,119
15
Considerando a população como um todo, têm-se as frequências médias dadas por: f ( A) = p =
1 2 p m + p f = 0,893 3 3
f (a) = q =
1 2 q m + q f = 0,107 3 3
A diferença de frequência alélica obtida entre os machos e entre as fêmeas é dada por: d0 = pf - pm que, para o exemplo em consideração, é d0 = 0,899 - 0,881 = 0,018. A população, na geração G1, resultante do acasalamento ao acaso será formada a partir dos encontros gaméticos ilustrados a seguir: Fêmeas Machos
XA(pf)
XA(qf)
XA(pm) Xa (qm)
XAXA
XAXa
A a
X X
XaXa
Y
XAY
XaY
De forma que se tenha: Fêmeas
Frequência
Machos
Frequência
A A
D = pmpf
A
pf
A a
X X
H = pmqf + pfqm
XaXa
R = qmqf
X X
X Y XaY
qf
Agora as frequências alélicas serão dadas por: a) Nas fêmeas p m + p f 0,899 + 0,881 = = 0,890 2 2 q + q f 0,101 + 0,119 = = 0,110 f(a) = = R + ½ H = m 2 2
f(A) = = D + ½ H =
b) Nos machos f(A) = pm = pf = 0,899 f(a) = qm = qf = 0,101 Novamente, considerando a população como um todo, têm-se as frequências médias dadas por: 1 2 f ( A) = p = p m' + p 'f = 0,893 3 3
1 ' 2 ' f(a) == q q + q = 0,107 3 m 3 f
16
Constata-se que, na geração G1, a diferença entre as frequências alélicas nos machos e nas fêmeas é reduzida, sendo dada por: d1 = p 'f − p m' =
pm + p f p − pm 1 − pm = − f = − d0 2 2 2
ou seja: d1 = 0,890 – 0,899 = -0,009
Nas gerações seguintes, haverá maior aproximação para a condição de equilíbrio, de forma que o valor de d na n-ésima geração tenderá para zero e as frequências pm e pf tornar-se-ão iguais, verificando-se as relações genotípicas descritas na Tabela 3.11. Tabela 6 - Frequência genotípica numa população em equilíbrio de Hardy-Weinberg para um gene ligado ao sexo Machos Frequência
XAY p
XaY q
Fêmeas Frequência
XAXA p2
XAXa 2pq
XaXa q2
Como ilustração, será considerada uma população em que a frequência do alelo a, entre as fêmeas, dada por qf, é igual a 1, e entre os machos, dada por qm, é igual a zero. Assim, verificam-se as seguintes mudanças nas freqüências alélicas após sucessivas gerações de acasalamento ao acaso: Geração 0 1 2 3 4 5 6
qm 0 1 0,5 0,75 0,625 0,6875 0,65625
qf 1 0,5 0,75 0,625 0,6875 0,65625 0,671875
d = pf - pm = qm - qf -1 0.5 -0,25 0,125 -0,625 0,03125 -0,0015625
0,667 0,667 0,667 0,667 0,667 0,667 0,667
Considerando um gene deletério dominante ligado ao sexo (A), em que f(A) é igual a p, espera-se observar maior frequência de defeito entre as fêmeas (p2 + 2pq > p). Já para o caso de um gene deletério recessivo (b) ligado ao sexo, espera-se maior frequência de defeitos entre os machos (q > q2).
17
06 VERIFICAÇÃO DO EQUILÍBRIO DE HARDY-WEINBERG
!
Há grande importância em avaliar se determinada população, ou melhor, cada loco independente, encontra-se ou não em equilíbrio de Hardy-Weinberg. Caso isso ocorra, há indicativo de que ela não esteja sujeita à pressão de seleção e que o fluxo de migração e a taxa de mutação sejam fatores desprezíveis.
2
1. Teste de qui-quadrado ( χ ) Nesse caso, para avaliar se uma população encontra-se em equilíbrio, devem-se calcular as frequências gênicas, predizer os valores esperados para as frequências genotípicas e avaliar, por meio do teste de qui-quadrado, se os valores observados e esperados não são discrepantes, sendo, assim, indicativos de que a população se encontra em equilíbrio. Para o caso da análise de um único loco, com s alelos, as seguintes classes genotípicas e suas quantidades observadas e esperadas devem ser consideradas: Genótipo
Núm. Observado(Oij)
Núm. Esperado(Eij)
Desvio(=Oij-Eij)
A1A1
N11
2 1
pN
d11
A1A2
N12
2p1p2N
d12
A1A3
N13
2p1p3N
d13
...
...
...
...
As-1As
Ns-1, s
2ps−1psN
ds-1, s
2 s
AsAs
Ns, s
pN
ds, s
TOTAL
N
N
0
A estatística qui-quadrado é obtida por meio: s
s
χ2 =∑∑ =i 1 j≥i
! 18
(Oij − Eij )2 Eij
, que está associada ao grau de liberdade.
Para estabelecer qual o valor do grau de liberdade, o pesquisador deve determinar quais informações são necessárias previamente para serem estabelecidos os valores esperados no teste de qui-quadrado. Isso porque o grau de liberdade é igual ao número de classes avaliadas menos o número de informações necessárias.
Há casos em que é necessária somente uma informação, como o número total de indivíduos estudados. Entretanto, em outros, são necessárias mais informações, como: além do número total de indivíduos estudados, a frequência de n-1 alelos. Verifique essa diferença nos exemplos. 1.1 Exemplos para o cálculo do grau de liberdade: Cor da flor = A1A1: vermelho, A1A2: rosa, A2A2: branca. Descendentes do acasalamento ao acaso de população formada por indivíduos A1A2 Teste 1 – Ho: caráter esperado por um gene Classe
Observado
Vermelho
N1
Rosa
N2
Branco
N3
TOTAL
N = 100
Esperado
Graus de liberdade (gl) são iguais ao número de classes avaliadas menos o número de informações necessárias para se estabelecer os valores esperados no teste de qui-quadrado. Portanto, nesse caso, são necessárias informações sobre o número total de indivíduos estudados 1(N). gl=C-1(N)=2 Teste 2 – Ho: população está em EHW
!
Classe
Observado
Esperado
Vermelho
N1
p2N
Rosa
N2
Branco
N3
TOTAL
N = 100
q2N
Graus de liberdade (gl) são iguais ao número de classe avaliadas menos o número de informações necessárias para se estabelecer os valores esperados no teste de qui-quadrado.
Portanto, nesse caso, são necessárias informações sobre o número total de indivíduos estudados 1(N) e a frequência de, pelo menos, um alelo, sendo a o número de alelos avaliados e 1(p), o número de frequências necessárias. gl=C-1(N) - (a – 1(p))
+
SAIBA MAIS! Nos próximos exercícios, pretende-se verificar se as populações P1 e P2 se encontram em equilíbrio, considerando as frequências genotípicas dadas na Tabela 7.
19
Tabela 7 - Valores observados e frequências genotípicas das populações P1 e P2 para um loco com dois alelos (A e a) População 1 (p1)
População 2 (p2)
Genótipo
Ocorrência
Frequência
Ocorrência
Frequência
AA
15
0,375
15
0,350
Aa
12
0,300
16
0,400
aa
13
0,325
10
0,250
TOTAL
40
1,000
40
1,000
2. Teste da razão de verossimilhança (Teste G ou G2)
!
A razão de verossimilhança oferece um caminho sistemático para se testar o equilíbrio quando existem mais de dois alelos por loco.
O teste é baseado na razão entre duas funções de máxima verossimilhança: uma definida pelas frequências genotípicas esperadas no equilíbrio (L0) e a outra pelas frequências genotípicas observadas (L1). Admitindo que o número de ocorrência das classes genotípicas siga distribuição multinomial, as funções L0 e L1, para quaisquer k alelos autossômicos de um loco, são definidas por: Nkk
Nkk ' s nk 2 nk nk ' λ 2 L0 = ∏ 2N ∏ 2N 2N k 1 ¨k 1= = k'>k s
e
Nkk
Nkk s N kk ' L1 = λ∏ N ∏ N k 1 k 1= = s
Nkk '
k '>k
em que: - N: tamanho amostral; - nk: número de alelos k da população amostrada; e - Nkk e Nkk’: números de homozigotos e de heterozigotos amostrados, respectivamente. A expressão L0 representa as proporções p2, 2pq e q2, e a expressão L1 as proporções D, R e H. O primeiro produtório de cada função corresponde a todos os homozigotos e o segundo a todos os heterozigotos, em relação ao loco sob estudo. Para que as funções L0 e L1 tornem-se mais tratáveis para o cálculo, adota-se a função suporte de L0 e L1, que nada mais é do que o logaritmo neperiano delas, de modo que: - O teste para o equilíbrio é dado pela seguinte razão de verossimilhança:
G2 = - 2 ln L0 = −2 (lnL0 − lnL1 ) L1
20
!
Devem-se considerar alguns aspectos para o teste de qui-quadrado 2 ( χ ) e a razão de verossimilhança (teste G2). O primeiro deles é que são testes sensíveis a pequenos valores esperados nas classes genotípicas. O que se tem feito no teste de qui-quadrado é usar a correção de Yates (YATES, 1934). Contudo, em situações de alelos múltiplos, nas quais alguns apresentam frequências bem pequenas na população, a 2 proposta de correção ou, até mesmo, o uso do χ clássico pode levar a resultados inadequados (GUO; THOMPSON, 1992).
Outra solução alternativa seria agrupar classes genotípicas de modo a aumentar o número esperado de uma classe. Todavia, essa é uma solução pobre, sob o ponto de vista estatístico, pois, obviamente, há perda de informação de classes genotípicas. Diante desses impedimentos, recorre-se ao teste exato de Fisher.
+
SAIBA MAIS! Yates, F (1934). “Contingency table involving small numbers and the χ2 test”. Supplement to the Journal of the Royal Statistical Society 1(2): 217–235. https://en.wikipedia.org/wiki/Yates%27s_correction_for_continuity. Guo, S. W., Thompson, E. A. 1992. “Performing the exact test of HardyWeinberg proportion for multiple alleles”. Biometrics. 48. 361-72.
3. Teste exato de Fisher
!
Caso o tamanho amostral pequeno seja o problema, é possível calcular a exata probabilidade de todas as configurações de amostras possíveis.
Visando a esse cálculo, emprega-se o teste exato (FISHER, 1935; LEVENE, 1949; HALDANE, 1954), que é baseado na probabilidade assumida por um possível arranjo genotípico (conjunto de classes genotípicas), condicionado às frequências alélicas amostradas na população. A probabilidade condicional de cada arranjo genotípico é estimada, assumindo que as classes genotípicas seguem as proporções do equilíbrio de Hardy-Weinberg. Para elucidar, imagine o lançamento de uma moeda e observe o número de vezes que sairá cara e/ou coroa. Ao lançar a moeda dez vezes, o esperado é que saia cinco caras e cinco coroas, entretanto, outras combinações serão esperadas. Tais combinações e suas probabilidades de ocorrência estão apresentadas na Tabela 9.
21
Tabela 8 -Combinações possíveis para o lançamento de uma moeda 10 vezes e suas probabilidade Tabela 8.a número de vezes que caiu
Cara
Coroa
10 9 8 7 6 5 4 3 2 1 0
0 1 2 3 4 5 6 7 8 9 10
Tabela 8.b Prob. 0,0010 0,0098 0,0439 0,1172 0,2051 0,2460 0,2051 0,1172 0,0439 0,0098 0,0010
número de vezes que caiu
Cara
Coroa
10 0 9 1 8 2 7 3 6 4 5
0 10 1 9 2 8 3 7 4 6 5
Prob.
Pcumulativa
0,0010 0,0010 0,0098 0,0098 0,0439 0,0439 0,1172 0,1172 0,2051 0,2051 0,2460
0,0020 0,0118 0,0216 0,0655 0,1094 0,2266 0,3438 0,5489 0,7540 1,0000
aA probabilidade de cada combinação foi calculada pela distribuição binomial. Após todas as probabilidades serem calculadas (9a) para todas as possíveis combinações, elas são organizadas em ordem crescente (9b), e um ponto de corte é escolhido de tal forma que a probabilidade cumulativa de todos os resultados acima do ponto de corte seja igual a 0,05 (ou ao número menor mais próximo). Se a combinação observada estiver abaixo do ponto de corte, pode-se considerar que a moeda não é viciada.
!
Ocorre que alguns ou vários arranjos genotípicos podem ser obtidos para um particular conjunto de alelos observados, o que depende da quantidade de alelos e do tamanho da amostra (N). Assim, algumas ou várias probabilidades condicionais podem ser estimadas.
Como exemplo, considere um gene com dois alelos A e a e os números observados dos genótipos AA, Aa e aa em uma amostra igual a nAA, nAa e naa, respectivamente. O tamanho amostral total é igual a n= nAA+nAa+naa, e o número observado do alelo A igual a nA=nAA+2xnAa, e do alelo a igual a na= naa+2xnAa, para calcular a probabilidade de qualquer configuração de amostra (nAA, nAa, naa) com o número amostral fixo n e as contagens de alelos nA e na. Com a contagem de alelos fixos, as amostras são especificadas unicamente pelo número de heterozigotos observado. Assim, a probabilidade exata da configuração da amostra (nAA, nAa, naa), condicional na contagem de alelos (nA, na), é dada por P(NAa| nA) =
N! nA!(2N - nA )!2NAa [(nA − NAa ) / 2]!NAa ![N − (nA + NAa ) / 2]!(2N)!
Assim que todas as probabilidades condicionais tenham sido calculadas por todos os valores possíveis de nAa, elas serão organizadas em ordem crescente, e um ponto de corte é escolhido de tal forma que a probabilidade cumulativa de todos os resultados acima do ponto de corte seja igual a 0,05 (ou ao número
22
menor mais próximo), ou nível de significância α . A hipótese de nulidade (H0: união ao acaso dos gametas) é rejeitada quando a soma de uma parte ou de todas as probabilidades (condicionais) ordenadas, de forma crescente, for menor do que um nível de significância α preestabelecido. Ressalta-se que a probabilidade condicional proveniente do arranjo genotípico da amostra original também deve ser inserida no ordenamento. Para ilustrar o teste exato, serão considerados novamente os dados das populações P1 e P2 com 40 indivíduos de genótipos AA, Aa e aa, nas frequências D, H e R, respectivamente. Para o cálculo das P(NAa|nA), devem-se considerar as seguintes informações: População
N
na
P1
40
42
P2
40
44
Tabela 9 -Arranjos genotípicos para a população P1, com 40 indivíduos, com resultados do teste exato de Fisher (P(NAa|nA) e P(Acum)), do teste de qui-quadrado ( χ 2 e P(χ 2 ) ) e do teste do desvio da frequência de homozigotos (DA e z) AA
Aa
aa
P(NAa|nA)
P(Acum)
χ2
P(χ2 )
DA
z
21
0
19
0,0
0,0*
40,0000
0,00000*
0,2494
6,3245*
20
2
18
0,0
0,0*
32,3800
0,00000*
0,2244
5,6905*
2
38
0
0,0
0,0*
32,7437
0,00000*
-0,2256
-5,7222*
19
4
17
0,0
0,0*
25,5679
0,00001*
0,1994
5,0564*
3
36
1
0,0
0,0*
25,8895
0,00001*
-0,2006
-5,0881*
18
6
16
0,00001
0,00001*
19,5579
0,00001*
0,1744
4,4224*
4
34
2
0,00001
0,00002*
19,8393
0,00001*
-0,1756
-4,4541*
17
8
15
0,00011
0,00013*
14,3519
0,00015*
0,1494
3,7883*
5
32
3
0,00019
0,00032*
14,5931
0,00013*
-0,1506
-3,8200*
16
10
14
0,00130
0,00162*
9,94994
0,00161*
0,1244
3,1543*
6
30
4
0,00196
0,00358*
10,1509
0,00144*
-0,1256
-3,1860*
15
12
13
0,00880
0,01238*
6,3519
0,01173*
0,0994
2,5203*
7
28
5
0,01220
0,02457*
6,5127
0,01071*
-0,1006
-2,5520*
14
14
12
0,03770
0,06228
3,5580
0,05926
0,0744
1,8862
8
26
6
0,04802
0,11030
3,6786
0,05511
-0,0756
-1,9179
13
16
11
0,10557
0,21587
1,5680
0,21049
0,0494
1,2522
9
24
7
0,12386
0,33973
1,6484
0,19917
-0,0506
-1,2839
12
18
10
0,19734
0,53707
0,3821
0,53645
0,0244
0,61819
10
22
8
0,21366
0,75073
0,4223
0,51576
-0,0256
-0,64989
11
20
9
0,24927
1,00000
0,0002
0,98735
-0,0006
-0,01585
*Rejeita-se a H0 a 5% de significância.
23
Tabela 10 -Arranjos genotípicos para a população P2, com 40 indivíduos, com resultados do teste exato de Fisher (P(NAa|nA) e P(Acum)), do teste 2 de qui-quadrado ( χ e P(χ 2 ) ) e do teste do desvio da frequência de homozigotos (DA e z) χ2
P(χ2 )
AA
Aa
aa
P(NAa|nA)
P(Acum)
DA
z
22
0
18
0,0
0,0*
40,0000
0,0*
0,2475
6,3245*
21
2
17
0,0
0,0*
32,3273
0,0*
0,2225
5,6857*
4
36
0
0,0
0,0*
26,7769
0,0*
-0,2025
-5,1746*
20
4
16
0,0
0,0*
25,4709
0,0*
0,1975
5,0468*
5
34
1
0,0
0,0*
20,5734
0,00001*
-0,1775
-4,5357*
19
6
15
0,00001
0,00001*
19,4309
0,00001*
0,1725
4,4080*
6
32
2
0,00013
0,00014*
15,1862
0,00010*
-0,1525
-3,8969*
18
8
14
0,00013
0,00027*
14,2067
0,00016*
0,1475
3,7691*
17
10
13
0,00144
0,00170*
9,7999
0,00175*
0,1225
3,1303*
7
30
3
0,00151
0,00321*
10,6152
0,00112*
-0,1275
-3,2581*
16
12
12
0,00962
0,01283*
6,2075
0,01272*
0,0975
2,4914*
8
28
4
0,01026
0,02309*
6,8605
0,00881*
-0,1025
-2,6192 *
15
14
11
0,04059
0,06368
3,4323
0,06393
0,0725
1,8526
9
26
5
0,04308
0,10676
3,9220
0,04766*
-0,0775
-1,9804 *
14
16
10
0,11162
0,21838
1,4733
0,22482
0,0475
1,2138
10
24
6
0,11667
0,33505
1,7998
0,17973
-0,0525
-1,3415
13
18
9
0,20427
0,53932
0,3305
0,56532
0,0225
0,5749
11
22
7
0,2091
0,74842
0,4938
0,48223
-0,0275
-0,7027
12
20
8
0,25158
1,00000
0,0041
0,94906
-0,0025
-0,0638
*Rejeita-se a H0 a 5% de significância.
Pelas Tabelas 9 e 10, verifica-se que o arranjo genotípico da população P1 encontra-se entre aqueles com probabilidade acumulada inferior a 5%. Assim, deve-se considerá-lo incompatível com a situação esperada de equilíbrio, prevista a partir do número de alelos A da população e da quantidade de heterozigotos observada. O nível crítico associado à hipótese é de 0,01238 (1,238%). Para a população P2, constata-se que o arranjo genotípico está entre aqueles esperados para uma população em equilíbrio de Hardy-Weinberg, com base na sua quantidade de alelo A e de heterozigotos observados, e seu nível crítico de probabilidade atinge valor de 0,2183 (21,83%), acima de 5%. Generalizando para s alelos, a probabilidade de um arranjo com a quantidade genotípica Nkk’ de heterozigotos (para k < k’), condicionado às quantidades alélicas observadas (nk’s) provenientes de s alelos, é expressa por: P [(Nkk ' ) (nk )] =
N! 2H
∏ (n )! k aj
(2N)! ∏ (Nkk ' )! k ≤ k'
24
k
∑∑ N
em que H =
k k '≠k
kk '
é o número de indivíduos heterozigotos na população.
Na situação em que o tamanho amostral da população é grande e o loco investigado possui vários alelos, tem-se elevado número de arranjos genotípicos possíveis (ou tabelas de contingência) e as probabilidades condicionais são muito pequenas, embora a quantidade relevante seja a soma das probabilidades, a qual representa o valor de α . Para contornar esse problema, Guo e Thompson (1992) propuseram uma versão permutada para se obter o valor de α . O processo baseia-se na desestruturação de todos os N genótipos (indivíduos) da população amostrada, de maneira que pares de alelos são tomados aleatoriamente até que os indivíduos sejam reconstituídos novamente. Esse processo é repetido inúmeras vezes. Sob equilíbrio de Hardy-Weinberg, os alelos estariam distribuídos independentemente nos genótipos. Assim, um arranjo genotípico encontrado pelo processo de permutação (embaralhamento dos alelos) corresponderia a um dos possíveis arranjos a serem encontrados sob equilíbrio. O valor de α (área de rejeição) é dado pela proporção de arranjos genotípicos (ou tabelas de contingência) que tiveram as probabilidades condicionais menores ou iguais à probabilidade condicional do arranjo genotípico observado. O teste exato apresenta algumas particularidades interessantes, como: (i) não fazer uso de distribuição assintótica; (ii) trata-se de uma distribuição de probabilidade independente de parâmetros sobre a hipótese de nulidade - importante requerimento que, junto com (i), leva ao uso de distribuições condicionais particulares, como a apresentada por Haldane (1954), que independe das frequências (alélicas e genotípicas) paramétricas; e (iii) usa as probabilidades de uma particular configuração (arranjos genotípicos) como um teste estatístico (ROUSSET; RAYMOND, 1995). Levene (1949) também mostra que probabilidades condicionais podem ser obtidas por uma razão de verossimilhança entre a função de verossimilhança de uma particular amostra S e a soma dessa função de todas as possíveis amostras. Assim, a distribuição condicional de qualquer estatística sobre a hipótese de nulidade pode ser computada. Variados testes estatísticos apontam diferentes ordenamentos das possíveis amostras, porém o valor de é definido igualmente como a soma de probabilidades exatas de amostras de ordem mais extrema, de modo que todos os testes são exatos (ROUSSET; RAYMOND, 1995).
+
SAIBA MAIS! FISHER, R. A. The logic of inductive inference. J. Roy. Stat. Soc. v.98, p. 39-54, 1935. GUO, S. W, THOMPSON, E. A. Performing the exact test of Hardy-Weinberg proportion for multiple alleles. Biometrics. v. 48, p. 361-372, 1992. HALDANE, J. B. S. An exact test for randomness of mating. Journal of Genetics. v. 52, p. 631-635, 1954. LEVENE, H. On a matching problem arising in genetics. Annals of mathematical statistics. v. 21, p. 91–94, 1949. ROUSSET, F.; RAYMOND, M. Testing heterozygote excess and deficiency. Genetics. v. 140, p. 1413-1419, 1995.
25
4. Teste Z Pode-se considerar que, se não houver equilíbrio de Hardy-Weinberg, alguma força seletiva atuará, contribuindo para o acréscimo de homozigotos ou de heterozigotos. Para dois locos, seriam esperadas as frequências genotípicas listadas na Tabela 11. Tabela 11 - Frequência genotípica numa população em desequilíbrio Genótipo
Frequência observada
Frequência esperada
AA
ˆAA = NAA/N P A a
p2 + DA
Aa
ˆ = NAa/N P A a Aa
2pq – 2DA
aa
ˆ = N /N P A a aa aa
q2 + DA
O valor de taxa de desequilíbrio (DA) é dado por:
Dˆ A = PˆA. A − pˆ 2 É possível realizar o teste de hipótese Ho: DA = 0 vs Ha: DA estatística z, dada por:
z=
ˆ D A ˆ V D
≠
0 por meio da
( ) A
Se o valor absoluto de z excede 1,96, rejeita-se a hipótese de que a proporção de homozigotos observada está em conformidade com o esperado sob hipótese de equilíbrio de Hardy-Weinberg. O teste apresentado é bilateral, de forma que, ao rejeitar H0, não é possível afirmar que exista excesso ou falta de homozigotos na população. Hipóteses alternativas a Ho: DA = 0 podem ser Ha: DA > 0, de forma que a rejeição de H0 significará assumir excesso de homozigotos, ou Ha: DA < 0, cuja rejeição de H0 significará falta de homozigotos. Ambas serão significativas, a 5% de probabilidade, em teste unilateral quando o valor de z for maior que 1,64.
26
07 LIGAÇÃO E DESEQUILÍBRIO DE LIGAÇÃO 1. Equilíbrio com relação a mais de um gene
!
O estabelecimento das condições de equilíbrio depois de uma geração de acasalamento ao acaso é verdadeiro para todos os locos quando considerados isoladamente, mas não o é para genótipos referentes a dois ou mais locos considerados conjuntamente, o que conduz a um outro conceito importante na genética de populações, denominado de desequilíbrio gamético.
O termo desequilíbrio gamético também tem sido referido como desequilíbrio de ligação, desequilíbrio de fase gamética e associação alélica (FLINT-GARCIA et al., 2003). Trata-se da associação não-aleatória de alelos de diferentes locos nos gametas. Em uma população panmítica, com locos segregando independentemente, na ausência de forças evolutivas, locos polimórficos estarão em equilíbrio gamético (FALCONER; MACKAY, 1996). O conhecimento do desequilíbrio permite elucidar fenômenos genéticos e evolutivos ocorridos ao longo de gerações nas populações ou espécies. Como ilustração, considera-se uma população e as informações em relação a dois genes A/a e B/b. Os gametas produzidos pela população, na geração 1 tomada como referência, são dados por: Gameta
Frequência
AB
P11(1)*
Ab aB
P10(1) P01(1)
Ab P00(1) * P11(1) é a frequência do gameta formado por alelos de um dos pais; P00(1) é a frequência do gameta formado por alelos do outro pai. Da mesma forma, P10(1) e P01(1) são as frequências dos gametas formados por alelos de pais diferentes.
de:
O desequilíbrio de fase gamética é, nesta população, quantificado por meio
r = P11(1)P00(1) - P10(1)P00(1) 2. Ligação e desequilíbrio de ligação Para entender melhor essa situação, considere dois genes, cada um com dois alelos A/a e B/b e suas frequências alélicas pA/qa e pB/qb, respectivamente. Se for assumido que o acasalamento é ao acaso, as frequências gaméticas e a
27
associação aleatória desses alelos na formação dos gametas estão representadas na tabela a seguir. Quando os alelos dos genes estão em associação aleatória, a frequência de um gameta carregando qualquer combinação particular de alelos é igual ao produto das frequências desses alelos. Os genes que estão em associação aleatória estão em equilíbrio de ligação, e genes que não estão em associação aleatória estão em desequilíbrio de ligação (HARTL e CLARK, 2010).
Frequências gaméticas e a associação aleatória desses alelos na formação dos gametas Gametas produzidos
Gametas produzidos
A
a
Frequência
pA
qa
AB: pA x pB
B
pB
AB pApB
aB pBqa
Ab: pA x qb
b
qb
Ab pApb
ab qaqb
aB: qA x pb ab: qA x qb
Quando em populações que se submetem às premissas do equilíbrio de Hardy-Weinberg, os genes que se encontram em desequilíbrio de ligação alcançam o equilíbrio. Entretanto, esse equilíbrio não é obtido apenas com uma geração de acasalamentos ao acaso e, sim, gradualmente, tendo a intensidade de ligação reduzida a cada geração. A taxa de aproximação do equilíbrio de ligação depende da taxa de recombinação dos genótipos. Essa aproximação lenta do equilíbrio de ligação contrasta com o alcance do equilíbrio de Hardy-Weinberg por alelos de um único gene, que tipicamente requer apenas uma geração. Como ilustração, considera-se uma população e as informações em relação a dois genes A/a e B/b. Os gametas produzidos pela população, na geração 1 tomada como referência, são dados por: Gametas
Frequência
AB
P11(1)
Ab
P10(1)
aB
P01(1)
Ab
P00(1)
Esses gametas são de dois tipos: AB e ab são gametas não recombinantes, porque os alelos estão associados da mesma maneira que na geração anterior; já os gametas Ab e aB são recombinantes, porque os alelos estão associados de modo diferente da geração anterior. O desequilíbrio de fase gamética é dado pela diferença desses dois tipos de gametas, ou seja, a frequência dos gametas não recombinantes menos a frequência dos gametas recombinantes, que nesta população, é quantificado por meio de:
D = P11(1)P00(1) – P10(1)P01(1)
Dessa forma, as frequências gaméticas são influenciadas pelas frequências alélicas e pela taxa de desequilíbrio de ligação da geração, ficando: P11(n) = pA pB + Dn P10(n) = pA qb - Dn P01(n) = qa pB - Dn P00(n) = qa qb + Dn Sendo: P11+P10+P01+P00=1
28
Assim, se forem considerados dois alelos para cada um de dois genes codominantes (f(A) = pA; f(a) =qa; f(B) = pB; f(b) = qb), ocorrem as seguintes expectativas de frequências genotípicas: Genótipo
Frequência
Esperado
Observado
AABB
(pApB + D)
n1
AABb
2(pApB + D)(pAqb - D)
n2
AAbb
(pAqb - D)2
n3
AaBB
2(pApB + D)(qapB - D)
n6
AaBb
2[(pAqb - D)(qapB - D)+(pApB + D)(qaqb + D)]
n5
Aabb
2(pAqb - D)(qaqb + D)
n6
aaBB
(qapB - D)2
n7
aaBb
2(qapB - D)(qaqb + D)
n8
aabb
(qaqb + D)2
n9
2
Como os valores de pA, qa, pB e qb, são facilmente obtidos em uma população, torna-se possível estimar o valor de D por método de máxima verossimilhança, admitindo que o número de ocorrência das classes genotípicas segue distribuição multinomial, dada por:
N! n9 L(p A ,qa ,pB ,qb , ∆;ni ) = p1n1pn2 2 ...p9 n1 !n2 !...n9 ! em que p1, p2, ..., p9 são as frequências observadas das classes genotípicas. A hipótese de nulidade é testada por uma razão de verossimilhança, definida por: , em que: L0: função de verossimilhança considerando a hipótese de nulidade D = 0; e L1: função de verossimilhança considerando a hipótese alternativa D 0, ou seja, levando-se em conta o valor de D estimado. Se L1 > L0, o LOD escore é positivo. Conclui-se que os locos estão em desequilíbrio quando o LOD é maior que 3, ou seja, probabilidade de 1.000 para 1. Como exemplo, considera-se dois locos A/a e B/b e os seguintes valores observados das classes genotípicas:
29
Genótipo
Esperado
Número observado
AABB
(pApB + D)
n1 = 13
AABb
2(pApB + D)(pAqb - D)
n2 = 4
AAbb
(pAqb - D)2
n3 = 2
AaBB
2(pApB + D)(qapB - D)
n6 = 12
AaBb
2[(pAqb - D)(qapB - D)+(pApB + D)(qaqb + D)]
n5 = 8
Aabb
2(pAqb - D)(qaqb + D)
n6 = 3
aaBB
(qapB - D)2
n7 = 4
aaBb
2(qapB - D)(qaqb + D)
n8 = 3
aabb
(qaqb + D)2
n9 = 1
2
Para esse par de locos, o valor máximo do coeficiente de desequilíbrio será de 16,5% e o valor estimado de D é 2,5%, conforme ilustrado graficamente na Figura 1.
Figura 1 - Representação gráfica do comportamento do coeficiente de desequilíbrio gamético (D) e os respectivos valores de LOD escore, do exemplo anterior. Observe que o valor de LOD máximo (LODmax = 0,169) é obtido quando se tem D = 2,5 %
O valor máximo de D (D max) está compreendido nos seguintes intervalos: mín [(pApB); (qaqb)] se D > 0; e - máx [(pAqb); (qapB)] se D < 0 Para esse exemplo, tem-se: pA = 0,61 e qa = 0,39 pB = 0,73 e qb = 0,27 logo, tem-se: D max = min [(pAqb); (qapB)] = min[(0,61)(0,27);(0,39)(0,73)] = min(0,1647 ; 0,2847) = 0,16477 Se a causa do desequilíbrio gamético fosse unicamente a ligação fatorial, a distância entre os locos poderia ser estimada por meio da expressão:
30
Para o exemplo, tem-se:
Outras medidas de desequilíbrio apresentadas na literatura são: Estatística r2 Uma medida do desequilíbrio, denotada r2, é fornecida por:
de forma que, no exemplo, tem-se:
Estatística D’ A estatística D’ é calculada como:
de forma que, no exemplo, tem-se:
As estatísticas r2 e D’ refletem diferentes aspectos do desequilíbrio de ligação e comportam-se diferentemente sob condições variadas. Numa população (experimental) F2, em que todas as classes genotípicas estão representadas, o desequilíbrio será máximo e expresso por:
Se d = 0, o valor de D será de 25%, e se d = 0,5 (50 cMorgans), o desequilíbrio de fase gamética provocado pela ligação fatorial será nulo.
31
+
SAIBA MAIS! SÁNCHEZ, C. F. B. Seleção Genômica Ampla em Populações Derivadas de Acasalamento ao Acaso ou de Autofecundação. Tese (Doutorado em Genética e Melhoramento). UFV. 2013
3. Desequilíbrio após gerações de acasalamento ao acaso O equilíbrio de fase gamética não é obtido em apenas uma geração de acasalamento ao acaso, mas sua intensidade é reduzida a cada geração. Assim, pode-se considerar determinada geração em que os genótipos encontrados e suas respectivas frequências são dados no exemplo apresentado. Nele, consideraram-se dois genes ligados cuja porcentagem de recombinação é igual a d. Genótipo
Frequência
AB/AB AB/Ab AB/aB AB/ab Ab/Ab Ab/aB Ab/ab aB/aB aB/ab ab/ab
Os gametas produzidos pela população são mostrados a seguir, omitindo-se o indexador que caracteriza a geração analisada: Gametas Genótipo
AB/AB AB/Ab AB/aB AB/ab Ab/Ab
32
Frequência
AB
Ab
aB
ab
Ab/aB Ab/ab aB/aB aB/ab ab/ab
As frequências dos gametas produzidos seriam: f(AB) = P11(2) =
+ P11P01 + P11P01 + (1-d) P11P00 + r P10P01
= P11 (P11 + P10 + P10 + P00) - d(P11 P00 – P10 P01) = P11(1) - d D1 de maneira análoga, tem-se: f(11) = P11(2) = P11(1) - dD1 f(10) = P10(2) = P10(1) + dD1 f(01) = P01(2) = P01(1) + dD1 f(00) = P00(2) = P00(1) - dD1 Com as frequências gaméticas conhecidas, obtêm-se as frequências genotípicas da descendência obtida por acasalamento ao acaso, da mesma forma que para a geração anterior. Com o acasalamento ao acaso, as frequências alélicas permanecem, porém, após uma geração de acasalamento ao acaso, houve maior quebra do bloco gênico, de forma que a frequência dos gametas paternais diminuiu com o aumento relativo das formas recombinantes.
!
O valor de D reduz-se à metade a cada geração de acasalamento ao acaso para dois genes independentes. Contudo, se os genes estiverem ligados, a velocidade de decréscimo do valor de D será reduzida e o equilíbrio só será atingido com número maior de gerações de acasalamento ao acaso.
De forma generalizada, tem-se: Dn = (1 - d)n-1D1 O desequilíbrio é dependente da taxa de recombinação (d) e, quanto maior a taxa de recombinação, mais rápida será a aproximação do equilíbrio entre os dois locos. Se os genes são independentes, tem-se d =0,5 e, portanto: Dn = (1/2 )n-1D1 Se o valor de n é suficientemente grande, tem-se: Dn = (1 - d)n-1D1 = 0 E, nessa situação, atinge-se o equilíbrio de ligação, de forma que se tenha: P11(n) = pA pB + Dn = pA pB
33
P10(n) = pA qb - Dn = pA qB P01(n) = qa pB - Dn = qa pB P00(n) = qa qb + Dn = qa qb Os mecanismos que promovem desequilíbrio gamético são a seleção, a ligação fatorial e A deriva genética, aleatória e não aleatória (RIDLEY, 2006). Se a seleção favorece indivíduos com combinações particulares de alelos, ela produz desequilíbrio gamético. Em locos ligados, é necessário um número maior de gerações para que a recombinação realize a sua função de tornar as associações genéticas aleatórias. Locos fracamente ligados não irão apresentar desequilíbrio de ligação por muito tempo. Na ausência de seleção e em uma população infinita e de cruzamentos aleatórios, a quantidade de desequilíbrio de ligação sofre uma queda exponencial a uma taxa igual à de recombinação entre dois locos. Processos aleatórios possuem a propriedade interessante de serEM capazes de causar desequilíbrio de ligação persistente, não apenas transitório. Se a deriva genética produz excesso de determinado gameta (haplótipo) em uma geração, o desequilíbrio gamético terá aparecido. Acrescenta-se que isso pode ser verdadeiro, considerando todos os possíveis haplótipos: a amostragem aleatória que produz excesso de qualquer tipo gamético irá perturbar o estado de equilíbrio (RIDLEY, 2006). Essas associações persistem por mais tempo em locos fortemente ligados, de modo que, quanto mais elevada for a taxa de recombinação, mais rápida será a destruição da associação. Entretanto, como a taxa de recombinação entre dois locos diminui, o tempo em que os alelos podem estar associados entre si de forma não aleatória aumenta (RIDLEY, 2006). Outro fator gerador de desequilíbrio gamético diz respeito aos cruzamentos não aleatórios ou preferenciais. Geralmente, o desequilíbrio reduz-se mais rapidamente em espécies alógamas, quando comparado com espécies de autofecundação (NORDBORG, 2000). Cruzamentos não aleatórios proporcionam aumentos (ou diminuição) de certos haplótipos, fazendo com que haja frequência em excesso (ou deficiência) em relação a situações de cruzamentos aleatórios. A alta homozigosidade dos genes, em espécies autógamas, implica que a recombinação raramente resultará em novos haplótipos que ainda não estão presentes nos parentais. A predominância de autofecundação tende a retardar a proximidade do equilíbrio gamético, porque para atingi-lo são necessárias recombinações entre duplos heterozigotos, que são raros nas populações autógamas (HARTL; CLARK, 1997). Outro fator, como fluxo gênico entre indivíduos de populações geneticamente distintas seguido por intercruzamentos, resulta na introdução de diferentes informações de genéticas de ancestrais e diferentes frequências alélicas. Frequentemente, o resultado do desequilíbrio se estende a sítios não ligados, mesmo em diferentes cromossomos, mas que são quebrados rapidamente com o processo de acasalamento ao acaso (PRITCHARD; ROSENBERG, 1999).
+
SAIBA MAIS! RIDLEY, M. Evolução. 3ª edição. Artmed: São Paulo, 2006 HARTL, Daniel L.; CLARK, Andrew G.; CLARK, Andrew G. Principles of population genetics. Sunderland: Sinauer associates, 1997. PRITCHARD, Jonathan K.; ROSENBERG, Noah A. Use of unlinked genetic markers to detect population stratification in association studies. The American Journal of Human Genetics, v. 65, n. 1, p. 220-228, 1999. NORDBORG, M. Linkage Disequilibrium, Gene Trees and Selfing: An Ancestral Recombination Graph With Partial Self-Fertilization. Genetics February 1, 2000 vol. 154 no. 2 923-929
34
08 ACASALAMENTOS Conhecer o sistema de acasalamento de uma população ou espécie permite delinear estratégias de conservação, melhoramento e manejo sustentado. De acordo com Liu (1997), as populações obtidas por cruzamentos controlados entre genitores selecionados podem ser consideradas como autênticas populações de melhoramento ou experimentais. Nelas, a estrutura e variabilidade genética são previsíveis, se não conhecidas. Assim, o melhorista tem a possibilidade de predizer mudanças em magnitude e sentido desejados e formular hipóteses acerca do seu comportamento genético. Enquadram-se aí as populações de híbridos F1, gerações avançadas Fn (ou Sn) e retrocruzamentos, entre outras. Essas populações, ao serem obtidas, passam por seleções e avaliações, até que se tornem de uso comercial. As populações naturais são aquelas geradas por acasalamentos ocorridos naturalmente, ou seja, sem controle artificial. São unidades sobre as quais incide o manejo para a conservação e utilização dos recursos naturais, além de fonte de germoplasma para os programas de melhoramento genético (ROBINSON, 1998). Algumas espécies podem ser geradas por acasalamentos preferenciais ou, mesmo, por completa autofecundação, em vez de unicamente pelo acasalamento ao acaso. Exemplos de populações naturais são dados por famílias de meios-irmãos, populações mistas cujos indivíduos são derivados de polinização cruzada e autopolinização e populações com sobreposição de gerações (LIU, 1997). Os cruzamentos aqui considerados são: • Cruzamentos direcionados; • Autofecundações; • Acasalamento ao acaso. Como ilustração, serão consideradas duas populações P1 e P2, com a seguinte constituição genotípica: Genótipo
P1
P2
AA
20
50
Aa aa
30
50
50
0
+
SAIBA MAIS! LIU, Ben Hui. Statistical genomics: linkage, mapping, and QTL analysis. CRC press, 1997. ROBINSON, I. P.; ALFENAS, A. C. Aloenzimas na genética de populações de plantas. Eletroforese de isoenzimas e proteínas afins: fundamentos e aplicações em plantas e microorganismos. Viçosa, MG: UFV, p. 329-368, 1998.
35
1. Hibridação entre P1 e P2 A hibridação, ou cruzamento direcionado, tem sido utilizada rotineiramente no melhoramento genético com a intenção de reunir genes favoráveis presentes em ambos os genitores.
!
No melhoramento genético, procura-se cruzar materiais genéticos superiores e que exibam diversidade genética de forma que o híbrido obtido manifeste vigor, ou heterose, e que as populações segregantes avançadas manifestem ampla variabilidade a ser explorada por técnica seletiva.
Em muitos casos, são encontrados na população F2 e em outras segregantes, indivíduos transgressivos cujo valor fenotípico está além ou aquém dos limites estabelecidos pelos genitores. Com conhecimentos adquiridos em genética de populações, a frequência dos genótipos na população híbrida poderá ser facilmente estimada considerando as expressões:
f ( A) = p = D + e
f (a) = q = R +
1 H 2 1 H 2
Assim, para as populações P1 e P2, tem-se: - Para P1: f(A) = p1 =0,35 e - Para P2: f(A) = p2 =0,75 e
f(a) = q1 = 0,65 f(a) = q2 = 0,25
logo: Genótipos em F1 = P1xP2
Esperado
Frequência
AA
p1p2
D’ =
Aa aa
p1q2 +p2q1
H’ =
q1q2
R’ =
Algumas informações importantes relativas à população híbrida (F1) são: - Frequência alélica: É interessante observar que a frequência alélica da população híbrida é igual à média das frequências alélicas das populações genitoras, ou seja:
f(A) = ph = D'+ e
f(a) = qh = R '+
1 1 p + p2 H' = p1p2 + (p1q2 + p2q1) =1 2 2 2 1 1 q + q2 H' = q1q2 + (p1q2 + p2q1) =1 2 2 2
No exemplo, tem-se:
f ( A) = p h
36
e
f (a) = q h
- Média de uma população híbrida: O cruzamento entre duas populações em equilíbrio de Hardy-Weinberg produzirá uma população híbrida, cujo valor esperado da média será:
= µH
µP1 + µP2 +h 2
sendo h o valor da heterose manifestada no cruzamento, dada por:
h =µH −
µP1 + µP2 =d(p1 − p2 )2 2
Pela expressão anterior, fica evidente que a heterose manifestada em populações híbridas é função direta do valor genotípico do heterozigoto (d), expresso pelo grau médio de dominância, e da diferença de frequência gênica, ou da diversidade genética, entre as populações intercruzadas. Também é compreensível que a heterose será máxima quando um alelo for fixo em uma população e o outro na outra população; se as populações não diferirem em frequência gênica, não haverá heterose. Com base nessa expressão, têm sido fundamentados muitos estudos de avaliação da diversidade genética entre populações, à procura daqueles de bons desempenhos e que exibam diversidade, recomendando-se seus cruzamentos com a expectativa de que a população híbrida manifeste heterose e que as populações dela derivadas apresentem variabilidade e indivíduos transgressivos. Segregantes transgressivos são aqueles manifestados em populações segregantes, cujos valores fenotípicos superam os limites estabelecidos pelas populações genitoras. - Variabilidade em uma população híbrida: Na Figura 2, são apresentadas curvas que descrevem o comportamento da variância genotípica, aditiva e devida aos desvios da dominância, em função da frequência genotípica em três diferentes situações de dominância (d/a, em que d e a são os valores genotípicos do heterozigoto Aa e homozigoto AA, respectivamente).
Figura 2 - Comportamento da variância genotípica (VG), aditiva (VA) e devida aos desvios da dominância (VD), em função da frequência gênica p, em três diferentes situações de relação de dominância (d/a)
Fica evidente a relação quadrática (no sentido de equação do 2º grau) entre os valores de variância e os da frequência gênica da população. Assim, como a frequência gênica da população híbrida é intermediária, tem-se que a variabilidade nesta população também será intermediária à variância dessas populações genitoras quando ambas apresentarem frequência gênica acima
37
ou abaixo do máximo esperado. Entretanto, o cruzamento entre populações genitoras com grande diferença de frequência gênica poderá proporcionar população híbrida cuja variabilidade poderá ser bem maior que a apresentada em qualquer uma de suas populações genitoras.
2. Autofecundação em P1 A autofecundação é um processo de propagação sexuado, que se verifica naturalmente em muitas espécies vegetais autógamas, que contam com os aparelhos reprodutores, masculino e feminino, numa mesma planta.
!
É utilizado em programas de melhoramento, com vistas à obtenção de linhagens homozigóticas, para a produção de híbridos heteróticos a partir de seus intercruzamentos.
Uma maneira de visualizar as consequências da autofecundação em sucessivas gerações é apresentada na Figura 3. Nesse esquema, considera-se que cada indivíduo autofecundado deixa quatro descendentes para a próxima geração. O estabelecimento de um número fixo de descendentes torna possível quantificar o total de heterozigotos e homozigotos em cada geração.
Figura 3. Frequência de homozigotos e heterozigotos em sucessivas autofecundações realizadas em populações derivadas da F1 com 100% de heterozigotos
No esquema apresentado, constata-se que há aumento da frequência de homozigotos a cada geração, enquanto a frequência de heterozigotos reduz-se à metade. Após sete gerações de autofecundações sucessivas em uma população originalmente constituída por apenas heterozigotos, têm-se mais de 99% de homozigotos. A frequência de heterozigotos a cada geração de autofecundação pode ser
38
estimada por meio da seguinte expressão: t
1 f (H t ) = f (H 0 ) 2
em que:
f(Ht ) : Frequência de heterozigotos após t gerações de autofecundações; e
f(H0 ) : Frequência inicial de heterozigotos. A frequência de homozigotos (f(D) e f(R) para os homozigotos dominantes e recessivos, respectivamente) na t-ésima geração de autofecundação também pode ser estimada por meio de:
f ( Dt ) = f ( D0 ) + e
f ( R n ) = f ( R0 ) + sendo ∆ geração.
1 ∆ 2 1 ∆ 2
= f ( H 0 ) − f ( H t ) a perda na frequência de heterozigotos na t-ésima
A velocidade do acréscimo da frequência de homozigotos e do decréscimo de heterozigotos, com sucessivas gerações de autofecundações, é ilustrada na Figura 3.4. Novamente se verifica nesse gráfico que, após sete gerações de autofecundações, há praticamente 100% de homozigotos (e frequência nula de heterozigotos) na população.
Figura 4. Alteração na frequência de heterozigotos e homozigotos, após sucessivas gerações de autofecundação
No exemplo, considerando a população P1, realize as autofecundações, e observe as descendências. Essa população descendente é facilmente predita, sabendo-se que a cada geração de autofecundação a frequência de heterozigotos reduz-se à metade. Assim, a frequência que originalmente é 0,30 passa para 0,15. O restante (0,15) é distribuído equitativamente entre os homozigotos. Logo, a frequência de AA torna-se 0,20 + ½(0,15) = 0,275, e a de aa, 0,5+½(0,15)=0,575
39
Assim, a população autofecundada terá a seguinte constituição: Genótipos
Frequência
AA
0,275
Aa aa
0,150 0,575
Se uma população de heterozigotos (100% Aa) é autofecundada, a descendência (F1) será formada por 50% de heterozigotos e 50% de homozigotos (AA + aa). Assim, em apenas uma geração de autofecundação a frequência de heterozigotos reduz-se à metade. Esse fato se verifica nas gerações seguintes, ou seja, se a F1 for novamente autofecundada, ter-se-á: Para facilitar esta observação vá novamente a diversos 1 no Gpop, selecione como Pai 1 o P2(H) e autofecunde o pai, adiciona os resultados dos descendentes, e autofecunde novamente. Descendência
Genótipos da F1 que se autofecundam
Probabilidade da autofecundação
AA
AA
0,25
0,25
Aa aa
0,50
0,125
0,25
TOTAL
1
Aa
aa
0,25
0,125 0,25
0,375
0,25
0,375
Verifica-se que, agora, a frequência de heterozigotos, reduzida à metade, é de 25%. Os 25% restantes são distribuídos equitativamente para os respectivos homozigotos AA e aa. Algumas informações importantes relativas à população obtida por autofecundação: - Frequência alélica As frequências genotípicas em uma população antes e após sucessivas gerações de autofecundação são apresentadas na Tabela 12. Tabela 12 - Frequências genotípicas em população antes e após n gerações de autofecundação
∆
Genótipos
Inicial
Após autofecundações
AA
D0
Dn = D0 + ½
Aa aa = H0 - Hn
H0
Hn = (½)n H0
R0
Rn= R0 + ½
∆ ∆
Assim, constata-se que, originalmente, a frequência alélica é dada por: e Após as autofecundações, obtém-se:
e
40
ou seja, a autofecundação não altera a frequência gênica da população original. 2.1 Média de uma população resultante de autofecundação Considerando ainda os valores apresentados na Tabela 12 e admitindo um loco em que os valores genotípicos são u+a, u+d e u-a para AA, Aa e aa, respectivamente, os valores das médias das populações podem ser obtidos por meio de:
µ0 = u + a(D0 − H 0 ) + dH0 e
µn =u + a(Dn − H n ) + dHn =µ0 − d∆
!
Pela expressão anterior, fica evidente que a média de uma população é afetada pela perda de heterozigoto e pelo valor genotípico apresentado por ele. Geralmente, o valor de d é positivo e, consequentemente, a maioria dos caracteres apresentará redução em seus valores médios, sendo tal fato atribuído à depressão por endogamia.
Entretanto, em algumas situações, o valor de d será negativo quando houver dominância do fenótipo de menor grandeza e, neste caso, a média terá acréscimo após processo de autofecundação. O valor da perda de heterozigoto poderá ser expresso pelo coeficiente de endogamia da população, denotado por F. - Variabilidade em uma população resultante da autofecundação A variância genética numa população não-endogâmica e em equilíbrio de Hardy-Weinberg é dada por: em que: : variância aditiva; e : variância atribuída aos desvios da dominância. Com a autofecundação, cujo efeito é quantificado pelo coeficiente de endogamia F, a variância genética da população aumenta, sendo dada por: σG2 =(1 + F) σ2A + (1 - F2 ) σD2
Se a perda de heterozigoto é total e há fixação de homozigotos, de forma que o valor de F atinja o máximo igual a 1, a variância aditiva dobrará seu valor e a de dominância será nula, ou seja: σG2 = 2 σ2A
3. Acasalamento ao acaso em P2 Um dos modelos mais importantes na genética de populações é o acasala-
41
mento ao acaso, o que significa dizer que cada indivíduo tem igual possibilidade de se acasalar com qualquer outro da população. Em outras palavras, diz-se que os casais têm as mesmas chances de se acasalarem, como se fossem gerados pela união aleatória entre indivíduos.
!
A chance de um organismo, de genótipo definido, se acasalar com outro é igual à frequência desse genótipo na população.
O aspecto importante é que não haverá tendências para que o acasalamento ocorra entre indivíduos com genótipos semelhantes ou entre aqueles relacionados por ascendência (FALCONER, 1987). Nesse caso, novamente em Gpop, selecione o P2 exemplo como Pai e gere com acasalamento ao acaso com o P1. Verifique a descendência: População P2
Probabilidade
AA
AA x AA
0,50 x 0,50
0,25
AA x Aa(*)
2 x 0,50 x 0,50
0,25
Aa x Aa
0,50 x 0,50
TOTAL (*) Inclui também o cruzamento Aa x AA
Descendência Aa
aa
0,25
0,0625
0,125
0,0625
0,5625
0,375
0,0625
Com conhecimentos adquiridos em genética de populações, poder-se-á estimar com facilidade as frequências gênicas ou alélicas da população, pelas expressões: 1 1 f ( A) = p = D + H f (a) = q = R + H e 2 2 Assim, para população P2, tem-se:
f(A) = p =0,75
e
f(a) = q = 0,25
Utilizando o princípio do equilíbrio de Hardy-Weinberg, aplicado a populações derivadas de acasalamento ao acaso, também pode ser obtido: Genótipo
Esperado
Frequência
AA
p
0,5625
Aa aa
2pq
0,3750
q2
0,0625
2
Sistemas de acasalamento preferenciais também ocorrem naturalmente, quando a formação dos casais é baseada no fenótipo. A maioria dos acasalamentos preferenciais é positiva, o que significa dizer que os casais formados têm, em média, fenótipos mais similares do que o esperado com acasalamento ao acaso. O período de florescimento de uma espécie é um exemplo de acasalamento preferencial positivo. Geralmente, o período de florescimento de uma planta é relativamente menor do que a duração total da estação de florescimento. Plantas que florescem mais cedo na estação são polinizadas preferencialmente por outras, que também florescem mais cedo, e aquelas que florescem tardiamente
42
são preferencialmente polinizadas por outras de florescimento tardio (HARTL; CLARK, 1997). Modelos de acasalamento preferenciais tendem a ser complexos, pois a maioria das características (fenotípicas) é poligênica. Mas, todavia, considerando que fenótipos semelhantes tendem a se acasalar, acasalamentos preferenciais tendem a aumentar a frequência de genótipos homozigotos e diminuir genótipos heterozigotos na população; logo, a variância fenotípica populacional também é aumentada.
+
SAIBA MAIS! FALCONER, D_S. Introdução à genética quantitativa. UFV, 1987. HARTL, Daniel L.; CLARK, Andrew G.; CLARK, Andrew G. Principles of population genetics. Sunderland: Sinauer associates, 1997.
4. Sistema misto de acasalamento Em certas populações, pode ocorrer simultaneamente o acasalamento ao acaso e autofecundações em taxas diferenciadas. Assim, se numa população de acasalamento ao acaso – que apresenta as frequências de AA, Aa e aa iguais a p2, 2pq e q2, respectivamente – ocorrer taxa de autofecundação igual a w e de acasalamento ao acaso igual a 1-w, esperar-se-á que a próxima geração tenha a seguinte constituição genotípica: Genótipo
Acasalamento ao acaso (taxa = 1-w)
Autofecundação (taxa = w)
TOTAL
AA
p2
p2 + ½ pq
p2 + ½pqw
Aa aa
2pq
pq
2pq(1- ½ w)
q2
q2+ ½ pq
q2 + ½pqw
Se o processo de cruzamento misto, envolvendo autofecundações e acasalamento ao acaso, é continuado nas mesmas H taxas, 2 = 2apredução na frequência de H = 2 p 1 primeira até a t-ésima geração poderá ser predita por: heterozigotos da q (1 − w) + p 1 H = 2 p 2 H1 = 2 p q (1 − w) q[1 − (1 / 2) w]w = 2p 2 H = 2 p w − + q ( 1 ) p H t 2= 2 p 2 1 1 q (1 − w) 1 H 2 = 22p q (1 − w) + p q[1 − (1 / 2) w]w = 2p q 1 − w − w 1 1 1 1 2 2 q[1− w − ( w) 2 − ( w)3 − ... − ( w)t ] = 2 p ...q (1 − w) +qH[p1t −= (2 2 1 /p2) w]w = 2p 2 2 2 2
1 1 q[1 − (1 / 2)w]w11= 2p q111 −222 w 1− 23w 1 t w H t = 2 p qq[11−− w −− ( ww) − ( w) − ...− ( w) ] = 2 p q1 − w 2 2−w 1 122 2 22 2 1 1 2 1 3 1 − ( w) − ... − ( w)t ] = 2 p qq[11−− 2ww−−( 2ww)w q12− prever 2 2 que o coeficiente 2 portanto, Pode-se, de endogamia no equilíbrio será 2−w dadopor: w q 1 − H w F = 1− t = 2−w H0 2 − w Veja alguns valores de w e F: w
0
0,25
0,5
0,75
1
F
0
0,14
0,33
0,60
1
43
09 ENDOGAMIA 1. Descendência de acasalamentos ao acaso
!
A endogamia é o fenômeno que ocorre em decorrência do acasalamento entre indivíduos aparentados. Pode ter consequências sobre a média de uma população e afeta a similaridade das linhas derivadas.
O coeficiente de endogamia refere-se à probabilidade de que os alelos de um loco de um indivíduo sejam idênticos por ascendência. Tais alelos são idênticos quando derivam ou são cópias de um alelo comum, encontrado nos ancestrais daquele indivíduo. Numa população, podem-se encontrar homozigotos com alelos idênticos por ascendência ou idênticos apenas pela função que exercem. Assim, para um indivíduo I de genótipo ApAm, define-se o coeficiente de endogamia por meio de: F = P( Ap ≡ Am )
em que: ≡ : símbolo que significa idêntico por ascendência.
2. Conceitos a)Endogamia como consequência de gametas que se unem Segundo Wright (1951), endogamia ocorre em consequência da identidade dos gametas masculinos e femininos que se unem e é expressa pela correlação entre os valores gaméticos que formam a progênie derivada de uma população. Em uma população panmítica, na qual ocorre o acasalamento ao acaso, essa correlação é nula; em uma população endogâmica, a correlação não é nula, mas sim proporcional ao coeficiente de endogamia. O efeito que a endogamia proporciona sobre as frequências de heterozigotos e homozigotos é dado por .ε = pqF . b)Endogamia resultante do acasalamento entre aparentados O coeficiente de endogamia é expresso pela probabilidade de que os dois alelos que o indivíduo tem, para determinado loco, sejam idênticos por ascendência. Assim, considerando um indivíduo X, de constituição genotípica ab (X(ab)), tem-se:
Fx = P(a ≡ b) em que: ≡ : símbolo que significa idêntico por ascendência.
44
Por outro lado, o coeficiente de parentesco é a probabilidade de que dois indivíduos tenham alelos idênticos por ascendência. Assim, considerando dois indivíduos X e Y, de constituição genotípica ab e cd (X(ab) e Y(cd)), respectivamente, tem-se: 7 1 rXY = [P (a ≡ c) + P (a ≡ d ) + P (b ≡ c) + P (b ≡ d )] 4 Com base nessas definições, constata-se que os coeficientes de endogamia e de parentesco estão intimamente relacionados. Assim, verifica-se que o coeficiente de endogamia médio de uma progênie é igual ao coeficiente de parentesco de seus genitores. Tomando os indivíduos X(ab) e Y(cd), obtém-se a progênie: X(ab)
x
Y(cd)
¼ P(ac) com grau de endogamia F1 ¼ P(ad) com grau de endogamia F2 ¼ P(bc) com grau de endogamia F3 ¼ P(bd) com grau de endogamia F4 O coeficiente de endogamia médio da progênie Pij é dado por:
Ou seja, a endogamia média na progênie é dada pelo parentesco entre seus genitores. A seguir, é apresentado o coeficiente de parentesco entre vários indivíduos e sua relação com o coeficiente de endogamia: Relação
Simbologia
Indivíduo com ele próprio
rX ⊗
Irmãos completos
rI .C = rA.B
Meios-irmãos
rM . I = rA. B
Pai e filho
Genealogia X
rP. F = rX . A
x
F + FY 1 1 + X 4 2
y
A
B x
W
x
A
X
1 (1 + F X ) 2
X
X
X
Valor
B
x A
Y
1 (1 + FW ) 8 1 (1 + FX ) 4
Dada a genealogia:
45
Verificam-se as propriedades:
3. Estimação do Coeficiente de Endogamia a) Por meio do coeficiente de parentesco Será considerada, inicialmente, a estimação do coeficiente de endogamia em gerações sucessivas de autofecundação numa população original F2, derivada do cruzamento entre linhagens contrastantes, de forma que as frequências gênicas sejam dadas por p = q = 0,5. Para a situação em que há sucessivas gerações de autofecundação, pode-se considerar a genealogia:
Assim:
FF 3 = rF 2, F 2 =
1 1 (1 + FF 2 ) = 2 2
FF 4 = rF 3, F 3 =
1 3 (1 + FF 3 ) = 2 4
7 1 FF 5 = rF 4, F 4 = (1 + FF 4 ) = 2 8 ... 1 FFt = rFt −1, Ft −1 = (1 + FFt −1 ) 2 sendo: Fo = 0 então: 2 t 1 1 1 Ft = + + ... + 2 2 2 A soma dos n termos de uma progressão geométrica é dada por:
Sn =
a1 (1 − q n ) 1− q
sendo a1 o primeiro termo de progressão e q a razão. Logo: t 1 1 1 − 2 2 F = t 1 1− 2
46
A partir desta expressão, conclui-se que: (1) ou, alternativamente, tem-se: (2) Por esta última expressão, obtém-se: G
1 2 3 4 5 ... ∞
F
0 1/2 3/4 7/8 15/16 ... 1
Por outro lado, considerando que FF1=FF2=0 , a expressão apropriada seria: (3) Por esta expressão, obtém-se: G
2 3 4 5 ... ∞
F
0 1/2 3/4 7/8
... 1
De forma generalizada, tem-se:
1 Ft = 1 - 2
t -g
sendo g a geração em que se verifica o coeficiente de endogamia nulo (Fg = 0) b) Por meio da redução na frequência de heterozigotos Para ilustrar o efeito da endogamia sobre a frequência genotípica de uma população, será considerada, inicialmente, uma população em equilíbrio de Hardy-Weinberg (não-endogâmica) submetida a sucessivos ciclos de autofecundação, conforme apresentado na Tabela 13. Tabela 13 - Frequência genotípica, média e coeficiente de endogamia de populações submetidas a sucessivas autofecundações Genótipos Geração
AA
Aa
aa
Coeficiente de Endogamia
0 1 2 3 ... ∞
p2
2pq
q2
0
pq
q +1/2pq
1/2
p +3/4pq
1/2 pq
q +3/4pq
3/4
p2+7/8pq
1/4 pq
q2+7/8pq
7/8
p
0
q
1
p +1/2pq 2
2
2
2
A frequência do heterozigoto na t-ésima geração de autofecundação é dada por: t
1 H Ft = 2pq 2 ou seja, a cada geração de autofecundação a frequência de heterozigotos reduz-se à metade. Sendo Ho a frequência de heterozigoto na geração inicial,
47
tem-se:
Assim:
ou seja: Verifica-se, portanto, que a frequência de heterozigotos, em relação à frequência original, é reduzida na proporção H o Ft = 2 pqFt na t-ésima geração. c) Gerações sucessivas de acasalamento ao acaso numa população de tamanho finito Já foi ressaltado que, após uma geração de acasalamento ao acaso, a endogamia desaparece. Tal afirmativa é válida para uma população suficientemente grande, de forma que a probabilidade do encontro gamético de alelos idênticos por ascendência é nula.
!
Para uma população de tamanho finito (N), na qual os indivíduos são monoicos e ocorre o acasalamento ao acaso, surge a cada geração um efeito da endogamia. Esse efeito é resultante da probabilidade de que alelos idênticos por ascendência se unem com probabilidade que não é desprezível e diretamente proporcional ao valor de N.
Para efeito de ilustração, será considerado o esquema:
Será admitido que, para a formação da população P1, foram produzidos 2N gametas a partir de N indivíduos da população-base. Assim, cada indivíduo produziu dois tipos de gametas. As seguintes probabilidades podem ser calculadas: P(ocorrência de um tipo de gameta) =
48
1 2N
P(ocorrência de 2 gametas do mesmo tipo) = 1
2
2N 2
1 1 2N = 2N 2N
P(alelos idênticos por ascendência em P1) =
Assim, conclui-se que o coeficiente de endogamia da população P1 é igual a . Se o valor de N é infinitamente grande, essa endogamia será desprezível, ou seja: 1 2N
F1 =
1 2N
Tal abordagem será exemplificada, considerando uma população de tamanho N = 3 com indivíduos de genótipo aa’, bb’ e cc’. Os gametas e os indivíduos formados estão ilustrados no quadro: Frequência
1/2N
1/2N
1/2N
1/2N
1/2N
1/2N
Gametas
a
a’
b
b’
c
c’
a
aa
aa’
ab
ab’
ac
ac’
a’
a’a
a’a’
a’b
a’b’
a’c
a’c’
b
ba
ba’
bb
bb’
bc
bc’
b’
b’a
b’a’
b’b
b’b’
b’c
b’c’
c
ca
ca’
cb
cb’
cc
cc’
c’
c’a
c’a’
c’b
c’b’
c’c
c’c’
Para a formação da população P2, deve-se considerar a existência da 1 endogamia em P1, ou seja, existe a proporção F1 = indivíduos com alelos 2N idênticos por ascendência. A população P2 provém de N indivíduos, gerando 1 uma endogamia igual a 2N como visto anteriormente. Contudo, de todos os gametas produzidos pela população P1, uma fração 1/(2N) se une e carrega cópias de alelos, e uma fração 1 – 1/(2N) que se une carrega cópias de outros alelos. Dessa forma, considera-se: F2 = endogamia nova + endogamia remanescente ou
F2 =
1 1 + 1 − F1 2N 2N
De maneira análoga, podem-se estimar os demais coeficientes de endogamia, ou seja:
F3 = e
Ft =
1 1 + 1 − F2 2N 2N 1 1 + 1 − Ft −1 2N 2N
Fazendo:
∆F =
1 : incremento da endogamia a cada geração 2N
49
e P = 1 – F: índice de panmixia 1 − Pt = ∆ F + (1 − ∆ F ) tem-se:
1 − Pt = ∆ F + (1 − ∆ F ) (1 − Pt −1 ) ou: (1 − Pt −1 )
Pt = (1 − ∆ F ) Pt −1
Por extensão:
Pt −1 = (1 − ∆ F ) Pt − 2 logo:
Pt= (1 − ∆F )2 Pt −2= ...= (1 − ∆F )t P0 Considerando que o índice de panmixia na população inicial (P0) é 1 (e F0 = 0), tem-se:
Pt = (1 − ∆ F ) t e
1 Ft = 1 − (1 − ∆ F ) t = 1 − 1 − 2N
t
É interessante observar que, se N = 1, então tem-se situação idêntica à da autofecundação, caracterizada por:
+
1 Ft = 1 − 2
t
SAIBA MAIS! WRIGHT, S. Wright (1951) Variability within and among natural populations. Chicago: The University of Chicago Press, 1951. 580p
50
10 FIXAÇÃO E OSCILAÇÃO NA FREQUÊNCIA GÊNICA 1. Fixação Gênica 1.1Em populações derivadas de autofecundações Como verificado anteriormente, em cada geração a redução na frequência dos heterozigotos é de 2pq F. Assim, a frequência dos homozigotos é dada por: Genótipo
Original
No equilíbrio
AA
D0
p2
Dn
p 2 + pqFt
Aa
H0
2pq
Hn
2pq - 2pqFt
aa
R0
q
Rn
2
Frequência gerações de após n autofecundações
q 2 + pqFt
Por este quadro, observa-se que: - Com infinitas gerações de autofecundação, tem-se: Ft = F∞ = 1 e então:
f(Aa) = 2pq ( 1 - F∞ ) = 0
f(AA) = p 2 + pqF∞ = p 2 + pqpq==p(p + q) ==p p p(p+q) 2 2 q(p+q) f(aa) = q + pqF∞ = q + pqpq==q(p + q) = =q q
!
As sucessivas autofecundações fazem com que ocorra a fixação gênica, isso é, a eliminação de locos em heterozigose, de modo que, ao final do processo de autofecundação, todos os genes, teoricamente, terão segregação na proporção p:q (AA:aa).
- Se após a endogamia, houver uma geração de acasalamento ao acaso, a população resultante do cruzamento entre os indivíduos da população endogâmica apresentará a seguinte relação genotípica: Genótipo
No equilíbrio
AA
p*2
Aa
2p*q*
aa
q*2
Pela lei do equilíbrio de Hardy-Weinberg, as frequências alélicas podem ser
51
estimadas a partir da frequência genotípica da população genitora, que, no caso, se trata da t-ésima geração de autofecundação da população original, que tinha frequências alélicas iguais a p e q. Assim, tem-se que: 1 1 p * = f(A) = D t + H t = p 2 + pqFt + (2 p q − 2 pqFt ) = p 2 2 q * = f(a) = R t +
1 1 H t = q 2 + pqFt + (2 p q − 2 pqFt ) = q 2 2
Verifica-se, portanto, que a população descendente do acasalamento ao acaso terá a mesma frequência gênica da população-base submetida ao processo de autofecundação. 1.2 Deriva genética como causa de fixação A deriva genética é o processo decorrente da amostragem de uma população responsável pela alteração dispersiva na frequência alélica. Se uma amostra é adequada, espera-se que a frequência alélica estimada ( pˆ ), tendo-se por base o número de ocorrência de cada classe genotípica na amostra, reflita a frequência alélica da população original (p). Entretanto, as várias amostras de uma população apresentarão diferentes valores de pˆ , visto que a ocorrência do alelo A poderá ser de diferente magnitude nas várias amostras. Será admitido que na população original, de tamanho η encontram-se η 11 genótipos AA, η 12 Aa e η22 aa, de forma que: n11 n12 n22.
f(A)= p=
2η11 + η12 2η
f(a)= q=
2η22 + η12 2η
Ao ser tomada uma amostra de tamanho N (N < η ) desta população original, deve ser admitido que ela foi originada do encontro entre 2N gametas, em que N originou-se dos genitores femininos e os outros N, dos genitores masculinos. A relação genotípica esperada (RGe) na amostra será:
RGe= [p + q]
2N
Para uma particular amostra, a frequência do alelo A será quantificada por meio de:
x 2Np ˆ E = E(p) = = p 2N 2N
A variação esperada na frequência gênica da população pelo processo de amostragem pode, então, ser quantificada por: ˆ ∆p = p − p
pq 2N Deve ser lembrado que N é o número de indivíduos da população original que efetivamente contribuíram para a formação da amostra. Muitas vezes o que se procura é exatamente conhecer o valor do tamanho efetivo da amostra. ˆ= V( ∆p)= V(p − p)
52
2. Oscilação na frequência gênica A oscilação na frequência gênica poderá ser computada admitindo que são retiradas s amostras de tamanho N e que valores pˆ j (j=1,2,...s) seguem distribuição aproximadamente normal, para s suficientemente grande. Considera-se que: E (pˆ j ± σˆ pj ) = p ±
pq 2N
e que
P(p j − σpj ≤ pˆ j ≤ p j + σpj ) = 6868,2% ,2% Assim, se for admitida a existência de 50 amostras de tamanho N igual a 50, derivadas de uma população original cuja frequência gênica é p=q=0,5, que apenas 68,2% das amostras irão apresentar frequência entre 0,45 e 0,55, sendo, portanto, difícil de manter a identidade gênica com a população original. Nesse ponto, cabe esclarecer que, estando apenas o loco sob discussão, não é possível compreender propriamente o que pode ocorrer em uma amostra, exceto quando considerada como sendo uma entre várias amostras. No entanto, o que ocorre aos alelos de um loco, em um número s de amostras, também ocorre aos alelos de vários locos em uma única amostra, desde que todos eles iniciem com a mesma frequência gênica. Para ilustrar esse fato, pode-se admitir uma primeira situação em que haja uma única amostra e investiga-se a frequência de alelos em 100 locos, com frequências iniciais p=q=0,5. Assim, em uma amostra de 50 indivíduos esperase que: 2,1 locos tenham frequência entre 0,35 e 0,40. 13,6 locos tenham frequência entre 0,40 e 0,45. 34,1 locos tenham frequência entre 0,45 e 0,50. Em uma segunda situação, considera-se uma população a partir da qual se retiram 100 amostras de tamanho 50 e avalia-se a oscilação gênica em um alelo que se encontra na frequência original de p=q=0,5. Espera-se que: 2,1 amostras tenham frequência do alelo entre 0,35 e 0,40. 13,6 amostras tenham frequência do alelo entre 0,40 e 0,45. 34,1 amostras tenham frequência do alelo entre 0,45 e 0,50. 3. Efeito da deriva genética ao longo do tempo - fixação Para estudar os efeitos da deriva genética proporcionada pela subdivisão de uma população original em subpopulações, cada uma com s amostras, ao longo de um tempo t de acasalamentos ao acaso, será considerada uma população ideal, constituída por indivíduos diploides e monoicos. Admite-se que o acasalamento ocorra unicamente entre os indivíduos da mesma amostra, que as gerações são distintas e que não haja seleção, migração e mutação. Também se considera que o número de indivíduos que se acasalam para dar origem à próxima geração é constante e igual a N, em todas as amostras e em todas as subpopulações. Esquematicamente, tem-se:
53
No diagrama, considera-se que a população original seja dividida em várias amostras (ou linhas) ao longo do tempo. Em cada geração, 2N gametas de uma amostra se unem para gerar os N indivíduos da próxima subpopulação. Admite-se que a frequência alélica na população original seja p0 e q0 e que a frequência do alelo A na amostra (ou linha) j na subpopulação t seja dada por pˆ jt ou simplesmente pˆ t . As seguintes análises poderão ser feitas:
E ( pˆ j1 ) = E ( pˆ 1 ) = p 0 ˆ j1) V(p ˆ 1) V(p = =
p0q0 2N
ou seja, a variância da frequência gênica aumenta 2N vezes em relação à existente na subpopulação inicial. Também se constata que o valor p0(1-p0) corresponde exatamente à variância da frequência gênica em um conjunto de amostras em que o alelo A foi fixado em p0 linhas (ou amostras) e o alelo a, em q0 linhas. 4.Tamanho efetivo Para melhor entendimento de seu efeito sobre a frequência gênica, deve-se definir tamanho ideal e tamanho efetivo de população. A importância desses conceitos torna-se mais clara à medida que se leva em consideração que é uma amostra de genes de determinada população que será transmitida à próxima. Assim, a frequência gênica na progênie será influenciada pela variação amostral, que será tanto maior quanto menor for o número de pais.
!
Tamanho efetivo de população representa o número de indivíduos que contribuem efetivamente para a variância de amostragem - ou taxa de endogamia -, desde que acasalados de acordo com as premissas da população ideal, que podem ser, segundo Falconer (1987), resumidas simplesmente no seguinte: “é aquela na qual a variação de amostragem é tão pequena que pode ser desconsiderada”.
O número ou tamanho efetivo de uma população corresponde ao número de reprodutores na população ideal que proporcionaria a mesma taxa de endogamia
54
numa população em estudo. Para estudos do tamanho efetivo, considera-se que a população ideal tem N indivíduos e que apenas Ne se intercruzam de forma a proporcionar a taxa de endogamia estimada na população em estudo. As relações entre os números observados (N) em populações (ou amostras) em estudo e o tamanho efetivo (Ne), nas situações mais comumente encontradas, são estas:
+
SAIBA MAIS! Falconer, D. S. Introdução à Genética Quantitativa. Viçosa, MG: UFV, 1987. 279p
• Caso 1: Organismos hermafroditas, mas sem autofecundações Nessa situação, considera-se que o número de machos e o de fêmeas que contribuem para a população em estudo sejam iguais: Nm = Nf e, portanto, pm = pf sendo pm e pf as frequências do alelo A, entre reprodutores masculino e feminino. Se a população em estudo tem tamanho N, então sua taxa de endogamia será dada por: 1 ∆F' = 2N + 1 Na população ideal, deve-se ter um número de reprodutores Ne que proporcione a mesma taxa de endogamia, ou seja: 1 1 ∆= F = 2Ne 2N + 1 Portanto, apesar de a população em estudo ter N indivíduos, seu tamanho efetivo será: Ne = N + 1/2 Nessa situação, a exclusão da autofecundação influi pouco na taxa de endogamia, exceto nos casos em que N é muito pequeno. • Caso 2: Organismos dioicos Neste caso, considera-se que o número de machos e o de fêmeas que contribuem para a população em estudo possam ser diferentes. A frequência gênica esperada na progênie obtida do intercruzamento desses reprodutores será:
p1 =
pm + p f 2
sendo pm e pf as frequências do alelo A, entre reprodutores masculino e feminino. logo: 4NmNf Ne = Nm + Nf Se a população em estudo é proveniente do intercruzamento entre Nm machos e Nf fêmeas, então sua taxa de endogamia será dada por: ∆= F
1 1 1 1 = + 2Ne 8 Nm Nf
Como ilustração, considera-se uma população derivada do acasalamento
55
entre cinco genitores masculinos e 95 femininos. Nessa situação, tem-se:
= Ne
4NmNf 4(5)(95) = = 19 Nm + Nf 5 + 95
e
1 1 = = 0,0263 2Ne 38
∆F=
A população constituída a partir desses 100 indivíduos proporciona valor de V(p1) ou de ∆F equivalente ao fornecido pelo intercruzamento entre 19 indivíduos da população ideal. Note-se que a taxa de endogamia depende, principalmente, do menor número de indivíduos entres os dois sexos. Se uma população for mantida com um número grande de fêmeas, mas apenas um único macho em cada geração, o número efetivo será: 4NmNf 4(1)Nf = Ne = ≅4 Nm + Nf 1 + Nf Assim, uma família de meios-irmãos corresponde a apenas 4 indivíduos de uma população ideal. Outra situação a ser analisada é quando o número de machos e fêmeas que se intercruzam é igual. Assim: Nm = Nf = N e = Ne
4NmNf 4N2 = = 2N Nm + Nf 2N
Portanto, uma família de irmãos completos (situação em que Nm = Nf = 1) corresponde a apenas dois indivíduos de uma população ideal. Para determinado número de reprodutores, quanto maior a desproporcionalidade entre a contribuição dos dois sexos, maior será a taxa de endogamia. Se Nm = Nf , a taxa de endogamia é minimizada. • Caso 3: Variação do número de indivíduos de geração em geração O número de indivíduos de uma população submetida ao acasalamento ao acaso poderá variar de geração para geração. Assim, pode-se considerar que a população, no tempo t, apresenta nj indivíduos, de forma que a variância média da frequência gênica seria dada por: V(p) =
1 t p0q0 p0q0 1 1 1 = + + ... + ∑ t j=1 2N j 2t N1 N2 Nt
O tamanho efetivo poderá, então, será quantificado por meio de:
V(p) = logo:
p0q0 p0q0 = 2Ne 2t
1 1 1 + + ... + Nt N1 N2
1 1 1 1 1 = + + ... + Ne t N1 N2 Nt Considerando t gerações, o número efetivo é dado pela média harmônica dos números de indivíduos de cada geração. O valor de Ne está bastante influenciado pelo menor valor de N. Assim, se, por exemplo, tem-se: N1 = 100
56
N2 = 10
N3 = 100
e
N4 =100
então:
1 1 1 1 1 1 13 = 30,76 = + + + = Ne 4 100 10 100 100 400 As gerações contendo menores números de indivíduos influenciam o tamanho efetivo e, consequentemente, a endogamia da população. A expansão do tamanho da população pouco reduz a endogamia já estabelecida.
5. Fixação por isolamento de subpopulações - Princípio Wahlund Para fazer abordagem sobre o princípio de fixação gênica descrito por Wahlund, será considerada uma população subdividida em várias unidades de melhoramento ou subpopulações - mesmo que não completamente isoladas - sobre elas interessa o estudo da variação entre e dentro das subpopulações. Será considerado que a população original foi subdividida em s subpopulações, cada uma das quais, em equilíbrio de Hardy-Weinberg. Seja pj a frequência do alelo A1 na j-ésima subpopulação, de forma que a frequência genotípica possa ser expressa por p 2j A A , 2p (1-p )A A e (1-p )2A A . 1 1 j j 1 2 j 2 2 Também será considerado que as subpopulações apresentam diferentes tamanhos, de forma que o tamanho relativo da j-ésima população seja denotado s
por
θ j , tendo-se ∑ θ j = 1 . Esquematicamente, tem-se: j=1
Subpopulação
A1A1
p p
1 2
2 1 2 2
A1A2
A2A2
pj=f(A1)
θj
2p1(1-p1)
(1-p1)
p1
θ1
2p2(1-p2)
(1-p2)
2
p2
θ2
2 s
2ps(1-ps)
(1-ps)
2
ps
θs
p
s TOTAL
s
∑ θ jp 2j j =1
s
2∑ θ jp j (1 − p j ) j =1
2
s
∑ θ (1 − p j =1
j
j
)2
1
Contudo, a frequência de cada classe genotípica pode ser denotada de outra maneira, a partir dos parâmetros: s
p = ∑θ j p j j =1
s
s
j =1
j =1
σ 2 = ∑ θ j ( p j − p ) 2 =∑ θ j p 2j − p 2 A seguir, podem-se comparar as frequências esperadas e observadas numa população resultante do agrupamento de várias subpopulações em equilíbrio de Hardy-Weinberg.
57
Genótipo
Observado s
A1A1
∑θ p j =1
A1A2 A2A2
j
2 j
Esperado
= p 2 + σ2
p2
s
2∑ θ jp j (1 − p j ) = 2p(1 − p ) − 2σ 2 j =1 s
∑ θ (1 − p j =1
j
j
2p(1 − p )
) 2 = (1 − p ) 2 + σ 2
(1 − p ) 2
p : média das frequências do alelo A1 nas s subpopulações
Isso indica que, se uma população é subdividida em várias subpopulações que se acasalam ao acaso, a sua frequência de homozigotos tende a ser maior do que a esperada com base no equilíbrio de Hardy-Weinberg estabelecido a partir das frequências médias das subpopulações. Na prática, a comparação entre os valores esperados e observados prevê estimativa de um importante parâmetro, σ 2 ,que mede o grau de diferenciação das subpopulações em relação à população original, cuja frequência alélica é esperada ser x . Aplicação – a seguir são apresentados valores de σ 2 ,considerando várias situações de subdivisão de determinada população em quatro isolados (ou amostras) A- Os isolados apresentam tamanhos iguais ( θj =1/s) Isolado
θj
pj
1- pj
X11
X12
X22
1
0,25
0,9
0,1
0,81
0,18
0,01
2
0,25
0,7
0,3
0,49
0,42
0,09
3
0,25
0,5
0,5
0,25
0,50
0,25
4
0,25
0,3
0,7
0,09
0,42
0,49
Observado
0,6
0,4
0,41
0,38
0,21
Esperado
0,6
0,4
0,36
0,48
0,16
0,05 (σ2)
-0,10 (-2σ2)
0,05 (σ2)
Diferença
Nessa situação, a população foi dividida em quatro isolados com mesmo tamanho relativo. O valor de heterozigoto observado é inferior ao esperado, e a magnitude de σ2 =0,05 , que mede o grau de diferenciação, é de 0,05. B - O isolados apresentam tamanhos diferentes e frequências alélicas equivalentes às de A Isolado
θj
pj
1- pj
X11
X12
X22
1
0,3
0,9
0,1
0,81
0,18
0,01
2
0,2
0,7
0,3
0,49
0,42
0,09
3
0,2
0,5
0,5
0,25
0,50
0,25
4
0,3
0,3
0,7
0,09
0,42
0,49
Observado
0,6
0,4
0,418
0,364
0,218
Esperado
0,6
0,4
0,360
0,480
0,160
0,058 (σ2)
-0,116 (-2σ2)
0,058 (σ2)
Diferença
58
Na situação B, a população também foi dividida em quatro isolados com tamanho relativo diferenciado. O valor de heterozigoto observado é inferior ao esperado, e a magnitude de σ2 =0,058, que mede o grau de diferenciação, é maior que a verificada na situação anterior, apesar de as frequências alélicas nos isolados serem idênticas. C- Isolados de tamanhos iguais e frequências alélicas mais similares do que em A e B Isolado
θj
pj
1- pj
X11
X12
X22
1
0,25
0,8
0,2
0,64
0,32
0,04
2
0,25
0,7
0,3
0,49
0,42
0,09
3
0,25
0,5
0,5
0,25
0,50
0,25
4
0,25
0,4
0,6
0,16
0,48
0,36
Observado
0,6
0,4
0,385
0,430
0,185
Esperado
0,6
0,4
0,360
0,480
0,160
0,025 (σ2)
-0,050 (-2σ2)
0,025 (σ2)
Diferença
Na situação C, a população também foi dividida em quatro isolados com o mesmo tamanho relativo, mas com menor variação nos valores das frequências gênicas. O valor de heterozigoto observado é inferior ao esperado, e a magnitude de σ2 =0,025, que mede o grau de diferenciação, é menor que os valores verificados nas situações A e B, descritas anteriormente.
59
11 ÍNDICE DE FIXAÇÃO 1.Relação entre frequências de heterozigotos Quando há dois alelos para determinado loco, qualquer desvio da condição de equilíbrio de Hardy-Weinberg pode ser medido pelo parâmetro F, denominado de índice de fixação (WRIGHT, 1951, 1965). Esse parâmetro mede a probabilidade de um indivíduo da população ser homozigoto por autozigose de um gene qualquer presente em seus ancestrais. Assim, considerando uma população constituída por indivíduos A1A1, A1A2 e A2A2, é possível admitir que entre A1A1 (ou para A2A2) devem ser encontrados autozigotos, em que os alelos A1 são idênticos por ascendência, e alozigotos, nos quais os alelos são idênticos por funcionalidade, mas não por ancestralidade. Indivíduos heterozigotos (A1A2) são alozigotos. Dessa forma, se numa população os alelos A1 e A2 ocorrem na frequência p e (1-p) e há uma taxa F de acasalamento entre indivíduos aparentados, podemse calcular as seguintes frequências genotípicas: f(A1A1) = f(A1A1 autozigotos) + f(A1A1 alozigotos) = F f(A1) + (1-F) [f(A1)/macho f(A1)/fêmea] = pF + (1-F) p2 f(A2A2) = f(A2A2 autozigotos) + f(A2A2alozigotos) = F f(A2) + (1-F) [f(A2/macho f(A2/fêmea] = (1-p)F + (1-F)(1-p)2 f(A1A2) = f(A1A2alozigotos) = (1-F) [f(A1)/macho f(A2)/fêmea]+ (1-F) [f(A2)/macho f(A1)/fêmea] = 2(1-F)p(1-p) Assim, tem-se a seguinte frequência genotípica: Genótipo
Frequência
Panmítico
A1A1
X11
(1-F)p2
A1A2
X12
2(1-F)pq
A2A2
X22
(1-F)q2
Fixação Fp F(1-p)
Total
F=0
F=1
(1-F)p2+ Fp
(1-F)p2
p
2(1-F)pq
2pq
0
(1-F)q2+ Fp
q2
q
q=1–p
O acréscimo na frequência de homozigotos decorrente de acasalamento entre aparentados é dado por: ε = p(1 − p)F
De maneira prática, pode-se considerar que as populações naturais apresentam diferentes sistemas reprodutivos, podendo-se classificá-los como alogamia ou panmixia, em que F é igual a zero; autogamia, em que F é igual a 1; e sistema misto, em que 0 < F < 1. A seguir, é apresentada a frequência genotípica esperada em uma população, considerando os diferentes tipos de acasalamento e admitindo que as frequências alélicas são iguais a 0,5 (p = q = 0,5):
60
Genótipo
Frequência
Panmixia (F=0)
Autogamia (F=1)
Misto (F=0,02)
Misto (F=0,20)
A1A1
p2+ ε
0,25
0,50
0,255
0,30
A1A2
2pq - 2ε
0,50
0
0,490
0,40
A2A2
q +ε
0,25
0,50
0,255
0,30
2
p = 1 – q e ε= pqF
O índice de fixação (F) pode ser estimado a partir da diferença entre as frequências esperadas (he) e observadas (ho) de heterozigotos, ou seja:
ho = X12 = 2 pq -2ε he = 2 pq Assim:
ε=
he − ho = pqF 2
logo:
he − ho he − ho = 2pq he
= F
2.Diferenciação entre subpopulações O parâmetro F pode agora ser definido como um índice de fixação total capaz de computar o acréscimo na frequência de homozigotos por acasalamento entre aparentados e por efeito da subdivisão da população. Assim, têm-se as seguintes frequências genotípicas esperadas: Genótipo
Frequência esperada
Frequência Observada
Fixação
X11
(1-F) 2 + Fp
A1A1 A1A2
X12
Princípio Wahlund s
p
2(1-F) p q
∑θ j =1
s
j
p 2j = p 2 + σ 2
2∑ θ j p j (1 − p j ) = 2 pq − 2σ 2 j =1
A2A2
X22
(1-F)
q 2 + Fq
s
∑θ j =1
j
(1 − p j ) 2 = q 2 + σ 2
Comparando os dois valores esperados, pode-se estimar F por meio de:
F=
σ2 p (1 − q )
O valor de F é definido por: 0 ≤ F ≤ 1 . Assim, F será zero quando a frequência pj (j=1,2,...s) for a mesma para todas as subpopulações, de forma que σ2 seja nulo. E F será igual a 1 quando uma fração t das subpopulações estiver fixada para o alelo A1, e uma fração s-t, para A2. Assim, tem-se: Subpopulação fixada com
Frequência
f(A1)
A1
t/s = m
1
A2
(s-t)/s = 1-m
0
61
Nesse caso, tem-se:
x=
t (1) + ( s − t )0 =m s
σ 2 = m12 + (1 − m)0 2 − m 2 = m(1 − m) = p (1 − p ) logo:
F=
σ2
=
p (1 − p )
p (1 − p ) p (1 − p )
=1
Nas expressões anteriores, é assumido que o valor θj é conhecido. Entretanto, na prática há disponibilidade apenas da informação do tamanho da amostra estudada, mas raramente é conhecido o valor real do tamanho da subpopulação. Para contornar essa situação, geralmente é admitido que: 1 θ1 = θ 2 = ... = θ s = s Essa pressuposição é razoável, uma vez que o tamanho da população (ou subpopulação) é transitório. De fato, o que realmente interessa é caracterizar a diferenciação genética entre as subpopulações, independentemente de seu tamanho naquele determinado espaço temporal ou geográfico. Pelo exposto até então, admitindo a avaliação de populações submetidas a diferentes sistemas de acasalamento, pode-se inferir que o grau de fixação pode ser quantificado por meio das seguintes estatísticas: • Grau de fixação de populações submetidas a sucessivas gerações de autofecundação A fixação pode ser estimada pelo coeficiente de endogamia F ou pela frequência de heterozigotos (H) dados por:
1 Ft = 1 − 2
t
t
ou
1 Ht = H0 2
Em que: t é o número de gerações de autofecundação Ho é a frequência de heterozigotos na população panmítica. • Grau de fixação de populações derivadas de acasalamento ao acaso a partir do intercruzamento de um número N finito de genitores Nesse caso, a fixação é medida por meio de:
1 Ft =1 − 1 − 2N
t
• Grau de fixação em populações derivadas de amostras, de tamanho N, sucessivas de uma população panmitica Quantifica-se a fixação por meio da variância de frequência alélica, dada por: t 1 V(p t )= p0 (1 − p0 ) 1 − 1 − 2N
62
• Grau de fixação de um conjunto de amostras resultante da subdivisão de uma população A fixação poderá ser estimada por meio de:
F=
σ2 p(1 − p)
sendo σ2 a variância da frequência alélica entre as amostras.
63
12 FIXAÇÃO GÊNICA – CASOS ESPECIAIS a) Alelos Múltiplos As expressões apresentadas podem ser facilmente generalizadas nas situações em que há alelos múltiplos - fato comumente encontrado em estudos de diversidade genética de populações a partir de marcadores microssatélites. Nessa situação, serão utilizadas as seguintes simbologias: - Para as subpopulações pij: frequência do alelo i (i=1,2,...a) na subpopulação j (j=1,2,...s) Giij: frequência observada do genótipo AiAi na j-ésima subpopulação Gikj: frequência observada do genótipo AiAk na j-ésima subpopulação - Para a população geral Xii: frequência observada do genótipo AiAi na população total Xik: frequência observada do genótipo AiAk na população total sendo: 2 Giij = pij Gikj = 2p ij p kj e s
Xij=
∑θ p j
j =1
2 ij
= pi2 + σ i2
s 2 Xij= ∑ θ j p ij p kj = 2p i pk + σ ik j =1
em que:
pi =
s
∑θ p j =1
j
ij
s
σ i2 = ∑ θ j (p ij − pi ) 2 j =1 s
σ ij = ∑ θ j (p ij − pi )( p kj − pk ) j =1
De maneira análoga, podem-se expressar as frequências genotípicas dos homozigotos e heterozigotos a partir de índices de fixação (F), de forma que se tenha:
64
X ii = (1 − Fi i )pi2 + Fii pi X ik = 2(1 − Fik )pi pk Se a diferenciação entre as subpopulações ocorre ao acaso, é esperado que:
Fii = Fik = F Assim, pelos estudos baseados em locos com vários alelos, é possível testar a hipótese de diferenciação casual ou não das subpopulações. No entanto, devese ter em mente que, se há grande número de alelos por locos e o tamanho da amostra (ou subpopulação) é reduzido, os valores de F (Fii ou Fik) estarão sujeitos a grandes erros de amostragem, e a avaliação da hipótese poderá estar comprometida. b) Análise de vários locos Nas expressões apresentadas, foi considerado apenas um único loco, mas, no estudo da variação genética entre subpopulações ou populações, é indispensável avaliar grande número de locos, representativos do genoma. Por outro lado, dado o tamanho do genoma, é quase impossível caracterizar as populações a partir de tolos os locos da espécie. Por isso, na prática, utiliza-se uma amostra adequada de locos. Quando muitos locos são estudados, considera-se a diversidade gênica média, ou seja, os valores médios são obtidos a partir das informações de cada loco. 1. Fluxo gênico ou migração É a transferência de material genético de uma espécie (daninha ou cultivada) para outras plantas (da mesma ou de espécies diferentes), que podem apresentar, após esse processo, novas expressões fenotípicas, que poderão conferir à população maior ou menor adaptação (ARIAS; RIESEBERG, 1994). O fluxo gênico é também conhecido como escape gênico e está associado ao termo poluição gênica, que seria uma dispersão descontrolada de genes. A migração pode resultar em importantes mudanças nas frequências dos genes, de forma que a imigração pode provocar adição de material genético novo ao conjunto gênico estabelecido de uma espécie em particular, enquanto a emigração pode resultar na remoção de material genético. Vários fatores afetam a taxa de fluxo gênico entre diferentes populações. Um dos mais significativos é a mobilidade - e animais tendem a ser mais móveis que plantas. A maior mobilidade de um indivíduo tende a lhe dar maior potencial migratório. Em vegetais, o fluxo gênico ocorre via pólen, sendo dependente de vários fatores: sincronismo de florescimento, elevada compatibilidade, abundância de vetores e métodos de difusão de pólen, distância de movimentação do pólen e condições ambientais apropriadas para polinização cruzada (CARPENTER et al., 2002). A estrutura genética de uma espécie reflete o número de alelos intercambiados entre populações, e esses fluxos gênicos tornam homogêneas as frequências de alelos entre essas populações, determinando os efeitos relativos da seleção e da deriva genética e, consequentemente, a composição genética dos indivíduos. Um fluxo gênico alto evita a adaptação local, reduzindo a fixação de alelos que
65
são favorecidos sob condições locais e impedindo o processo de especiação. Por outro lado, o fluxo gênico gera novos polimorfismos nas populações e aumenta o tamanho efetivo da população local e sua habilidade de resistir a mudanças aleatórias nas frequências gênicas, opondo-se à deriva genética e gerando novas combinações de genes, nas quais a seleção natural pode atuar (BALLOUX et al., 2002). As estimativas do fluxo gênico entre as populações foram obtidas segundo a equação proposta por Crow e Aoki (1984):
= ηm
1 1 − 1 4k FST
O esquema ilustra o feito da imigração sobre uma população. Nele, considerase q uma população mista formada a partir de uma proporção m de migrantes e 1-m de nativos:
A alteração na frequência gênica pode ser observada, considerando as gerações: a) Primeira geração de migração O valor da frequência da população que inclui nativos e migrantes é dado por: q1 = mqm + (1-m)q0 = m(qm – q0) + q0 Podem ser obtidas duas medidas de desequilíbrio: uma em relação à população de nativos originais, denotada por ∆ q , e outra em relação ao conjunto de migrantes, denotada por e
∆ q . Esses valores são dados por:
∆q1 = (q1 − q0 ) = m(qm − q0 ) ∆q1' = (q1 − qm ) = (1 − m)(q0 − qm )
b) Segunda geração de migração Agora, o valor da frequência da população, que inclui a população mista e novos migrantes, é dado por: q2 = mqm + (1-m)q1 = m(qm – q1) + q1 As taxas de desequilíbrio são dadas por: e
∆q2 = (q2 − q1) = m(qm − q1) = m(1- m)(qm – q0) ∆q'2 =(q2 − qm ) =(1 − m)(q1 − qm ) =(1 − m)2 (q0 − qm )
66
c) Demais gerações De forma análoga, é obtido: q3 = mqm + (1-m)q3 = m(qm – q3) + q3
∆q3 = (q3 − q2 ) = m(qm − q2 ) = m(1 − m)2 (qm − q0 )
e
∆q'3 =(q3 − qm ) =(1 − m)(q3 − qm ) =(1 − m)3 (q0 − qm ) Assim, na t-ésima geração, tem-se:
∆qt = (qt − qt −1) = m(1 − m)t (qm − q0 ) e
∆q't =(qt − qm ) =(1 − m)(qt − qm ) =(1 − m)t (q0 − qm ) 0 , de forma que Após sucessivas gerações, espera-se que ∆qt =∆q't = as frequências gênicas se estabilizem em valor igual a qm. De maneira geral, devem ser considerados dois tipos de fluxos gênicos: • Fluxo gênico vertical Ocorre entre plantas e variedades da mesma espécie ou entre espécies aparentadas. Esse fenômeno vem ocorrendo há milhares de anos, com efeitos no geral benéficos. Os cruzamentos que ocorrem entre as plantas de diferentes populações são características da espécie, e todo e qualquer fluxo gênico altera a constituição e estrutura genética da população receptora. • Fluxo gênico horizontal Corresponde à transferência de genes entre espécies diferentes. Esse fato se dá em razão de a compatibilidade sexual ser encontrada entre muitas espécies vegetais. A probabilidade de fluxo gênico horizontal depende de muitos fatores, como a dinâmica das populações envolvidas, os mecanismos de polinização e dispersão das sementes e o ambiente da liberação. A imposição de mecanismos de isolamento, espaciais ou temporais, é fundamental, sendo, porém, importante o monitoramento de possíveis situações de escape. Uma grande parte das plantas cultivadas superiores teve origem em cruzamentos tanto intra como interespecíficos. O trigo, por exemplo, é o produto da combinação de três espécies diferentes. O triticale – espécie artificialmente obtida combinando os genomas do trigo e do centeio – combina a produtividade do trigo com a rusticidade do centeio. 1.1 Barreiras ao Fluxo Gênico Na natureza, o cruzamento entre espécies diferentes é normalmente impedido pelos mecanismos de isolamento reprodutivo. Entretanto, pode ocorrer entre espécies evolutivamente mais próximas. As barreiras geográficas interrompem o fluxo gênico, permitindo que as duas populações separadas tomem caminhos evolutivos diferentes, uma vez que os agentes seletivos atuantes são diferentes em ambientes diferentes. Contudo, para manutenção de variedades livres de contaminação gênica, em muitas situações, são necessárias medidas específicas de isolamento,
67
conforme a natureza das espécies envolvidas. Tais medidas são rotineiramente empregadas pelos pesquisadores, bem como por agricultores interessados em preservar seus materiais genéticos.
REFERÊNCIAS BIBLIOGRÁFICAS Cruz, C. D., Ferreira, F. M., Pessoni, L. A. Biometria Aplicada ao Estudo da Diversidade Genética. Visconde do Rio Branco, MG: Suprema, 620p. 2011
68