Métodos de estudo de QTLs

Desenhos experimentais

     Para que um programa de análise de QTLs tenha sucesso é preciso que os marcadores moleculares estejam em desequilíbrio de ligação com os alelos segregantes nos locos que influenciam as características fenotípicas. Isso pode ser conseguido por diversas maneiras. Apenas algumas delas serão mostradas aqui, a título de exemplo. Para situações especiais outros desenhos eficientes podem ser também adotados. Os esquemas apresentados abaixo são de um organismo hipotético que tem apenas três pares de cromossomos e que não apresenta recombinação, para facilitar a visualização.

1. Segregação em F2

     Nesse desenho experimental, uma geração de indivíduos F1 será produzida a partir de duas linhagens diferentes que tenham sido endocruzadas, para assegurar que os indivíduos que gerarão F1 tenham a grande maioria de seus locos em homozigose. Em F2 os alelos segregarão conforme o esquema abaixo:

2. Retrocruzamento

     Nesse tipo de desenho, as mesmas características do desenho com segregação em F2 são utilizados, mas os indivíduos F1 são cruzados com indivíduos de uma das linhagens parentais. A diferença básica entre esse desenho e o anterior é que, dentre os indivíduos que serão analisados, há apenas homozigotos para alelos que estavam na linhagem com a qual os indivíduos F1 foram cruzados ou heterozigotos.

Outros desenhos experimentais

    A tecnologia de QTLs apareceu no momento em que diversos programas de análise de cruzamentos estavam em vias de execução. Além disso, certos organismos não podem ser sujeitos a esquemas de cruzamento previamente determinados (ninguém pensaria em um programa de cruzamentos planejados para a espécie humana, ou existem ainda espécies muito sensíveis a endocruzamentos sucessivos). Para todos esses casos, podem ser utilizados desenhos experimentais especiais mas todos dependem da disponibilidade de marcadores em desequilíbrio de ligação com genes que possam ser responsáveis pelos efeitos fenotípicos de interesse. No caso da espécie humana, um grande número de famílias pode ser analisada onde, em cada uma delas, a premissa do desequilíbrio de ligação pode ser admitida sem problemas. Muitas criações de animais usam intensamente o método de inseminação artificial. Dessa forma o desenho experimental deve ser centrado na análise dos reprodutores e de seus descendentes.

Análises estatísticas dos resultados

     Esse é um dos pontos mais delicados do estudo dos QTLs, pois vários fatores devem ser levados em consideração. Como simplificação, vamos excluir quaisquer fatores ambientais por enquanto, imaginando que todos os organismos do experimento desenvolveram-se em um ambiente idêntico. Em segundo lugar, vamos admitir que existe uma densidade muito alta de marcadores, de tal forma que para cada um dos genes que tem efeito no fenótipo de interesse existem muitos marcadores próximos e, principalmente, que eles estejam distribuídos uniformemente. Também vamos admitir que a amostra é muito grande. A tabela abaixo ilustra o que aconteceria, no caso do desenho experimental de retrocruzamento caso um QTL fosse detectado:

     Como a amostra é muito grande, podemos considerar, por enquanto, que qualquer diferença entre as médias dos valores fenotípicos é significativa. O mais importante que podemos verificar no resultado acima é que a diferença máxima ocorre entre a distância 40 e 50. Imediatamente podemos admitir a existência de um loco que está afetando o valor fenotípico a meio caminho entre os marcadores localizados em 40 e 50, pois há perfeita simetria na resposta. Evidentemente os dados acima são forjados para melhorar o entendimento dos efeitos observados. No caso de dados obtidos experimentalmente, os resultados não têm interpretação assim tão óbvia. Vamos continuar a desprezar os efeitos ambientais para o esclarecimento do problema. Na maioria das vezes, não é possível se obter  amostras gigantescas para que qualquer diferença seja significativa. A tabela abaixo é (um pouco) mais próxima daquilo que se obtém na verdade:
     Aqui começa a entrar o poder da Estatística junto com um modelo genético. Se fôssemos fazer uma comparação independente para cada marcador teríamos que fazer duas considerações:
1. Em uma série de comparações independentes, é esperado que algumas delas (em 5% dos casos para ser mais exato) sejam significativas por acaso. Sabendo disso, corremos o risco de não podermos detectar um QTL que exista realmente pois apenas poderíamos considerar efeitos muito mais fortes que aqueles detectados pelo nível de 5%, padrão em experimentos biológicos, para evitar conclusões espúrias.
2. Os desvios ao acaso que existem em qualquer experimento ocorrem em ambos os sentidos.
     Para evitar esses problemas, é importante que utilizemos informações de todos os marcadores em conjunto, justamente para aumentarmos o poder da análise. Felizmente temos um meio para isso que é o método de máxima verossimilhança. Formalmente esse método é bastante complicado, mas é possível entendê-lo intuitivamente.
     Imaginemos um número infinito de pontos dispostos sobre uma linha (uma premissa bastante razoável pois os genes estão arranjados linearmente sobre o cromossomo). Cada ponto terá uma determinada distância de cada um dos marcadores. Quanto maior for a distância, menor a probabilidade de que o marcador esteja detectando os efeitos daquele ponto. Admitimos isso pois a probabilidade de recombinação aumenta com a distância. Calculamos então, para cada um dos pontos imaginários, os efeitos detectados por cada um dos marcadores multiplicados por uma função que é inversamente proporcional à distância entre o ponto e o marcador. Colocando isso em um gráfico teremos algo do tipo:
     Evidentemente o ponto mais alto da linha arroxeada é o ponto de maior probabilidade de existir um QTL para a característica. Como se espera que essa linha correspondente aos efeitos combinados oscile devido a desvios ao acaso inerentes a qualquer experimento dessa natureza, não existe necessariamente um QTL para qualquer máximo da curva, apenas aqueles máximos que estiverem acima do nível de oscilação esperado ao acaso. A altura da linha de significância dependerá:
1. Do tamanho da amostra. Em amostra muito pequenas espera-se grandes oscilações ao acaso relativamente e portanto a linha de significância será muito alta. Nesse caso, os QTLs passíveis de identificação são aqueles que possuem efeitos muito fortes, ou então passarão desapercebidos.
2. Da densidade de marcadores. Quanto mais marcadores, maior será o poder de detecção dos efeitos combinados.
3. Da distribuição dos marcadores ao longo do cromossomo. Se eles estiverem com uma distribuição muito agregada, teríamos grande poder de detecção nas regiões com alta densidade, mas isso, na prática,  faria com que eles funcionassem como um único marcador.
4. Do número de características fenotípicas considerado no estudo. A análise de muitos marcadores por enquanto é cara e trabalhosa. Para que o estudo tenha maior chance de sucesso, um programa bem realizado procurará aumentar a chance de se descobrir efeitos de genes em fenótipos e obviamente quanto mais características métricas forem analisadas, maior a probabilidade de se encontrar marcadores associados a locos com efeitos significativos.

Efeitos ambientais

     Muitas vezes, não é possível controlar as condições ambientais completamente, como seria o desejado. Nesse caso, é importante que os efeitos do ambiente sejam minimizados, para podermos detectar apenas os efeitos dos genótipos. Suponha que, no estudo de cruzamentos entre plantas, a amostra consista em um conjunto de colheitas que ocorreram em anos diferentes. Todos sabem que existem anos "bons" e anos "ruins". Para desprezarmos o efeito dos anos podemos fazer um teste estatístico que mede o quanto cada um dos anos influenciou na média dos efeitos fenotípicos. Para isso o teste de análise de variância é empregado. Esse teste também é conhecido como ANOVA (do inglês "ANalysis Of VAriance"). Com ele podemos verificar qual foi o efeito médio de cada ano e, antes da análise associada aos genótipos, desprezar esses efeitos, subtraíndo-os. Outro caso em que esse teste pode ser empregado é aquele em que a amostra de animais seja obtido de fazendas diferentes. Também podem ocorrer combinações de anos diferentes com fazendas diferentes, mas a análise de variância pode também ser aplicada em três ou mais vias.

Efeitos de dominância, heterose e epistasia

     Esses são os efeitos que prejudicam a previsibilidade dos programas de estudo que envolvem genética quantitativa clássica. Infelizmente os métodos de detecção de QTLs continuam privilegiando genes de efeito aditivo. A verificação dos efeitos de dominância dependem fortemente do desenho experimental, como podemos ver pela comparação dos desenhos de segregação em F2 e de retrocruzamento. A heterose necessariamente resulta de interações entre alelos diferentes nos mesmos locos ou entre locos. É um efeito que resulta da contribuição de genomas diferentes que ocorrem simultaneamente nos híbridos. O efeito heterose é empregado com sucesso há muito tempo para aumento de produção e de outras características desejáveis, portanto seria muito importante dissecar o efeito heterótico em seus componentes de heterosigozidade e epistasia. A verificação de epistasia normalmente é realizada apenas após a verificação de efeitos de QTLs individuais onde apenas aqueles QTLs que produzem efeitos significativos são testados para epistasia. Isso não necessariamente é verdade, já se demonstrou em certos estudos que genes sem efeito individual detectável podem interagir entre si com enorme efeito combinado. Mas o grande problema de se verificar efeitos de interação entre genes é a necessidade de amostras muito grandes. Para entendermos isso, imaginemos que em um determinado desenho experimental possam ser analisados três genótipos para cada loco. Para a análise de cada loco vamos supor que se optou para ter cerca de 30 indivíduos de cada genótipo, fazendo um total de 90 para a amostra como um todo (isso é um pouco absurdo pois a probabilidade de ter proporções iguais em genética raramente é satisfeita, mas podemos pensar nisso a título de simplificação). Para ter um poder estatístico equivalente, a análise de interações entre dois locos exigiria 3X3 combinações. Nesse caso a amostra saltaria para 270 indivíduos. Para interações entre três locos esse número chegaria a 810, quase dez vezes o necessário para o estudo loco por loco!

Ítem anterior: Marcadores moleculares

Ítem seguinte: Perspectivas futuras

Voltar para página principal.

Voltar para o topo da página.