Em formação

$ F_ {ST} $ ao considerar um locus multialélico


Sewall Wright definiu $ F_ {ST} $ em uma metapopulação como sendo:

$$ F_ {ST} = frac { text {Var} (p)} { bar p (1- bar p)} $$

, onde $ p $ é um vetor de frequências de um determinado alelo e $ bar p $ e $ text {Var} (p) $ são a média e a variância desse vetor.

Por exemplo, considere uma metapopulação composta de 4 subpopulações. As frequências de alelos nestas 4 subpopulações são p = [0,2, 0,5, 0,8, 0,3]. $ bar p $ é a média de $ p $ ($ bar p = 0,45 $) e $ text {Var} (p) $ é a variância de $ p $ ($ text {Var} (p) = 0,07 espaço $).

Pergunta

Podemos definir $ F_ {ST} $ para um locus de alelo múltiplo? Ou deve $ F_ {ST} $ ser definido para cada alelo independentemente?


Resposta curta: sim, as pessoas formularam maneiras de estimar $ F_ {ST} $ para loci multialélicos, por ex. microssatélites. Para uma revisão, veja aqui.

Especificamente, Nei poderia definir $ F_ {ST} $ para vários alelos como

$ F_ {ST} = frac {(H_t - H_s)} {H_t} $,

ou seja, a proporção da heterozigosidade total que ocorre entre as populações, e não dentro. Isso é agnóstico em relação ao número de alelos, pois usa apenas heterozigosidade. Acredito que também existam outras formulações.

Existem estatísticas alternativas, como $ G_ {ST} $ e $ R_ {ST} $ (links abaixo de cada um) que são concebidos especificamente para o problema multialélico, consulte também a revisão para uma discussão mais aprofundada. Basicamente, os microssatélites têm altas taxas de mutação, o que desinfla a estatística; esse provavelmente será o caso para a maioria dos loci multialélicos.

Não está claro, porém, qual estatística funciona melhor na prática, tanto quanto posso dizer.


Frequências alélicas desiguais no locus de auto-incompatibilidade dentro das populações locais de Prunus avium L .: um efeito da estrutura populacional?

Neste artigo, investigamos a estrutura genética e a distribuição de frequências alélicas no locus de auto-incompatibilidade gametofítica em três populações de. Prunus avium L. De acordo com as previsões teóricas sob seleção de balanceamento, a estrutura genética no locus de auto-incompatibilidade foi quase três vezes menor do que em sete microssatélites não ligados. Além disso, descobrimos que as frequências do alelo S em populações de cereja selvagem se afastaram significativamente da distribuição isofética esperada para a qual a seleção de equilíbrio deve conduzir as frequências alélicas (isto é, frequência idêntica igual ao inverso do número de alelos na população). Para avaliar se esse desvio poderia ser causado apenas pela deriva ou pela estrutura da população, usamos simulações numéricas para comparar nossas observações com as distribuições de frequência alélica esperadas: (1) dentro de um único deme de uma população subdividida com vários níveis de diferenciação e (2) ) dentro de uma população panmítica finita com diversidade alélica idêntica. Também investigamos os efeitos do tamanho da amostra e do grau de estrutura da população em testes de desvio do equilíbrio isoplético. No geral, nossos resultados mostraram que as distribuições de frequência de alelos observadas eram consistentes com um modelo de população subdividida com demes ligadas por taxa de migração moderada.


Resumo

Centenas de variantes do número de cópias são complexas e multialélicas, pois têm muitos alelos estruturais e foram reorganizadas várias vezes nos ancestrais que contribuíram com cromossomos para os humanos atuais. Não são apenas as relações desses CNVs multialélicos (mCNVs) com fenótipos geralmente desconhecidos, mas muitos mCNVs ainda não foram descritos nos níveis básicos - alelos, frequências de alelos, características estruturais - que suportam a investigação genética. Até o momento, a maioria das associações de doenças relatadas a essas variantes foram verificadas por meio de estudos de genes candidatos. No entanto, apenas algumas associações alcançaram o nível de aceitação definido por replicações duráveis ​​em muitas coortes. Isso provavelmente decorre de desafios de longa data em fazer medições moleculares precisas dos alelos que os indivíduos têm nesses loci. No entanto, as abordagens para a análise de mCNV estão melhorando rapidamente e algumas das características exclusivas dos mCNVs podem ajudar em estudos de associação futuros. Seus vários alelos estruturais são susceptíveis de ter diferentes magnitudes de efeito, criando uma série alélica natural de impacto fenotípico crescente e dando aos investigadores um conjunto de previsões naturais e hipóteses testáveis ​​sobre a extensão em que cada alelo de um mCNV predispõe a um fenótipo. Além disso, a correlação baixa a modesta de mCNVs com polimorfismos de nucleotídeo único (SNPs) individuais pode tornar mais fácil distinguir entre mCNVs e SNPs próximos como os condutores de um sinal de associação e, talvez, possibilitar a triagem preliminar de loci candidatos, ou o genoma inteiro, para as muitas relações mCNV-doença que ainda precisam ser descobertas.


Introdução

Inferir conectividade populacional de dados moleculares dentro de uma estrutura genética populacional pode lançar luz sobre os processos evolutivos e ecológicos que moldam os padrões de diversidade genética (Clobert et al. 2012). Abordagens de genética populacional oferecem métodos convenientes para avaliar a taxa e escala de dispersão (ou migração) quando o movimento de indivíduos não pode ser avaliado por outros meios, como experimentos de campo de marcação-recaptura. Este problema é particularmente agudo no ambiente marinho, onde a distribuição e as vias migratórias dos organismos estão escondidas aos olhos humanos sob a superfície dos oceanos (Hellberg 2009 Selkoe e Toonen 2011). O potencial dos métodos genéticos, ilustrado por estudos bem-sucedidos em espécies de recifes (Selkoe et al. 2010 Puebla et al. 2012), aumentou as expectativas para inferir padrões de conectividade marinha de marcadores moleculares, especialmente para fins de conservação e manejo.

A maioria das espécies marinhas, no entanto, exibe combinações de traços de história de vida (por exemplo, alta fecundidade, grandes tamanhos populacionais, alto potencial de dispersão, muitas vezes combinado com ciclos de vida complexos) que produzem padrões fracos de diferenciação genética ou mesmo nenhuma diferenciação (Ward et al . 1994 Waples 1998 Palumbi 2003 Hedgecock et al. 2007). A falta de diferenciação genética pode resultar de uma série de situações que vão desde a independência demográfica quase completa entre populações de grande porte até a existência de uma população panmítica única (Palumbi 2003 Waples e Gaggiotti 2006 Waples et al. 2008) (Fig. 1). A homogeneidade genética espacial pode, portanto, ocultar uma grande diversidade de cenários no que diz respeito às taxas contemporâneas de trocas demográficas entre grupos de indivíduos que habitam diferentes partes de uma gama de espécies. Isso é particularmente preocupante porque o número de migrantes por geração, que é suficiente para levar à aparente panmixia genética, pode não ser alto o suficiente para garantir a conectividade demográfica e os efeitos de resgate (Waples 1998 Lowe e Allendorf 2010). Esta discrepância entre o objetivo de inferir conectividade demográfica para fins de biologia da conservação e manejo e as limitações inerentes à maioria das abordagens genéticas populacionais motivou várias revisões no campo (Waples e Gaggiotti 2006 Broquet e Petit 2009 Hellberg 2009 Lowe e Allendorf 2010). Nosso objetivo aqui não é fornecer uma nova síntese dos métodos existentes para inferir a conectividade, que foram completamente abordados nessas revisões. Em vez disso, pretendemos considerar as novas perspectivas oferecidas pelo crescente número de marcadores em estudos de genômica populacional, com um foco especial no uso de loci influenciados pela seleção. A rápida disseminação de métodos de genotipagem baseados em sequenciamento de próxima geração (NGS) na caixa de ferramentas dos ecologistas moleculares aumentou consideravelmente nossa capacidade de identificar e caracterizar a variação genética de amostras populacionais (Davey et al. 2011). Ainda assim, não está claro quais abordagens se beneficiarão mais com essa enorme quantidade de dados de sequência. Um benefício direto da análise de milhares de marcadores é uma maior precisão na medição da diferenciação genética e um maior poder estatístico para detectar pequenas diferenças genéticas entre as populações (Waples 1998). No entanto, populações com grandes tamanhos efetivos, altas taxas de migração ou ambos podem permanecer virtualmente indiferenciadas e, portanto, a multiplicação de marcadores neutros em tais casos pode ainda não revelar o nível atual de conectividade demográfica.

Outra grande conquista oferecida pelas abordagens NGS é facilitar a descoberta de marcadores genéticos que são influenciados pela seleção (Allendorf et al. 2010 Stapley et al. 2010). Esses loci atípicos podem revelar padrões de diferenciação genética no local onde os marcadores neutros muitas vezes permanecem não informativos e, portanto, foi sugerido que o sinal mantido por loci atípicos poderia ser usado para delinear estoques adaptados localmente e redefinir unidades de conservação (Nielsen et al. 2009 , 2012 Funk et al. 2012). Esta abordagem é atraente porque a seleção pode ser muito mais eficiente do que a deriva na oposição ao efeito de homogeneização da migração, em particular quando as populações têm grandes tamanhos efetivos. No entanto, loci atípicos podem surgir por meio de uma ampla variedade de mecanismos evolutivos além da adaptação local, que é o alvo principal da maioria dos estudos de varredura do genoma em busca de variação adaptativa (Bierne et al. 2013). Esses mecanismos evolutivos, portanto, precisam ser identificados antes de usar loci outlier para avaliar a conectividade.

Espera-se que as mudanças de frequência de alelos em loci atípicos se concentrem em regiões geográficas específicas onde fortes gradientes ecológicos promovem a adaptação local (Schmidt et al. 2008). Hotspots de diferenciação genética também podem surgir através da captura de zonas de tensão por barreiras naturais à dispersão (Barton 1979a), ou através do acoplamento entre barreiras reprodutivas exógenas e endógenas (Bierne et al. 2011). Essas previsões são corroboradas por conhecidos pontos críticos de diferenciação genética no mar (por exemplo, a frente de Almeria-Oran, o estreito Siculo-Tunisian, Cape Agulhas, Cape Cod, Oresund, Point Conception, entre outros). No entanto, as questões de conservação e gestão marinha frequentemente requerem medidas de conectividade em áreas localizadas fora dessas zonas específicas. Em uma última seção, exploramos mecanismos alternativos que geram desequilíbrio em loci caroneiros neutros, mesmo fora do cline do próprio locus selecionado. Esses efeitos indiretos da seleção podem revelar estruturas genéticas crípticas dentro de áreas aparentemente bem misturadas. Esses efeitos são de dois tipos: (i) gradientes de introgressão (ou caudas de introgressão) originados de uma zona de contato geograficamente distante (Gagnaire et al. 2011) e (ii) clines de carona que são gerados temporariamente durante a propagação de uma varredura seletiva ( Bierne 2010). Grandes conjuntos de dados genômicos populacionais agora fornecem aos ecologistas moleculares os meios para usar esses padrões para estudar a conectividade marinha. Portanto, há uma boa esperança de que a coleta de base teórica com esses novos dados irá catalisar ainda mais a pesquisa na área.


Estudos de genes candidatos de associações de mCNV

Até o momento, a maioria das associações entre doença e mCNV relatadas foram verificadas por meio de estudos de genes candidatos. Como resultado, um punhado de genes recebeu a maior parte da atenção da pesquisa, provavelmente por causa de seus papéis já conhecidos ou hipotéticos em doenças de interesse. Esses genes incluem FCGR3B (liga a região Fc das imunoglobulinas gama), CCL3L1 [ligante do co-receptor do vírus da imunodeficiência humana (HIV)], beta-defensinas (grupo de peptídeos microbicidas e citotóxicos), HBA1 / 2 (cadeia α da hemoglobina) e C4 (parte da via do complemento) [18-31]. Os tamanhos das coortes nesses estudos variaram de 50 a 2.807, com uma tendência de os estudos iniciais terem menos amostras e os estudos de tentativa de replicação terem mais (Tabela 1).

Notáveis ​​associações de doenças do mCNV e seus estudos de replicação

Notáveis ​​associações de doenças do mCNV e seus estudos de replicação

Até o momento, o estudo de associações de mCNV com doença se assemelha ao estudo de associações de polimorfismo de nucleotídeo único (SNP) na era do estudo de associação pré-genoma (GWAS). Antes de 2005, os estudos de SNP focavam em genes candidatos e variantes digitados em pequenas coortes. Tais estudos tiveram um histórico sensato: milhares de associações foram relatadas, mas apenas um punhado replicado em outros estudos de genes candidatos ou em estudos posteriores de associação genômica bem desenvolvidos [32-34]. Em retrospecto, a ciência não foi boa em adivinhar quais genes contribuem para fenótipos geneticamente complexos; foram necessárias pesquisas imparciais de todo o genoma para identificar tais genes. No final, os vieses de publicação (particularmente o aumento da probabilidade de publicação e visibilidade para resultados positivos, em relação aos resultados negativos), combinados com limites estatísticos modestos e um grande número de hipóteses sendo testadas em todo o campo, tornou provável que muitos estudos encontrassem valores nominais níveis de associação - mesmo na ausência de relações genéticas subjacentes reais. Vale a pena considerar essas lições moderadas ao pensar sobre a trajetória da análise de doença-mCNV.

Como estudos de genes candidatos SNP há uma década, apenas algumas associações de mCNV-doença atingiram o nível de aceitação definido por replicações em coortes independentes por grupos independentes de investigadores [20, 23, 27, 28, 35]. Um exemplo convincente dos desafios da replicação pode ser encontrado no estudo Wellcome Trust Case Control (WTCCC), que usou uma tecnologia de genotipagem CNV baseada em array para realizar um GWAS de milhares de CNVs em oito doenças comuns. Apesar de boas medições de número de cópias (como discutido abaixo) e um tamanho de amostra maior do que os estudos anteriores (aproximadamente 2.000 casos), o estudo WTCCC não replicou três associações publicadas anteriormente (FCGR3B na artrite reumatóide, CCL3L1 na artrite reumatóide e β-defensinas na doença de Crohn). A não replicação também incomodou outras associações, sendo outro exemplo CCL3L1Impacto sobre os fenótipos relacionados ao HIV [25].

Estudo de caso em replicação: CCL3L1 e HIV

Uma das associações de mCNV mais conhecidas foi relatada em 2005 em Ciência [ 25]. CCL3L1, um gene que codifica um ligante para o co-receptor do vírus HIV, varia de 0 a 14 cópias em genomas diplóides. Descobriu-se que ter um número de cópias CCL3L1 abaixo da média está associado ao aumento da suscetibilidade ao HIV e à progressão mais rápida do status de HIV + para a síndrome da imunodeficiência adquirida (AIDS) [25]. Após a publicação, muitos estudos de acompanhamento buscaram replicar e expandir os resultados (Tabela 2). Novos fenótipos foram testados nas mesmas coortes e novas coortes foram testadas para as mesmas associações, cada uma tendo sucesso um tanto limitado, resultando em um padrão complicado de replicação e não replicação que impede a interpretação final [11, 36-49]. Estudos separados tentaram rastrear as causas dos resultados divergentes, concluindo que certas práticas analíticas - como a genotipagem de casos e controles separadamente e arredondamento das medições do número de cópias brutas para o número inteiro mais próximo - provavelmente geraram associações falso-positivas [48- 53]. Nossa própria análise sugere um padrão adicional: os estudos que encontraram associações positivas foram publicados visivelmente e citados muitas vezes, enquanto os estudos que encontraram associações negativas (quando publicados) foram menos visíveis. Debate sobre CCL3L1O impacto sobre o HIV provavelmente continuará, e exemplos como CCL3L1 destacam a necessidade de métodos experimentais e designs que garantam resultados de associação duradouros.

Resultados de estudos que avaliam se CCL3L1 o número de cópias afeta os fenótipos relacionados ao HIV

Resultados de estudos que avaliam se CCL3L1 o número de cópias afeta os fenótipos relacionados ao HIV


População genômica e diversidade fenotípica de invasivos Drosophila suzukii no Havaí

No contexto da teoria da evolução, a biologia da invasão fornece um enigma fantástico: como uma espécie com variação genética permanente limitada sobrevive e se adapta a um novo ambiente? Diversidade genética reduzida é tipicamente associada com baixo potencial evolutivo e aptidão, mas algumas espécies introduzidas provaram ser invasoras bem-sucedidas, apesar de passarem por um gargalo genético durante os estágios iniciais da colonização. Nosso objetivo neste estudo foi caracterizar a diversidade genômica e fenotípica de populações invasoras Drosophila suzukii (Diptera: Drosophilidae) desde a colonização do arquipélago havaiano na década de 1980. A análise do fenótipo da asa revelou que as populações de grande altitude possuíam asas significativamente maiores do que as de baixa altitude, apoiando a hipótese de que os insetos lidam com ambientes de grande altitude desenvolvendo asas maiores. Embora tenhamos descoberto baixa diversidade genética e diferenciação em todas as populações do Havaí, três agrupamentos genéticos únicos foram detectados com uma abordagem estatística multivariada sem modelo. Identificamos 23 loci candidatos sob seleção usando duas análises complementares para detectar FST outliers em todo o genoma. Para 12 desses loci, as proteínas previstas estão associadas com Drosófila spp. quimiossensação, transporte de aminoácidos e íons de sódio, uma via efetora de Ras e desaminação de citidina. Apesar de um gargalo genético, aventura D. suzukii as populações estão começando a se diferenciar em todo o arquipélago havaiano e a seleção para os principais processos comportamentais e celulares provavelmente está em andamento.

Esta é uma prévia do conteúdo da assinatura, acesso através de sua instituição.


Resumo

Atualmente, o perfil de DNA forense permite a identificação de pessoas já conhecidas pelas autoridades investigadoras. Avanços recentes produziram novos tipos de marcadores genéticos com potencial para superar algumas limitações importantes dos métodos atuais de criação de perfis de DNA. Além disso, outros desenvolvimentos estão permitindo que tipos completamente novos de informações relevantes do ponto de vista forense sejam extraídos de amostras biológicas. Isso inclui novas abordagens moleculares para encontrar indivíduos até então desconhecidos dos investigadores e novos métodos moleculares para apoiar ligações entre doadores de amostras forenses e atos criminosos. Esses avanços em genética, genômica e biologia molecular provavelmente melhorarão o trabalho forense de humanos em um futuro próximo.


Aplicação a Dados

Nós ilustramos os limites em F, M, e HT para uma série de exemplos usando dados de polimorfismo humano de Rosenberg et al. (2005) e Li et al. (2008). Para cada exemplo, para cada locus, assumimos que as frequências de alelos nos conjuntos de dados são frequências de alelos paramétricos. As frequências alélicas paramétricas são obtidas em cada um de um par de populações e, em seguida, são calculadas a média para obter as frequências alélicas paramétricas para a população total. F, M, e HT são então calculados. O conjunto de dados de Rosenberg et al. (2005) considera 1048 indivíduos genotipados para 783 microssatélites, e o conjunto de dados de Li et al. (2008) considera 938 indivíduos não relacionados genotipados para polimorfismos de nucleotídeo único (SNPs) para todas as análises, restringimos nossa atenção aos 935 indivíduos encontrados em ambos os conjuntos de dados. Para o Li et al. (2008) dados, examinamos apenas 640.034 SNPs estudados por Pemberton et al. (2012).

Exemplo 1: africanos e nativos americanos

Nosso primeiro exemplo considera microssatélites em 101 africanos e 63 nativos americanos, e é escolhido para ilustrar uma gama relativamente ampla de valores de F, M, e HT. A Figura 7 mostra F e M, demonstrando que para a comparação de africanos e nativos americanos, F & lt 0,1 para a maioria dos 783 loci. O valor médio de F é 0,05 com desvio padrão de 0,06 e o ​​valor médio de M é 0,37 com desvio padrão 0,11.

F e a frequência do alelo mais frequente (M) para 101 africanos e 63 nativos americanos. Em cada um dos 783 loci microssatélites, as frequências alélicas são calculadas separadamente para os dois grupos da população, e a frequência alélica total é a média das frequências dos dois grupos. Cada caixa tem tamanho 0,01 × 0,01 e o limite superior em F como a função de M é mostrado para comparação.

Da mesma forma, a Figura 8 plota F e HT para os 783 loci. O significativo HT é 0,25 com desvio padrão de 0,08. Em ambas as Figuras 7 e 8, relativamente poucos loci se aproximam do limite superior em F.

F e homozigose (HT) para 101 africanos e 63 nativos americanos. Em cada um dos 783 loci microssatélites, as frequências alélicas são calculadas separadamente para os dois grupos populacionais, e a frequência alélica total é a média das frequências dos dois grupos. Cada caixa tem tamanho 0,01 × 0,01 e o limite superior em F como a função de HT é mostrado para comparação.

Exemplo 2: populações de alta e baixa diversidade

Os limites em F como a função de M e HT indicam que a diversidade genética em um par de populações tem um forte efeito sobre o valor de F entre eles. Para ilustrar este ponto, comparamos os valores de F obtidos de duas populações, cada uma com alta diversidade dentro da população, àqueles obtidos de duas populações com menor diversidade dentro da população.

As populações Yoruba e Mbuti Pygmy são duas populações africanas com alta diversidade genética, as populações colombiana e Pima são populações nativas americanas com menor diversidade. A Figura 9A mostra F e M calculado a partir das populações Yoruba e Mbuti Pygmy, e a Figura 9B mostra F e HT. O valor médio de F é 0,04 com desvio padrão 0,03, o valor médio de M é 0,35 com desvio padrão 0,11 e o valor médio de HT é 0,24 com desvio padrão 0,08.

Relações entre F, M, e HT, para pares de populações africanas e nativas americanas. (UMA) F e M para 21 indivíduos iorubá e 15 pigmeus Mbuti. (B) F e HT para 21 indivíduos iorubá e 15 pigmeus Mbuti. (C) F e M para 7 colombianos e 14 pima. (D) F e HT para 7 colombianos e 14 pima. Em cada parcela, em cada um dos 783 loci microssatélites, as frequências alélicas são calculadas separadamente para as duas populações, e a frequência alélica total é a média das duas frequências populacionais. Cada caixa tem tamanho 0,01 × 0,01 e o limite superior em F é mostrado para comparação.

Em contraste, em parcelas correspondentes para as populações colombianas e Pima menos diversas, valores mais elevados de F, M, e HT são aparentes (Figura 9, C e D). Em particular, porque M e HT tendem a estar mais próximos de 1/2, maiores valores de F e possivel. Os valores médios de M e HT estão muito mais próximos de 1/2 do que nos grupos africanos, a média M é 0,50 com desvio padrão 0,15, e a média HT é 0,38 com desvio padrão 0,15. Como é sugerido pelo fato de que F pode atingir seus maiores valores quando M e HT encontra-se perto de 1/2, o valor médio de F para os grupos de nativos americanos é quase duas vezes maior do que para os grupos africanos (média 0,07, desvio padrão 0,07).

Exemplo 3: Polimorfismos de nucleotídeo único

Nosso terceiro exemplo considera SNPs no mesmo conjunto de africanos e nativos americanos para os quais microssatélites foram examinados nas Figuras 7 e 8. A Figura 10 mostra a distribuição conjunta de F e M bem como a média e mediana de F para intervalos de M variando de 1/2 a 1 com largura 0,01. Valores médios de F diminuir com M para M ε (1/2, 1), e esta diminuição está correlacionada com o valor decrescente do limite em F como a função de M (r = 0,94). Comparado com a média, o valor mediano de F é menos correlacionado com o valor do limite, embora também diminua com o aumento M (r = 0.77).

Gráfico de dispersão suavizado de F como a função de M para 101 africanos e 63 nativos americanos, usando dados SNP. O sombreamento reflete uma estimativa de densidade de kernel bidimensional usando um kernel Gaussiano com largura de banda definida como 0,007, a densidade foi definida como 0 fora dos limites em F como a função de M. Para cada um dos 640.034 loci SNP, as frequências do alelo são calculadas separadamente para os dois grupos da população, e a frequência total do alelo é a média das frequências dos dois grupos. A média e mediana de F são calculados para 50 caixas de largura 0,01 variando de M = 1/2 a M = 1. O limite superior em F como a função de HT é mostrado para comparação.

Para marcadores bialélicos, para M & gt 1/2, pelo menos um dos dois alelos deve aparecer em ambas as populações, e o limite superior em F ocorre quando uma das populações tem apenas um alelo. Na Figura 10, para altos valores de M, mais SNPs se aproximam do limite superior em F do que para valores baixos de M. Este resultado indica que SNPs com altos valores de M são mais propensos a ter um alelo encontrado em uma, mas não na outra das duas populações.


Conteúdo

No genoma de um organismo, cada gene está localizado em um local específico denominado locus desse gene. As variações alélicas nesses locais causam variação fenotípica dentro das espécies (por exemplo, cor do cabelo, cor dos olhos). No entanto, a maioria dos alelos não tem um impacto observável no fenótipo. Dentro de uma população, novos alelos gerados por mutação morrem ou se espalham pela população. Quando uma população é dividida em diferentes populações isoladas (por fatores geográficos ou ecológicos), as mutações que ocorrem após a divisão estarão presentes apenas na população isolada. A flutuação aleatória das frequências alélicas também produz diferenciação genética entre as populações. Este processo é conhecido como deriva genética. Ao examinar as diferenças entre as frequências de alelos entre as populações e calcular a distância genética, podemos estimar há quanto tempo as duas populações foram separadas. [5]

Embora seja simples definir a distância genética como uma medida de divergência genética, existem várias medidas estatísticas diferentes que foram propostas. Isso aconteceu porque diferentes autores consideraram diferentes modelos evolutivos. Os mais comumente usados ​​são a distância genética de Nei, [5] medida de Cavalli-Sforza e Edwards, [6] e a distância genética de Reynolds, Weir e Cockerham, [7] listados abaixo.

Distância genética padrão de Nei Editar

Em 1972, Masatoshi Nei publicou o que veio a ser conhecido como distância genética padrão de Nei. Esta distância tem a boa propriedade de que se a taxa de mudança genética (substituição de aminoácidos) for constante por ano ou geração, então a distância genética padrão de Nei (D) aumenta em proporção ao tempo de divergência. Esta medida assume que as diferenças genéticas são causadas por mutação e deriva genética. [5]

A distância padrão de Nei pode então ser escrita como [5]

Distância do acorde Cavalli-Sforza Editar

Em 1967, Luigi Luca Cavalli-Sforza e A. W. F. Edwards publicaram esta medida. Ele assume que as diferenças genéticas surgem devido apenas à deriva genética. Uma grande vantagem dessa medida é que as populações são representadas em uma hiperesfera, cuja escala é de uma unidade por substituição de gene. A distância da corda na esfera hiperdimensional é dada por [2] [6]

Distância genética de Reynolds, Weir e Cockerham Editar

Em 1983, esta medida foi publicada por John Reynolds, Bruce Weir e C. Clark Cockerham. Essa medida assume que a diferenciação genética ocorre apenas por deriva genética, sem mutações. Ele estima o coeficiente de coancestry Θ < displaystyle Theta> que fornece uma medida da divergência genética por: [7]

Outras medidas Editar

Muitas outras medidas de distância genética foram propostas com sucesso variável.

Nei's DUMA distância 1983 Editar

Esta distância assume que as diferenças genéticas surgem devido à mutação e deriva genética, mas esta medida de distância é conhecida por fornecer árvores populacionais mais confiáveis ​​do que outras distâncias, particularmente para dados de DNA de microssatélites. [9] [10]

Distância euclidiana Editar

Distância de Goldstein 1995 Editar

Distância genética mínima de Nei 1973 Editar

Esta medida assume que as diferenças genéticas surgem devido à mutação e deriva genética. [13]

Distância de Roger 1972 Editar

Índice de fixação Editar

Uma medida comumente usada de distância genética é o índice de fixação (FST) que varia entre 0 e 1. Um valor de 0 indica que duas populações são geneticamente idênticas (diversidade genética mínima ou nenhuma entre as duas populações), enquanto um valor de 1 indica que duas populações são geneticamente diferentes (diversidade genética máxima entre as duas populações ) Nenhuma mutação é assumida. Grandes populações entre as quais há muita migração, por exemplo, tendem a ser pouco diferenciadas, enquanto pequenas populações entre as quais há pouca migração tendem a ser muito diferenciadas. FST é uma medida conveniente dessa diferenciação e, como resultado, FST e as estatísticas relacionadas estão entre as estatísticas descritivas mais amplamente utilizadas em genética populacional e evolutiva. Mas FST é mais do que uma estatística descritiva e medida de diferenciação genética. FST está diretamente relacionado ao Variância na frequência do alelo entre as populações e, inversamente, no grau de semelhança entre os indivíduos dentro das populações. Se FST é pequeno, isso significa que as frequências de alelos dentro de cada população são muito semelhantes se for grande, isso significa que as frequências de alelos são muito diferentes.


Materiais e métodos

Amostras

No total, 572 peixes brancos europeus (Coregonus lavaretus sensu lato) indivíduos amostrados entre 1979 e 2013 na Estônia, Finlândia, Rússia e Suécia foram analisados ​​(Tabela 1, Fig. 1). Os espécimes foram amostrados principalmente por pescadores locais de 15 locais no Mar Báltico (12 amostras do ecótipo de desova do mar, incluindo réplicas temporais de Tengsöda) e nos estuários do rio Báltico (quatro amostras do ecótipo de desova do rio) durante o período de desova (Outubro Novembro). Além disso, os espécimes de duas populações de peixes brancos foram coletados nos lagos Ladoga (Rússia) e Saadjärv (Estônia), e esta última população foi estabelecida na década de 1960 por estocagem de peixes brancos do Lago Peipus (Estônia / Rússia).


Assista o vídeo: 7 VERIFICANDO EL EQUILIBRIO H W EN UNA POBLACION (Janeiro 2022).