Em formação

7.S: Modelos de evolução de caráter discreto (Resumo) - Biologia


Neste capítulo, descrevi o modelo Mk, que pode ser usado para descrever a evolução de caracteres discretos que possuem um número definido de estados fixos. Todos esses modelos podem ser usados ​​para simular a evolução de caracteres discretos em árvores.

Em resumo, o modelo Mk e o modelo Mk estendido são modelos gerais que podem ser usados ​​para a evolução de caracteres discretos. No próximo capítulo, mostrarei como ajustar esses modelos aos dados e usá-los para testar hipóteses evolutivas.

1: Imagine que você calcula uma taxa de mudança de personagem contando o número de mudanças de estado de um personagem ao longo de algum intervalo de tempo, t. Você pode calcular a taxa de mudança como nchumanges/t. A taxa instantânea é o valor que essa taxa se aproxima à medida que t fica cada vez menor, de modo que o intervalo de tempo é quase zero.

voltar ao texto principal

2: Não vou cobrir os detalhes da exponenciação da matriz aqui - leitores interessados ​​devem ver Yang (2006) para detalhes - mas os cálculos não são triviais.

voltar ao texto principal

3: Ainda se obtém a linha relevante de P(t) e desenha um desvio aleatório uniforme você. Imagine que temos um personagem de dez estados com estados de 0 a 9. Começamos no estado 0 no início da simulação. Novamente usando q = 0,5 e t = 3, descobrimos que:

(eq. 7.17)

$$ begin {array} {l} p_ {ii} (t) = frac {1} {k} + frac {k-1} {k} e ^ {- kqt} = frac {1} { 10} + frac {9} {10} e ^ {- 2 cdot 0,5 cdot 3} = 0,145 p_ {ij} (t) = frac {1} {k} - frac {1} { k} e ^ {- kqt} frac {1} {10} - frac {1} {10} e ^ {- 2 cdot 0,5 cdot 3} = 0,095 end {array} $$

Nós nos concentramos na primeira linha de P(t), que tem elementos:

$$ begin {bmatrix} 0,145 e 0,095 e 0,095 e 0,095 e 0,095 e 0,095 e 0,095 e 0,095 e 0,095 e 0,095 end {bmatrix} $$

Calculamos a soma cumulativa desses elementos, somando-os para que cada número represente a soma de si mesmo e de todos os elementos precedentes no vetor:

$$ begin {bmatrix} 0.145 & 0.240 & 0.335 & 0.430 & 0.525 & 0.620 & 0.715 & 0.810 & 0.905 & 1.000 end {bmatrix} $$

Agora nós comparamos você aos números neste vetor de soma cumulativa. Selecionamos o menor elemento que ainda é estritamente maior do que você, e atribua este estado de caractere para o final da ramificação. Por exemplo, se você = 0,475, o 5º elemento, 0,525, é o menor número que ainda é maior que você. Isso corresponde ao estado de caractere 4, que atribuímos ao final do ramo. Este último procedimento é um truque numérico. Imagine que temos um segmento de linha com comprimento 1. O vetor de soma cumulativa divide a linha unitária em segmentos, cada um dos quais é exatamente tão longo quanto a probabilidade de cada evento no conjunto. Em seguida, basta desenhar um número aleatório entre 0 e 1 usando uma distribuição uniforme. O segmento que contém este número aleatório é nosso evento.

voltar ao texto principal

Referências

Brandley, M.C., J.P. Huelsenbeck e J. J. Wiens. 2008. Taxas e padrões na evolução da forma do corpo de cobra em répteis squamate: Evidência para reevolução repetida de dedos perdidos e persistência de longo prazo de formas intermediárias do corpo. Evolução. Biblioteca Online Wiley.

Felsenstein, J. 2004. Inferring phylogenies. Sinauer Associates, Inc., Sunderland, MA.

Hedges, S. B., J. Dudley e S. Kumar. 2006. TimeTree: Uma base de conhecimento público de tempos de divergência entre organismos. Bioinformatics 22: 2971–2972.

Lewis, P. O. 2001. Uma abordagem de probabilidade para estimar a filogenia a partir de dados de caracteres morfológicos discretos. Syst. Biol. 50: 913–925.

Moch, J. G. e P. Senter. 2011. Estruturas vestigiais nos esqueletos apendiculares de oito espécies de lagartixas africanas (squamata, scincidae). Zool. 285: 274–280. Blackwell Publishing Ltd.

Pagel, M. 1994. Detectando evolução correlacionada em filogenias: Um método geral para a análise comparativa de caracteres discretos. Proc. R. Soc. Lond. B Biol. Sci. 255: 37–45. The Royal Society.

Paradis, E., J. Claude e K. Strimmer. APE: Análises de filogenética e evolução na linguagem R. Bioinformatics 20: 289–290. Acadêmico.oup.com.

Pianka, E. R., L. Vitt, N. Pelegrin, D. B. Fitzgerald e K. Winemiller. 2017. Em direção a uma tabela periódica de nichos, ou explorando o hipervolume de nicho do lagarto. Sou. Nat. 190: 601–616. journals.uchicago.edu.

Posada, D. jModelTest: Phylogenetic model averaging. Mol. Evol. 25: 1253–1256. Acadêmico.oup.com.

Streicher, J. W. e J. Phylogenomic analysis de mais de 4000 loci nucleares resolvem a origem de cobras entre famílias de lagartos. Lett. 13. rsbl.royalsocietypublishing.org.

Vitt, L. J., E. Pianka, W. E. Cooper Jr e K. Schwenk. 2003. História e ecologia global dos répteis squamate. 162: 44–60. journals.uchicago.edu.

Yang, Z. Evolução molecular computacional. Imprensa da Universidade de Oxford.


Processos de evolução do personagem

Estimativas de máxima verossimilhança de taxas e vieses podem ser obtidas para caracteres categóricos para dois modelos simples, o modelo Mk1 e o modelo AsymmMk. Para obter mais informações sobre esses modelos, consulte a página sobre a reconstrução do estado ancestral. Mesquite ainda não pode estimar parâmetros para modelos de evolução de sequência de DNA.
Três módulos fornecem cálculos para estimar parâmetros para os modelos Mk1 e AsymmMk:

  • Taxa estimada de Mk1 - estima a taxa de evolução de um personagem no modelo Mk1 simples.
  • Taxas para frente / para trás - Usa a probabilidade máxima para estimar as taxas de mudanças para frente e para trás (0 a 1 e 1 a 0 mudanças respectivamente), ou alternativamente a taxa geral e o viés em ganhos versus perdas, usando o modelo AsymmMk em uma árvore para um determinado personagem.
  • Teste de razão de verossimilhança de assimetria - Calcula a estatística de teste para o teste de razão de verossimilhança comparando os modelos assimétrico e um de parâmetro [2ln (L (Asymm.) / L (Mk1)], em uma árvore para um determinado caractere.

Correlações: visualizações

Para estudar correlações ou associações entre caracteres, existem calculadoras de correlação (consulte Comparações de pares, contrastes de Felsenstein e método de correlação de Pagel, abaixo) e visualizações heurísticas. Os últimos incluem:

    Janela de árvore do espelho - quando uma janela de árvore é aberta, você pode solicitar uma visualização alternativa da mesma árvore selecionando Árvore e janela de árvore do espelho. Isso mostra a mesma árvore da janela da árvore, mostrada em duplicatas dicas a dicas. O objetivo disso é permitir que você exiba duas visualizações diferentes (uma à esquerda, uma à direita) e as compare. As correlações de personagens podem ser exploradas traçando a evolução de dois personagens, como mostrado aqui.
    Arquivos de exemplo: Basic_Examples / tree_viewing / 08-mirrorTree.nex Ancestral_States / 15-Mk1AsymmCompare.nex Pairwise_Comparison / 01-pairwise.nex.

    Plot Tree 2D - Plota a árvore em um espaço bidimensional, disponível como uma forma de desenho de árvore no submenu Display & gtTree Form. Se os eixos representam o estado dos táxons em dois caracteres contínuos, isso permite mapear a árvore no espaço dos caracteres, o que pode sugerir padrões ou correlações. Os nós internos da árvore podem ser colocados nos estados ancestrais reconstruídos. Um exemplo é mostrado aqui.
    Arquivo de exemplo: Multivariate_Continuous / 07-anoles.nex

    Plot Tree 3D - Plota a árvore em um espaço tridimensional, disponível como uma forma de desenho de árvore no submenu Display & gtTree Form. Isso faz parte do pacote Rhetenor. Tal como acontece com Plot Tree 2d, isso permite mapear a árvore no espaço do personagem. A árvore pode ser girada no espaço usando os controles deslizantes de Rotação na legenda. Um exemplo é mostrado aqui.
    Arquivo de exemplo: Multivariate_Continuous / 08-anoles.nex

    Taxa de dispersão - Selecione Análise & gtNovo diagrama de dispersão para & gtTaxa para obter um gráfico bivariado para taxa. Você será questionado se deseja usar cálculos iguais ou diferentes para os dois eixos. Por "diferente" entende-se dois cálculos inteiramente diferentes, como a porcentagem de dados ausentes no táxon em um eixo e o estado de uma variável contínua no outro. Escolha & quotSame & quot e, se solicitado, indique que deseja & quotEstado contínuo do táxon & quot. Portanto, você estará plotando os táxons de acordo com seus estados em um caractere versus outro. Se o PDAP estiver instalado, você poderá fazer a regressão linear selecionando Scattegram & gtAnalysis & gt e escolhendo um dos Scattergram Diagnostics. Nota: qualquer correlação observada é afilogenética. As correlações filogenéticas podem ser estudadas usando os cálculos de contrastes de Felsenstein no PDAP.
    Arquivos de exemplo: Multivariate_Continuous / 01-wingsPlot.nex e subsequentes

Correlações: comparações de pares

  • A maioria dos pares - escolha pares para maximizar o número de pares, independentemente dos estados dos caracteres
  • Pares para um caractere - escolha pares de taxa que diferem no estado do primeiro caractere (variável independente)
  • Pares para dois personagens - escolha pares de taxa que diferem no estado de ambos os personagens

Contrastes independentes de Felsenstein

Os pontos no gráfico são nós na árvore, com os eixos X e Y representando o contraste independente através do nó em cada um dos dois personagens. Linhas de regressão, intervalos de confiança e outras estatísticas podem ser calculadas pelo PDAP. Quando apenas alguns nós da árvore são selecionados, eles são destacados no gráfico como mostrado acima.
A documentação do PDAP ou arquivos de exemplo devem ser consultados para mais detalhes.

Método de Correlação de Pagel

Se a diferença nas probabilidades entre os modelos quatro (independentes) e oito (correlacionados) for alta o suficiente, podemos rejeitar a hipótese nula de independência. Uma página separada do manual descreve os módulos Pagel94 em mais detalhes.


Ferramentas filogenéticas para biologia comparativa

Acabei de descobrir o que parece ser um novo bug na função fitMk fitools para ajustar o Mk modelo de evolução de traços discretos. fitMk usa código modificado de ape :: ace, mas foi adaptado para fazer uma variedade de coisas diferentes - como aceitar estados de ponta ambíguos (codificados como probabilidades anteriores em uma matriz) e uma densidade anterior flexível na raiz global da árvore . Eu acredito que rastreei o bug até a função usada internamente matexpo para exponenciação de matriz do macaco pacote. Quando eu substituo phytools :: expm (que na verdade envolve apenas msm :: MatrixExp, a função funciona novamente.

Só consegui que o bug apareça para pedidos, direcional modelos. Esse é, por exemplo, um modelo em que permitimos A & rarrB & rarrC, mas não o contrário.

Aqui está um exemplo usando um conjunto de dados de squamates e número de dígitos amp de um estudo de Matt Brandley et al. (2008). (Na verdade, os dados são simplificados porque nos dados originais algumas espécies são variáveis ​​em número de dígitos para um membro específico, o que é uma nuance que eu ignorei.)

Pode fazer sentido ajustar um modelo no qual ocorreu perda de dígitos 5 & rarr4 & rarr3 & rarr2 & rarr1 & rarr0, sem saltos entre números de dígitos não adjacentes e sem readquisição de dígitos. * (Eu não estou propondo imaginar que nenhum dos dois é possível, vamos supor que queremos se encaixam neste modelo aparentemente razoável.)

Podemos fazer isso da seguinte maneira:

Sei que esta não é a melhor maneira de visualizar nossos dados - mas mesmo assim:

direcional & lt-matrix (c (0,0,0,0,0,0, 1,0,0,0,0,0, 0,2,0,0,0,0, 0,0,3,0, 0,0, 0,0,0,4,0,0, 0,0,0,0,5,0), 6,6, byrow = TRUE, dimnames = lista (níveis (dedos), níveis (dedos) )) direcional

Nós tenho também foi capaz de ajustar este modelo usando fitMk, mas isso parece estar quebrado:

Vamos carregar a correção e testá-la da seguinte maneira:

Observe que, embora muito semelhantes, fitMk e fitDiscrete são ligeiramente diferentes porque usam suposições diferentes sobre o anterior na raiz da árvore. No entanto, parece que fitMk está corrigido e funcionando novamente.


7.6 Teste de Evolução Correlacionada de Caracteres Discretos com Máxima Verossimilhança em BayesTraits

Às vezes temos dois caracteres discretos (binários) e desejamos testar se a presença ou ausência de um caractere está correlacionada com a presença ou ausência do outro caractere (Pagel 1994). BayesTraits implementa métodos de máxima verossimilhança e bayesianos para testar tal hipótese. A seguir, descreveremos como usar BayesTraits em um sistema Macintosh para testar essa hipótese com máxima verossimilhança. Comece baixando BayesTraits, se ainda não o fez.

Para usar BayesTraits para este teste, você precisa de dois arquivos: um arquivo de árvore formatado no Nexus e um arquivo de formato de texto com informações de caracteres. BayesTraits só aceita árvores totalmente resolvidas (sem politomias) com comprimentos de ramificação. Para este exemplo, usaremos novamente o conjunto de dados de edema sexual que foi usado nas seções 3.1-3.6. Neste exemplo, resolvemos aleatoriamente nós politômicos em comparação com a árvore que fornecemos no capítulo 3. O arquivo de árvore pode ser encontrado aqui:

O arquivo de caracteres também está contido em um arquivo de texto que você pode obter a seguir. O primeiro caractere neste arquivo é o mesmo dado de inchaço sexual anterior, enquanto o segundo caractere é o sistema social codificado como unimale-multifemale (0) ou multimale-multifemale (1). Visto que os inchaços são considerados anúncios sexualmente proceptivos no contexto de múltiplos machos disponíveis para acasalamento, podemos esperar que eles evoluam com mais freqüência em espécies com grupos sociais multimales-multifemale (Clutton-Brock e Harvey 1976). O arquivo de dados pode ser encontrado aqui:

Coloque esses arquivos na mesma pasta com o programa BayesTraits. Em um computador Mac: abra o aplicativo do terminal e arraste o aplicativo BayesTraits para o terminal. Depois disso, arraste o arquivo nexo para o terminal seguido pelo arquivo de texto com os dados do caractere. Deve aparecer como uma única linha no terminal com o diretório de cada arquivo, por exemplo:

Agora clique em voltar. Você deve ver a seguinte tela em seu terminal:

Digite & quot2 & quot para selecionar o modelo & quotDiscreto: Independente & quot, que avalia a probabilidade dos dados sob a hipótese nula de que as características evoluem independentemente. Após digitar return, BayesTraits irá perguntar qual tipo de análise você deseja executar:

Digite & quot1 & quot e pressione Enter para selecionar a análise de Máxima Verossimilhança. Depois de clicar em voltar, você deverá ver o seguinte na tela:

Observe que há mais valores de parâmetro a serem estimados nesta segunda análise porque cada transição possível pode ter dois valores diferentes, um para cada estado do outro personagem (consulte o Capítulo 7 do livro). A probabilidade é relatada como -30,25.

Para testar os modelos entre si, realizaremos um teste de razão de verossimilhança. Isso é feito multiplicando a diferença nas probabilidades por 2 e, em seguida, comparando esse valor a uma distribuição qui-quadrado com 4 graus de liberdade. Existem 4 graus de liberdade neste caso porque os dois modelos diferem porque o modelo dependente tem mais 4 parâmetros do que o independente. O modelo dependente produzirá uma probabilidade maior (menos negativa) do que o independente: a questão é se a melhoria na probabilidade é suficiente para justificar os parâmetros adicionais. Então, você deve calcular:

12,34 é, portanto, nosso valor qui-quadrado, que sob 4 graus de liberdade tem um valor p (probabilidade de ser tão grande ou maior) de 0,015. Assim, usando o método da verossimilhança, podemos rejeitar a hipótese de que o sistema social e os inchaços sexuais evoluem independentemente em favor da hipótese de que sua evolução está correlacionada.

Uma interpretação mais detalhada da causalidade evolutiva envolvida (os sistemas sociais multimales / multifemas causam inchaços sexuais ou os inchaços causam o sistema social?) Pode ser verificada examinando os valores dos parâmetros que o modelo de verossimilhança dependente inferiu (listados como q12, q13 , etc.). Os leitores que procuram compreender mais detalhadamente como interpretar esses valores devem consultar Pagel (1994, 1999). Para uma investigação bayesiana dessa questão que também controla a incerteza filogenética, consulte Pagel e Meade (2006) - um artigo muito legal! Esse método pode ser implementado em BayesTraits usando a opção MCMC, consulte o artigo e a documentação de BayesTraits para obter mais informações.


Assista o vídeo: Evolução: Introdução - Biologia Básica - Me Salva! Saúde (Dezembro 2021).