Em formação

18.4: Evolução dos Genomas - Biologia


18.4: Evolução dos Genomas

A evolução do número de organelas por célula

Organelas com seus próprios genomas distintos, como plastídeos e mitocôndrias, são encontradas na maioria das células eucarióticas. À medida que essas organelas e suas células hospedeiras evoluíram, a partição de processos metabólicos e a codificação de produtos gênicos em interação criaram uma co-dependência obrigatória. Essa relação desempenhou um papel na formação do número de organelas nas células ao longo da evolução. Fatores como forças evolutivas estocásticas agindo sobre genes envolvidos na biogênese de organela, interações organela-gene nuclear e limitações físicas podem, em vários graus, ditar a restrição seletiva que o número de organelas por célula está sob. Em particular, a coordenação entre a expressão do gene nuclear e organelar pode ser importante na manutenção da estequiometria do produto do gene, o que pode ter um papel significativo na restrição da evolução desta característica.

Palavras-chave: biologia celular evolutiva mitocôndria organela biogênese estequiometria de plastídio.


18.4: Evolução dos Genomas - Biologia

Evolução dos genomas - semelhanças genômicas entre espécies distantes As similaridades genômicas entre espécies distantes podem ser estabelecidas através da análise de genomas usando tecnologia avançada. OBJETIVOS DE APRENDIZAGEM Discutir as implicações evolutivas das semelhanças genômicas observadas entre espécies distantes PRINCIPAIS PONTOS PRINCIPAIS As semelhanças genômicas entre espécies distantes podem ser explicadas pela teoria th.

  • Você está aqui: & # 160
  • Casa
  • Guarda-chuva
  • Livros didáticos
  • Bio581
  • Capítulo 1 O Estudo da Vida
  • 1.4 Resumo do Capítulo

Este texto é baseado em Openstax Biology for AP Courses, Autores contribuintes sênior Julianne Zedalis, The Bishop's School em La Jolla, CA, John Eggebrecht, Cornell University Autores contribuintes Yael Avissar, Rhode Island College, Jung Choi, Georgia Institute of Technology, Jean DeSaix , University of North Carolina em Chapel Hill, Vladimir Jurukovski, Suffolk County Community College, Connie Rye, East Mississippi Community College, Robert Wise, University of Wisconsin, Oshkosh

Este trabalho está licenciado sob uma Licença Creative Commons Atribuição-NãoComercial 4.0 Unported, sem restrições adicionais


Evolução dos cromossomos sexuais monotremados

Para elucidar a composição genômica detalhada dos cromossomos sexuais monotremados, comparamos regiões que compartilham sequências entre os cromossomos sexuais - isto é, os PARs - com regiões que se tornaram sexualmente diferenciadas (SDRs). Os limites do PAR mostram uma mudança acentuada na taxa de cobertura de sequenciamento feminino para masculino, conforme esperado (Fig. 2a e Dados Estendidos Fig. 4a). Ambos os monotremados mostraram níveis de expressão gênica geralmente não tendenciosa entre os sexos dentro de PARs, mas expressão tendenciosa feminina pronunciada dentro de SDRs, indicando a ausência de compensação de dosagem completa em todo o cromossomo em monotremados, como sugerido anteriormente 9 (Dados Estendidos Fig. 4b).

uma, Composição genômica dos cromossomos sexuais do ornitorrinco. Dos anéis externos para os internos: os cromossomos X com os PARs (cores claras) e SDRs (cores escuras) rotulados os fragmentos do cromossomo Y montados dentro dos SDRs mostrando os níveis de divergência de sequência em escala de cores com os cromossomos X homólogos de mulher para homem ( F / M) razões de curta cobertura de leitura de sequenciamento em janelas de 5 kb não sobrepostas taxas de expressão F / M (cada ponto vermelho é um gene) do rim adulto e a tendência de expressão suavizada e conteúdo de GC em não sobreposição 2- kb windows. Além disso, rotulamos as posições no anel do cromossomo X dos pares de gametólogo que suprimiram a recombinação antes da divergência de monotremados ("compartilhados", triângulos laranja) ou após a divergência ("independentes", triângulos azuis). b, Homologia entre os cromossomos X e Y do ornitorrinco. Em particular, a maior parte de Y5 mostra homologia com X1 e X2, o que sugere uma conformação de anel ancestral dos cromossomos sexuais do ornitorrinco. Também rotulamos a posição do suposto gene determinante do sexo AMH. A silhueta do ornitorrinco foi criada por S. Werning e é reproduzida sob a licença Creative Commons Attribution 3.0 Unported (http://creativecommons.org/licenses/by/3.0/).

Os PARs curtos dos cromossomos do ornitorrinco X2-X5 têm um conteúdo de GC significativamente maior (teste unilateral da soma de postos de Wilcoxon, P & lt 0,01) do que os SDRs ou os PARs mais longos (dados estendidos Fig. 4c), o que provavelmente reflete a conversão gênica enviesada por GC forte que é causada por uma alta taxa de recombinação 10. Isso é semelhante ao padrão do PAR humano curto rico em GC, cuja taxa de recombinação é 17 vezes maior do que a média de todo o genoma 11. Notavelmente, as sequências ortólogas de frango desses PARs monotremados estão todas localizadas nos microcromossomos, que também têm um alto conteúdo de GC 12 (teste unilateral da soma de postos de Wilcoxon, P & lt 0,01) (Dados estendidos Fig. 4c, d). Este cenário de recombinação altamente conservado pode ser parcialmente selecionado em monotremados para manter o polimorfismo de sequência e dosagem balanceada de genes MHC, que residem nos PARs dos pares de cromossomos X3-Y3 e Y4-X5 no ornitorrinco 13 (Dados estendidos Fig. 3a). A seleção regional para alta recombinação também pode neutralizar a expansão adicional de SDRs nesses cromossomos sexuais.

Cromossomos sexuais de eutherians e pássaros formados por meio de supressão gradual de recombinação, resultando em um padrão de divergência de sequência de pares entre SDRs denominado "estratos evolutivos" 14,15. Identificamos pelo menos sete estratos em monotremados, denominados S0 a S6, do mais antigo ao mais jovem estrato (Fig. 2a e Dados Estendidos Fig. 4a), classificando seus níveis de divergência de sequência sinônima de pares entre os gametólogos XY e a filogenia (Dados estendidos Fig. 5a, b). Todos, exceto os estratos mais recentes (S5 e S6), são compartilhados por ornitorrincos e equidna. No entanto, os PARs que fazem fronteira com S5 e S6, bem como os PARs mais curtos dos cromossomos X2 e X5 (dados estendidos Fig. 5c, d), formaram-se independentemente após sua divergência. No geral, a distribuição dos estratos evolutivos sugeriu uma ordem de tempo de incorporação de diferentes autossomos ancestrais na cadeia de cromossomos sexuais: começou na região S0 de X1 contendo um gene determinante do sexo (veja abaixo), seguido por X2, X3 e X5. X4 e regiões individuais de X3 e X1 sofreram supressão de recombinação após a divergência de monotremados.

Apesar dos episódios de evolução independente, a maioria das regiões dos cromossomos sexuais do ornitorrinco e equidna são homólogas (Dados Estendidos Fig. 6a), sugerindo que o complexo se formou no ancestral monotremado 16. Para reconstruir sua origem, projetamos os cromossomos sexuais do ornitorrinco em seus homólogos de galinha (Tabela Suplementar 39). Este mapa de homologia refinado (dados estendidos Fig. 4d) sugere que ambas as fusões e translocações recíprocas entre os fragmentos micro e macrocromossômicos ancestrais deram origem ao complexo de cromossomos sexuais monotremados. Os cromossomos X do ornitorrinco contêm sequências homólogas dos microcromossomos de frango inteiros ou parciais 11, 16, 17, 25 e 28. Esses microcromossomos também têm ortólogos no gar 17 manchado, sugerindo que eram microcromossomos de vertebrados ancestrais e fundidos no monotremato ancestral ou cromossomos de mamíferos. A evidência de translocações recíprocas veio da observação de que partes de cada dois cromossomos sexuais vizinhos são homólogas a duas regiões adjacentes do mesmo cromossomo de galinha (dados estendidos Fig. 6c, d). Por exemplo, os cromossomos do ornitorrinco X1 e X2 são homólogos a partes do microcromossomo 12 e do cromossomo 13 da galinha, enquanto X2 e X3 são homólogos ao cromossomo 2 da galinha.

Notavelmente, X1 em uma extremidade da cadeia meiótica e Y5 na outra compartilham esta relação de sobreposição alternada, e ambos são homólogos ao microcromossomo de galinha 28. Na verdade, a maioria dos genes em Y5 não são encontrados em seu parceiro de emparelhamento X5, mas em X1 (Fig. 2b e Tabela Suplementar 40). Os cromossomos X1 e Y5 não emparelham na meiose, mas esta homologia sugere que a origem do complexo de cromossomos sexuais monotremados existente envolveu a abertura do "anel" cromossômico ancestral conforme a degeneração prosseguia 18. Um gene determinante do sexo de vertebrado conservado, o hormônio anti-Mulleriano, está localizado no cromossomo Y5 (AMHY) e S0 do cromossomo X1 (AMHX) 14 (Fig. 2b). A região de emparelhamento ancestral X1 – Y5 que abrange AMH poderia, portanto, ser o local em que a recombinação homóloga foi suprimida pela primeira vez. A degeneração do cromossomo Y5 causou então a perda de homologia com X1 e levou à quebra do anel cromossômico. Na verdade, taxas de substituição sinônimas (dS) entre os pares de gametólogos retidos X1-Y5 são significativamente maiores (teste unilateral da soma classificada de Wilcoxon, P & lt 0,01) do que aqueles de quaisquer outros pares de cromossomos sexuais (dados estendidos Fig. 6e). Uma configuração de anel cromossômico foi relatada em plantas 19, mas não em qualquer espécie animal. Alternativamente, a estrutura do anel ancestral pode ter evoluído após o surgimento do par proto-X1-Y5 por translocações que envolvem outros autossomos, de modo que alelos sexualmente antagônicos pudessem ser ligados aos genes determinantes do sexo 20.


Métodos

Geração de genoma e anotação de gene

Todos os genomas de Acari analisados ​​em nosso estudo estão disponíveis como recursos públicos do NCBI (ftp://ftp.ncbi.nlm.nih.gov/). As etapas para inclusão foram as seguintes: (1) Todas as espécies de Arachnida no banco de dados (antes de 2020.06) foram pesquisadas como candidatas (2) o genoma com a melhor pontuação de completude foi selecionado como o representativo se houvesse dois ou mais genomas para uma espécie (3) espécies com completude do genoma inferior a 80% foram eliminadas (4) a predição do gene foi conduzida para genomas sem informação de anotação do gene e (5) contigs com menos de 1 kb de comprimento foram excluídos de toda a análise. Os elementos repetitivos na sequência do genoma foram identificados por RepeatMasker 63 (versão 4.0.7) com Repbase (versão 16.02). Para a previsão do gene, o pipeline BRAKER 64 (versão 1.9) foi usado, e as sequências de proteínas da aranha veludo, ácaro da sarna, ácaro da abelha, ácaro, ácaro do veludo, ácaro da aranha, ácaro predador, ácaro da poeira e genoma do carrapato foram aplicadas como referências para predição de genes baseada em homologia. Um link para os resultados anotados é fornecido na seção Disponibilidade de dados.

Detecção de pseudogene

Para reduzir a heterogeneidade dos dados de fundo, selecionamos os três genomas com a melhor qualidade (aqueles de D. farina, P. ovis, e S. scabiei) no grupo de transição como representantes. GeneWise (versão 2.4.1) foi usado para o alinhamento de genes, enquanto as sequências de codificação de proteínas de uma aranha (Stegodyphus mimosarum) foram usados ​​como referências. A identidade de sequência mínima foi definida para 80% e o valor E de corte foi definido para 10-5. Os genes com mutações frame-shift (SNPs ou indels) ou códons de parada prematura foram anotados como pseudogenes.

Construção de árvore filogenética

Sequências de proteínas com um comprimento curto (& lt50 aminoácidos) ou códons de parada prematura foram excluídas. Os genes ortólogos foram inferidos pelo OrthoFinder (versão 2.3.8) com o software DIAMOND (versão 0.9.24). Um valor esperado foi definido como 10 −5. Genes ortólogos de cópia única foram gerados a partir do resultado do OrthoFinder, e blocos conservados de cada gene foram extraídos por Gblocks (versão 0.91b). Em seguida, combinamos todas as regiões conservadas de cada gene ortólogo. Um total de 50.502 sítios foram concatenados para construir uma seqüência de supergene para cada espécie, que foi adotada para construir a árvore filogenética. A filogenia do supergene foi construída com RAxML 65 (versão 8.2.12) sob o modelo GTRGAMMA. Um total de 200 réplicas de bootstrap foram conduzidas, e a árvore com a pontuação de maior probabilidade foi escolhida como uma árvore padrão. Com base na topologia da árvore padrão, o comprimento do ramo de cada gene foi estimado com sua sequência. Em seguida, genes com comprimentos de ramos extremamente enviesados ​​foram excluídos. Após a remoção de todos os genes enviesados, a árvore de espécies foi reconstruída com base em 48.831 sítios conservados por RAxML com 1.000 réplicas de bootstrap seguindo o comando raxmlHPC-PTHREADS-SSE3 -x 12345 -p 12345 - # 1000 -m GTRGAMMA.

Estimativa de tempo de divergência

MCMCTREE no PAML 66 (versão 4.9i) foi usado para calibrar o tempo de divergência por meio do método Monte Carlo da cadeia de Markov. Tempo fóssil (Steganacarus Magnus contra Hypochthonius rufulus: 394 - 571 Mya Dermatophagoides pteronyssinus contra Sarcoptes scabiei: 119 Mya e Ixodes scapularis contra Dermanyssus gallinae: 336 Mya) foi determinado a partir do banco de dados Time Tree (http://www.timetree.org). Um modelo de relógio relaxado (clock = 2) foi estabelecido e o MCMC foi realizado (burnin = 4.000.000 sampfreq = 100 nsample = 100.000). Outros parâmetros foram definidos para o padrão e o programa Baseml foi executado em duplicata para verificar a convergência.

Análise de família de genes

As sequências de proteínas de dezesseis genomas de Arachnida foram geradas a partir dos resultados anotados. Removemos as proteínas com códons de parada prematura ou um comprimento inferior a 50 aminoácidos. As proteínas restantes foram usadas para realizar o agrupamento de proteínas por OrthoFinder com o método DIAMOND all-to-all e um valor E = 10-5. Um conjunto de dados de 39.474 clusters foi gerado e alguns dos agrupados foram removidos devido a uma baixa taxa de anotação de menos de 50 por cento de todas as espécies. Em seguida, 5.718 famílias de genes restantes foram submetidas à análise de expansão e contração usando CAFÉ 67 (versão 4.2.1), e um modelo estocástico de nascimento e morte foi adotado. A árvore filogenética com tempo de divergência foi obtida com a análise MCMCTREE no PAML.

Identificação de genes selecionados positivamente

Um total de 9.306 famílias de genes foram identificados pelo OrthoFinder, e 4.546 genes ortólogos de cópia única foram gerados para realizar a análise de seleção positiva, que anotou pelo menos 60% dos dezesseis genomas. As sequências de genes ortólogos foram alinhadas pelo software MAFFT (versão 7.455), e uma árvore gênica foi gerada a partir da árvore de espécies com base nas espécies restantes. O modelo de branch-site em PAML foi usado para detectar PSGs ao longo de linhagens específicas com o modelo A (modelo = 2 e NSsites = 2). Um teste de razão de verossimilhança (LRT) foi realizado para comparar o modelo A (sites sob seleção positiva no primeiro plano fix_omega = 0) com o modelo nulo (sites podem evoluir de forma neutra / sob seleção purificadora fix_omega = 1 e ômega = 1) pelo programa codeml em PAML. o P os valores dos LRTs foram avaliados por meio da estatística do qui-quadrado, uma taxa de descoberta falsa (FDR) foi calculada e o corte foi definido como 0,1. Locais com probabilidade posterior Bayesiana empírica Bayesiana (BEB) superior a 95% foram selecionados como locais selecionados positivamente no PAML. As análises de enriquecimento KEGG e GO de PSGs foram realizadas por KOBAS 3.0 68 com pontos de corte de um P valor & lt 0,05 nos testes exatos de Fisher e um FDR corrigido P valor & lt 0,1. Drosophila melanogaster genes foram selecionados como o conjunto de fundo. Diagramas de bolhas de termos KEGG e GO significativamente enriquecidos foram gerados usando o pacote R ggplot.

Taxa evolutiva do metabolismo da gordura

Para investigar a taxa evolutiva do metabolismo da gordura entre ácaros com diferentes dietas, 122 genes envolvidos no metabolismo lipídico do banco de dados KEGG (http://www.genome.jp/kegg/catalog/org_list.html) foram incluídos para análise. Os ramos foram divididos em cinco grupos com diferentes tipos de dieta. As razões dN / dS dos grupos selecionados foram calculadas pelo programa codeml com o modelo de ramificação de duas razões (modelo = 2) em PAML, e os valores dN / dS do fundo foram detectados com o modelo de uma razão (modelo = 0 , NSsites = 0). A distribuição da densidade dos valores dN / dS e um gráfico de violino dos valores dN / dS para diferentes grupos dietéticos foram gerados. As razões dN / dS foram comparadas com os dados de fundo com o teste t de Student.

Análise de expressão gênica

Dezesseis amostras de quatro populações de ácaros aranha foram baixadas do banco de dados SRA (BioProject: PRJNA610897) 69, e Trimmomatic (versão 0.36) foi aplicado para realizar o controle de qualidade, incluindo sequências de adaptador de corte e remoção de leituras de baixa qualidade, com os parâmetros “LEADING : 3 TRAILING: 3 SLIDINGWINDOW: 4: 20 MINLEN: 45 ”. As leituras qualificadas foram mapeadas para a referência do ácaro-aranha usando o HISAT2 (versão 2.1.0). Fragmentos por quilobase de transcrição por milhão de leituras mapeadas (FPKM), os valores foram calculados por Cufflinks 70 (versão 2.2.1). Em seguida, a expressão gênica em todas as dezesseis amostras foi classificada de acordo com os valores medianos de FPKM. Os 200 e 50 genes mais expressos foram selecionados e analisados. Um mapa de calor foi desenhado com base nos 50 genes mais expressos usando Heatmapper 71. As análises de enriquecimento KEGG e GO foram realizadas por KOBAS 3.0 com pontos de corte de um P valor & lt 0,05 nos testes exatos de Fisher e um FDR corrigido P valor & lt 0,1. Diagramas de bolhas de termos KEGG e GO significativamente enriquecidos foram gerados usando o pacote R ggplot.

Análise da família Serpin

A família serpina foi anotada manualmente usando métodos descritos em estudos anteriores 72. As sequências da proteína serpina de Ixodes scapularis, Metaseiulus occidentalis, Dermanyssus gallinae, Tropilaelaps mercedesae, Varroa destructor, Varroa jacobsoni, Sarcoptes scabiei, Psoroptes ovis, Leptotrombidium delicense, Dinothrombium tinctorium, Tetranychus urticae, e Stegodyphus mimosarum do banco de dados NCBI foram usados ​​como sequências de consulta. Em seguida, as sequências de referência foram alinhadas aos dezesseis genomas usando BLASTP (versão 2.2.29+). Blast hits pertencentes à mesma proteína query foram combinados em um gene previsto de cada genoma. Em seguida, a estrutura do gene foi prevista pelo GeneWise e os domínios das sequências foram estimados com base no banco de dados Pfam. Finalmente, um total de 2.748 posições nos genes de serpina de dezesseis espécies foram alinhadas com ClustalW e então aplicadas para construir uma árvore de máxima verossimilhança no MEGA 73 (versão 10.0.1) com 1.000 réplicas de bootstrap. A árvore resultante foi visualizada no Figtree (versão 1.4.3).

Resumo do relatório

Mais informações sobre o desenho da pesquisa estão disponíveis no Nature Research Reporting Summary vinculado a este artigo.


Assista o vídeo: GENÉTICA NO VESTIBULAR: LEIS DE MENDEL, GENES, DNA E CROMOSSOMOS. QUER QUE DESENHE? (Janeiro 2022).