Em formação

Os tRNAs que reconhecem múltiplos códons têm alguma preferência um sobre o outro?


Quais são os efeitos das diferentes forças / afinidades de ligação entre os códons sinônimos correspondentes a um único tRNA?


Existe uma extensa literatura sobre códons sinônimos e seu uso em diferentes organismos. Devo assumir que a questão diz respeito à relação entre a força da interação códon-anticódon e a eficiência (velocidade, neste caso) da tradução.

  • Não é contestado (estou ciente de alguns experimentos sobre isso) que a força da interação códon-anticódon depende do número de ligações de hidrogênio feitas.
  • Foi previsto que, para uma taxa ótima de tradução, é necessário um equilíbrio entre a associação e a dissociação do par códon-anticódon. Conseqüentemente, interações fracas (todas AU) - que desfavoreceriam a associação - ou interações fortes (todas GC) - que desfavoreceriam a dissociação - não permitiriam uma taxa de síntese de proteínas tão rápida quanto aquela para interações intermediárias (AU mista, GC).
  • Isso pareceu ser confirmado nos padrões de uso de códons de organismos de crescimento rápido, como Escherichia coli, algo posteriormente confirmado por estudos mais extensos. Para ser preciso, as proteínas mais expressas (por exemplo, proteínas ribossomais) foram codificadas por mRNAs contendo as interações códon-anticódon intermediárias previstas para permitir a tradução rápida. Em contraste, proteínas mal expressas (por exemplo, repressores) foram codificados meus mRNAs previstos para produzir uma tradução mais lenta.
  • Deve-se estar ciente, entretanto, que existem outros fatores que influenciam o uso do códon em diferentes organismos, e que estes podem sobrepor o efeito da força da interação códon-anticódon.

Código genético expandido

Um código genético expandido é um código genético modificado artificialmente no qual um ou mais códons específicos foram realocados para codificar um aminoácido que não está entre os 22 aminoácidos proteinogênicos codificados naturalmente comuns. [1]

Os principais pré-requisitos para expandir o código genético são:

  • o aminoácido não padrão para codificar,
  • um códon não utilizado para adotar,
  • um tRNA que reconhece este códon, e
  • uma sintetase de tRNA que reconhece apenas aquele tRNA e apenas o aminoácido não padrão.

Expandir o código genético é uma área de pesquisa da biologia sintética, uma disciplina biológica aplicada cujo objetivo é projetar sistemas vivos para fins úteis. A expansão do código genético enriquece o repertório de ferramentas úteis à disposição da ciência.

Em maio de 2019, pesquisadores, em um esforço importante, relataram a criação de uma nova forma de vida viável sintética (possivelmente artificial), uma variante da bactéria Escherichia coli, reduzindo o número natural de 64 códons no genoma bacteriano para 61 códons (eliminando dois dos seis códons que codificam para serina e um de três códons de parada) - dos quais 59 costumavam codificar 20 aminoácidos. [2] [3]


O mecanismo de síntese de proteínas

Assim como com a síntese de mRNA, a síntese de proteínas pode ser dividida em três fases: iniciação, alongamento e término. O processo de tradução é semelhante em bactérias, arquéias e eucariotos.

Iniciação da Tradução

Em geral, a síntese de proteínas começa com a formação de um complexo de iniciação. A pequena subunidade ribossômica se ligará ao mRNA no sítio de ligação ribossomal. Logo depois, o tRNA da metionina se ligará ao códon de início do AUG (por meio da ligação complementar com seu anticódon). Este complexo é então unido por uma grande subunidade ribossômica. Este complexo de iniciação então recruta o segundo tRNA e, assim, a tradução começa.

A tradução começa quando um anticódon tRNA reconhece um códon no mRNA. A subunidade ribossômica grande se junta à subunidade pequena e um segundo tRNA é recrutado. À medida que o mRNA se move em relação ao ribossomo, a cadeia polipeptídica é formada. A entrada de um fator de liberação no site A encerra a tradução e os componentes se dissociam.

Iniciação bacteriana vs eucariótica

A síntese de proteínas começa em um códon AUG (met) - mas as proteínas podem ter muitas metioninas e os mRNAs podem ter muitos AUGs. Como o ribossomo sabe por onde começar?

No mRNA procariotico, uma sequência a montante do primeiro códon AUG, chamada de Sequência Shine-Dalgarno (AGGAGG), pares de bases com uma molécula de rRNA dentro da pequena subunidade dos ribossomos bacterianos e arqueados. Esta interação ancora a subunidade ribossômica 30S em um local preciso no modelo de mRNA. Pare por um momento para apreciar a repetição de um mecanismo que você encontrou antes. Nesse caso, conseguir que um complexo de proteína se associe - no registro adequado - a um polímero de ácido nucleico é realizado alinhando duas fitas antiparalelas de nucleotídeos complementares uma com a outra. Isso é bastante diferente do reconhecimento de um promotor pelo complexo de RNA polimerase - que requer que um proteína, não um ácido nucleico, liga-se a um determinado sequência de DNA de fita dupla. No entanto, vimos o alinhamento via emparelhamento de bases de um complexo de proteína / RNA com uma sequência de DNA de fita simples antes - quando discutimos a telomerase.

Em vez de se ligar à sequência de Shine-Dalgarno, o complexo de iniciação eucariótica (várias proteínas além da subunidade pequena) reconhece o cap 7-metilguanosina na extremidade 5 'do mRNA. Uma vez no limite, o complexo de iniciação segue ao longo do mRNA na direção de 5 'para 3', procurando o códon de início de AUG. Muitos mRNAs eucarióticos são traduzidos do primeiro AUG, mas nem sempre é esse o caso. Os nucleotídeos em torno do AUG afetam a probabilidade de ele ser escolhido como o códon inicial, e a sequência de consenso varia entre as espécies. As proteínas "quothelper" do complexo de iniciação caem assim que a subunidade grande é carregada.

Observe que, em ambos os casos, a seleção de um AUG estabelece o quadro de leitura (um de um possível 3) para a proteína inteira. Uma diferença muito importante entre esses modos de seleção do local de início é que um único transcrito procariótico pode potencialmente codificar várias proteínas sequenciais, já que o ribossomo pode varrer todo o comprimento da mensagem em busca de sequências de Shine-Dagarno. Freqüentemente, as várias proteínas envolvidas em um único processo (subunidades de uma holoenzima. Ou etapas sequenciais em uma via metabólica) são codificadas em uma única mensagem. Em contraste, em genes nucleares eucarióticos, cada transcrição codifica apenas uma única proteína (como sempre, há exceções).

Alongamento de tradução

Durante o alongamento da tradução, o modelo de mRNA fornece especificidade. À medida que o ribossomo se move ao longo do mRNA, cada códon de mRNA fica "visível" e a ligação específica com o anticódon de tRNA carregado correspondente é assegurada. Se o mRNA não estivesse presente no complexo de alongamento, o ribossomo se ligaria aos tRNAs de forma não específica. Observe novamente o uso do emparelhamento de bases entre duas fitas antiparalelas de nucleotídeos complementares para trazer e manter nossa máquina molecular no registro e, neste caso, também para realizar o trabalho de "traduzir" entre a linguagem dos nucleotídeos e dos aminoácidos.

A grande subunidade ribossômica consiste em três compartimentos: o local A liga tRNAs carregados de entrada (tRNAs com seus aminoácidos específicos anexados), o local P liga tRNAs carregados carregando aminoácidos que formaram ligações com a cadeia polipeptídica em crescimento, mas ainda não se dissociaram seu tRNA correspondente e o sítio E que libera tRNAs dissociados para que possam ser recarregados com outro aminoácido livre.

O alongamento prossegue com tRNAs carregados entrando no local A e, em seguida, mudando para o local P seguido pelo local E com cada códon único & ldquostep & rdquo do ribossomo. Descreveremos esse processo aqui, mas recomendamos enfaticamente que você assista a qualquer uma das muitas versões animadas desse processo - especialmente as irrealisticamente lentas - como esta. As etapas ribossomais são induzidas por mudanças conformacionais que avançam o ribossomo em três bases na direção 3 '. A energia para cada etapa do ribossomo é doada por um fator de alongamento que hidrolisa o GTP. As ligações peptídicas se formam entre o grupo amino do aminoácido ligado ao tRNA do local A e o grupo carboxila do aminoácido ligado ao tRNA do local P. A formação de cada ligação peptídica é catalisada por peptidil transferase, um RNA catalítico (surpresa! não é uma proteína) que está integrado na subunidade ribossômica 50S. A energia para cada formação de ligação peptídica é derivada da hidrólise do GTP, que é catalisada por um fator de alongamento separado. O aminoácido ligado ao tRNA do sítio P está ligado à crescente cadeia polipeptídica. À medida que o ribossomo atravessa o mRNA, o antigo tRNA do local P entra no local E, se desprende do aminoácido e é expelido (será recarregado pela tRNA sintetase posteriormente). O ribossomo se move ao longo do mRNA, um códon por vez, catalisando cada processo que ocorre nos três locais. Com cada etapa, um tRNA carregado entra no complexo, o polipeptídeo torna-se um aminoácido a mais e um tRNA não carregado se afasta. Este processo ocorre surpreendentemente rápido na célula, o E. coli aparelho de tradução leva apenas 0,05 segundos para adicionar cada aminoácido, o que significa que um polipeptídeo de 200 aminoácidos poderia ser traduzido em apenas 10 segundos. Isso é particularmente surpreendente porque os tRNAs carregados devem estar se difundindo para o local A aleatoriamente, e o ribossomo tem que esperar a chegada do tRNA correto!

Essa velocidade também levanta a questão (talvez infantil) de: em uma corrida, quem venceria: a RNA polimerase ou o ribossomo? A resposta é que ambas as máquinas se movem aproximadamente à mesma velocidade: cerca de 60 nt / s.

Muitos antibióticos inibem a síntese de proteínas bacterianas. Por exemplo, a tetraciclina bloqueia o local A no ribossomo bacteriano e o cloranfenicol bloqueia a transferência de peptidil. Que efeito específico você espera que cada um desses antibióticos tenha na síntese de proteínas?

O Código Genético

Para resumir o que sabemos até este ponto, o processo celular de transcrição gera RNA mensageiro (mRNA), uma cópia molecular móvel de um ou mais genes com um alfabeto de A, C, G e uracila (U). A tradução do modelo de mRNA converte a informação genética baseada em nucleotídeos em um produto proteico. As sequências de proteínas consistem em 20 aminoácidos de ocorrência comum, portanto, pode-se dizer que o alfabeto da proteína consiste em 20 letras. Cada aminoácido é definido por uma sequência de três nucleotídeos chamada tripleto códon. A relação entre um códon de nucleotídeo e seu aminoácido correspondente é chamada de Código genético. Dados os diferentes números de & ldquoletters & rdquo no mRNA e na proteína & ldquoalphabets, & rdquo significa que há um total de 64 (4 & vezes 4 & vezes 4) códons possíveis, portanto, um determinado aminoácido (20 no total) deve ser codificado por mais de um códon .

Três dos 64 códons terminam a síntese de proteínas e liberam o polipeptídeo do mecanismo de tradução. Esses trigêmeos são chamados parar códons. Outro códon, AUG, também tem uma função especial. Além de especificar o aminoácido metionina, também serve como o códon de início para iniciar a tradução. O quadro de leitura para tradução é definido pelo códon de início AUG próximo à extremidade 5 'do mRNA. O código genético é universal. Com algumas exceções, virtualmente todas as espécies usam o mesmo código genético para a síntese de proteínas, o que é uma evidência poderosa de que toda a vida na Terra compartilha uma origem comum.

Esta figura mostra o código genético para traduzir cada tripleto de nucleotídeo, ou códon, em mRNA em um aminoácido ou um sinal de terminação em uma proteína nascente. (crédito: modificação do trabalho por NIH)

Redundante, não ambíguo

A informação no código genético é redundante. Vários códons codificam para o mesmo aminoácido. Por exemplo, usando o gráfico acima, você pode encontrar 4 códons diferentes que codificam para Valina, da mesma forma, existem dois códons que codificam para Leucina, etc. Mas o código não é ambíguo, o que significa que se você recebesse um códon, Se você souber definitivamente para qual aminoácido está codificando, um códon só codificará para um aminoácido específico. Por exemplo, GUU sempre codificará para Valine e AUG sempre codificará para Metionina.

Rescisão de tradução

O término da tradução ocorre quando um códon de parada (UAA, UAG ou UGA) é encontrado. Quando o ribossomo encontra o códon de parada, nenhum tRNA entra no local A. Em vez disso, uma proteína conhecida como fator de liberação liga-se ao complexo. Essa interação desestabiliza a maquinaria de tradução, causando a liberação do polipeptídeo e a dissociação das subunidades do ribossomo do mRNA. Depois que muitos ribossomos completaram a tradução, o mRNA é degradado para que os nucleotídeos possam ser reutilizados em outra reação de transcrição.

Quais são as vantagens e desvantagens de traduzir um único mRNA várias vezes?

Acoplamento entre transcrição e tradução

Como discutido anteriormente, as bactérias e arqueas não precisam transportar seus transcritos de RNA entre um núcleo envolvido por uma membrana e o citoplasma. Sua RNA polimerase está, portanto, transcrevendo RNA diretamente no citoplasma. Aqui, os ribossomos podem se ligar ao RNA e iniciar o processo de tradução, em alguns casos, enquanto a transcipção ainda está ocorrendo. O acoplamento desses dois processos, e mesmo a degradação do mRNA, é facilitado não apenas porque a transcrição e a tradução acontecem no mesmo compartimento, mas também porque ambos os processos acontecer na mesma direção - o transcrito de RNA é sintetizado de 5 'para 3' e o transcrito é traduzido de 5 'para 3'. Este "acoplamento" da transcrição com a tradução ocorre tanto em bactérias como em arqueas e é, em alguns casos, essencial para a expressão genética adequada.

Múltiplas polimerases podem transcrever um único gene bacteriano enquanto numerosos ribossomos traduzem simultaneamente os transcritos de mRNA em polipeptídeos. Dessa forma, uma proteína específica pode rapidamente - em minutos - atingir uma alta concentração na célula bacteriana.

Localização de proteínas (uma introdução rápida)

No contexto de um Desafio de Design de síntese de proteínas, também podemos levantar a questão / problema de como as proteínas chegam onde deveriam ir. Sabemos que algumas proteínas são destinadas à membrana plasmática, outras em células eucarióticas precisam ser direcionadas a várias organelas, algumas proteínas, como hormônios ou proteínas eliminadoras de nutrientes, são destinadas a ser secretadas pelas células, enquanto outras podem precisar ser direcionadas a partes do citosol para servir a funções estruturais. Como isso acontece?

Uma vez que vários mecanismos foram descobertos, os detalhes desse processo não são facilmente resumidos em um ou dois parágrafos breves. No entanto, alguns elementos-chave comuns de todos os mecanismos podem ser mencionados. Em primeiro lugar, é a necessidade de um "quottag" específico que possa fornecer algumas informações moleculares sobre para onde a proteína de interesse é destinada. Esta etiqueta geralmente assume a forma de uma pequena cadeia de aminoácidos - um chamado peptídeo sinal - que pode codificar informações sobre onde a proteína deve terminar. O segundo componente necessário da máquina de classificação de proteínas deve ser um sistema para realmente ler e classificar as proteínas. Nos sistemas bacteriano e arqueado, geralmente consiste em proteínas que podem identificar o peptídeo sinal durante a tradução, ligar-se a ele e direcionar a síntese da proteína nascente para a membrana plasmática. Em sistemas eucarióticos, a localização é necessariamente mais complexa. Ele poderia ser amplamente classificado em processos que requerem o sistema de endomembrana e transporte mediado por vesículas e sistemas de localização que simplesmente dependem da difusão. Ambos os sistemas contam com o reconhecimento de vários peptídeos de sinal codificados na proteína. Na localização baseada na endomembrana, esses sinais ocorrem muito perto do terminal N (o início) da proteína, pois atuam para bloquear a síntese adicional sob a proteína nascente e o ribossomo encontra proteínas de ancoragem no retículo endoplasmático rugoso. Em alguns casos, o peptídeo sinal é clivado assim que a proteína chega ao seu compartimento de destino.

Alguns desses mecanismos específicos podem ser discutidos por seu instrutor em classe, e mais detalhes estão disponíveis na leitura & quotProtein Translocaion & quot. O tópico é mencionado aqui porque às vezes é associado à tradução (conforme descrito acima).

Modificação de proteína pós-tradução

Após a tradução, os aminoácidos individuais podem ser modificados quimicamente. Essas modificações adicionam variação química não presente nos aminoácidos codificados geneticamente e novas propriedades que estão enraizadas na química dos grupos funcionais que estão sendo adicionados. Modificações comuns incluem grupos fosfato, metil, acetato e grupos amida. Algumas proteínas, normalmente direcionadas às membranas, serão lipidadas - um lipídio será adicionado. Outras proteínas serão glicosiladas - um açúcar será adicionado. Outra modificação pós-tradução comum é a clivagem ou ligação de partes da própria proteína. Os péptidos de sinal podem ser clivados, partes podem ser excisadas do meio da proteína ou podem ser feitas novas ligações covalentes entre a cisteína ou outras cadeias laterais de aminoácidos. Quase todas as modificações serão catalisadas por enzimas e todas alteram o comportamento funcional da proteína.

Resumo da Seção

O mRNA é usado para sintetizar proteínas pelo processo de tradução. O código genético é a correspondência entre o códon do mRNA de três nucleotídeos e um aminoácido. O código genético é & ldquotranslated & rdquo pelas moléculas de tRNA, que associam um códon específico a um aminoácido específico. O código genético é degenerado porque 64 códons tripletos no mRNA especificam apenas 20 aminoácidos e três códons de parada. Isso significa que mais de um códon corresponde a um aminoácido. Quase todas as espécies no planeta usam o mesmo código genético. Os "códigos divergentes" não são radicalmente diferentes, mas mudam o significado de um ou dois códons. As exceções mais impressionantes são as espécies que codificam 21 ou 22 aminoácidos, em vez dos 20 habituais.

Os atores na tradução incluem o modelo de mRNA, ribossomos, tRNAs e vários fatores enzimáticos. A pequena subunidade ribossômica se liga ao modelo de mRNA. A tradução começa no AUG inicial no mRNA (isso também estabelece a fase de leitura). A formação de ligações ocorre entre aminoácidos sequenciais especificados pelo modelo de mRNA de acordo com o código genético. O ribossomo aceita tRNAs carregados e, à medida que avança ao longo do mRNA, catalisa a ligação entre o novo aminoácido e o fim do polipeptídeo em crescimento. Todo o mRNA é traduzido em três nucleotídeos & ldquosteps & rdquo do ribossomo. Quando um códon de parada é encontrado, um fator de liberação se liga e dissocia os componentes e libera a nova proteína.


RESULTADOS E DISCUSSÃO

Motivado por um interesse geral em reatribuir o significado de códons de sentido para incorporação de ncAAs em proteínas na Vivo, relatamos recentemente uma tela para avaliar o potencial de reatribuição de códons sentido do M. jannaschii par ortogonal tRNA / aaRS de tirosil (35). A tela explora o requisito absoluto de uma tirosina de sítio ativo na proteína fluorescente verde (GFP). A tela monitora a restauração da fluorescência GFP pela incorporação de tirosina na posição 66 em resposta a um códon sentido tipicamente atribuído a outro significado no código genético (Figura 2). Quando o códon de detecção na posição 66 é lido por M. jannaschii tRNA Opt carregado com tirosina, a tirosina é incorporada e a proteína resultante é fluorescente. Quando o códon de sentido é decodificado por um endógeno E. coli tRNA, outro aminoácido canônico é incorporado, e a proteína resultante não é fluorescente. A tela fornece uma medição quantitativa da reatribuição de códons de sentido, fornecendo uma medição combinada da extensão em que o ortogonal M. jannaschii tirosil aaRS reconhece e aminoacila um M. jannaschii tRNA com um anticódon alternativo e a extensão em que o tRNA ortogonal alterado compete contra E. coli Espécies de tRNA para decodificar o códon especificando a posição essencial da tirosina de GFP.

Representação da tela baseada em fluorescência utilizada para avaliar a reatribuição de códons de sentido.


Resumo do Autor

A degenerescência do código genético significa que muitos aminoácidos são codificados não por um, mas por uma série de códons. Em bactérias e leveduras, sabe-se que a escolha dos códons usados ​​pode ser benéfica (ou prejudicial) para a função do gene. Como os humanos têm um tamanho populacional efetivo relativamente pequeno, e a eficiência da seleção para eliminar mutações de efeito deletério leve diminui à medida que o tamanho da população diminui, foi assumido que o benefício / custo dos códons não é grande o suficiente para ter um efeito mensurável no códon escolha. Aqui, mostramos que os códons com a menor quantidade de tRNA são agrupados em sequências de genes com mais frequência do que o previsto. Os genes que contêm esses clusters têm funções específicas na expressão gênica. Comparações com processos conhecidos de bactérias e leveduras sugerem um mecanismo de nível de tradução para a regulação da expressão de proteínas em genes humanos. Assim, nossa investigação destaca o potencial para a presença de um novo mecanismo regulatório em genes humanos.

Citação: Parmley JL, Huynen MA (2009) Clustering of Codons with Rare Cognate tRNAs in Human Genes sugere um nível extra de regulação de expressão. PLoS Genet 5 (7): e1000548. https://doi.org/10.1371/journal.pgen.1000548

Editor: Dmitri A. Petrov, Universidade de Stanford, Estados Unidos da América

Recebido: 3 de dezembro de 2008 Aceitaram: 3 de junho de 2009 Publicados: 3 de julho de 2009

Direito autoral: © 2009 Parmley, Huynen. Este é um artigo de acesso aberto distribuído sob os termos da Licença de Atribuição Creative Commons, que permite o uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original e a fonte sejam creditados.

Financiamento: Este trabalho faz parte do programa BioRange do Netherlands Bioinformatics Center (NBIC), que é apoiado pela Netherlands Genomics Initiative (NGI). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta e análise de dados, decisão de publicar ou preparação do manuscrito.

Interesses competitivos: Os autores declararam que não existem interesses conflitantes.


Conclusões

Nossas descobertas enfatizam o papel principal de NSUN2 como uma das principais enzimas autoras da marca epitranscriptômica m 5 C em todo o transcriptoma. Apresentamos evidências convincentes de uma interdependência funcional da metilação da citosina do mRNA e da tradução do mRNA, indicando que o m 5 C pode comumente desempenhar um papel negativo no controle da tradução de mRNAs. No entanto, demonstrar e caracterizar mecanicamente ligações causais específicas entre m 5 C e a tradução de mRNA exigirá estudos aprofundados de exemplos prototípicos.


Degenerescência do código genético

O trabalho de Crick & # x02019s também sugeriu que o código genético é degenerar. Essa expressão não é uma acusação moral. Significa simplesmente que cada um dos 64 tripletos deve ter algum significado dentro do código, portanto, pelo menos alguns aminoácidos devem ser especificados por dois ou mais tripletos diferentes. Se apenas 20 tripletos forem usados ​​(com os outros 44 sendo absurdos, pois não codificam para nenhum aminoácido), pode-se esperar que a maioria das mutações de frameshift produzam palavras sem sentido, o que presumivelmente interrompe o processo de construção de proteínas. Se fosse esse o caso, a supressão de mutações de frameshift raramente, ou nunca, funcionaria. No entanto, se todos os trigêmeos especificassem algum aminoácido, as palavras alteradas simplesmente resultariam na inserção de aminoácidos incorretos na proteína. Assim, Crick raciocinou que muitos ou todos os aminoácidos devem ter vários nomes diferentes no código de par de bases. Essa hipótese foi posteriormente confirmada bioquimicamente.

MENSAGEM

A discussão até este ponto demonstra que

Três bases codificam um aminoácido. Esses trigêmeos são chamados de códons.

O código é lido de um ponto de partida fixo e continua até o final da sequência de codificação. Sabemos disso porque uma única mutação de deslocamento de quadro em qualquer lugar na sequência de codificação altera o alinhamento do códon para o resto da sequência.

O código é degenerado porque alguns aminoácidos são especificados por mais de um códon.


Conclusões

Observamos que a mutação sinônima de apenas oito códons no GFP alterou a abundância média de proteínas em até cinco vezes (Fig. 4), com pouca ou nenhuma mudança no ruído da proteína. A mudança drástica na abundância de proteínas com pequenas mudanças na variação indica que para aplicações de biotecnologia, a otimização de códons pode ser realizada para controlar os níveis de expressão gênica sem preocupar-se com o ruído de expressão gênica [46].

Nosso método baseado em Sort-seq representa uma estratégia de alto rendimento para medir a variabilidade da expressão gênica. Um parâmetro chave para obter alta precisão na medição da variabilidade é classificar as células em um número grande o suficiente de caixas para aumentar a resolução da distribuição. Este método pode ser potencialmente estendido a outras bibliotecas, como bibliotecas de diferentes promotores ou RBSs, e a outros organismos, iluminando os mecanismos genéticos que controlam a variabilidade celular.


Os pássaros levam a eficiência do tRNA a novas alturas

Os repertórios de tRNA dos genomas de vertebrados refletem um equilíbrio entre a eficiência translacional, a funcionalidade do genoma e o surgimento de novas cópias de tRNA por meio da atividade mediada por elementos transponíveis. Crédito: Claudia Kutter

Os pássaros foram moldados pela evolução de muitas maneiras que os tornaram distintos de seus primos vertebrados. Ao longo de milhões de anos de evolução, nossos amigos emplumados subiram aos céus, acompanhados por mudanças únicas em seu esqueleto, musculatura, respiração e até mesmo em sistemas reprodutivos. Análises genômicas recentes identificaram outro aspecto único da linhagem aviária: genomas simplificados. Embora os genomas das aves contenham aproximadamente o mesmo número de genes codificadores de proteínas que outros vertebrados, seus genomas são menores, contendo menos DNA não codificador. Os cientistas ainda estão explorando as consequências potenciais dessa redução do genoma na biologia das aves. Em um novo artigo em Biologia e evolução do genoma intitulado "A redução do tamanho do genoma e a atividade do transposon impactam a diversidade do gene do tRNA ao mesmo tempo em que garante a estabilidade da tradução em pássaros", Claudia Kutter e seus colegas revelam que, além de menos genes codificadores de proteínas, os genomas das aves também contêm surpreendentemente poucos genes de tRNA, embora exibam o mesmos padrões de uso de tRNA que outros vertebrados. Como os tRNaAs são uma parte essencial da maquinaria celular que traduz o RNA mensageiro (mRNA) em proteína, isso sugere que as aves evoluíram para usar seu repertório limitado de tRNA de forma mais eficiente.

Existem muitos fatores que influenciam a manutenção de um pool balanceado de tRNAs para garantir a tradução eficiente das proteínas. Embora existam teoricamente 64 anticódons possíveis - sequências de três nucleotídeos que formam pares de bases com códons de mRNA durante a tradução - existem apenas 20 aminoácidos padrão, o que significa que geralmente há tRNAs com diferentes anticódons que se ligam ao mesmo aminoácido, denominado uma família isoacceptora. Além disso, a geometria de emparelhamento entre os nucleotídeos na terceira posição do códon e do anticódon permite o emparelhamento de bases "oscilante", permitindo que um único anticódon de tRNA se ligue a múltiplos códons. Os genes de tRNA, mesmo dentro da mesma família de isoacceptores, também podem diferir em suas sequências, taxas de transcrição e eficiência de tradução. Devido a todos esses fatores, garantir níveis adequados de várias moléculas de tRNA para uma tradução eficiente em uma célula é um problema biológico complexo.

Para investigar as diferentes maneiras como este problema foi resolvido em vertebrados, Kutter e seus co-autores do Instituto Karolinska e da Universidade de Uppsala na Suécia - incluindo o pós-doutorando Jente Ottenburghs, o estudante graduado Keyi Geng e o professor assistente na Universidade de Uppsala Alexander Suh - assumiram o primeira visão abrangente da diversidade e evolução do tRNA em vertebrados. (Ottenburghs escreveu sobre seu estudo, incluindo a forma surpreendente como essa colaboração surgiu, em uma postagem em seu blog, Avian Hybrids.) Com base em suas descobertas em mamíferos, os autores extrapolaram um conjunto uniforme de 500 genes de tRNA que esperavam que permanecessem relativamente consistente entre as linhagens. No entanto, quando eles adicionaram 55 genomas de aves ao estudo, representando todas as principais linhagens de pássaros, eles encontraram algumas descobertas inesperadas: "Para nossa surpresa, havia muito mais divergência entre os vertebrados do que esperávamos encontrar", disse Kutter. Em particular, os genomas de aves se destacaram, contendo uma média de apenas 169 genes de tRNA em comparação com 466 em répteis, 579 em mamíferos, 813 em peixes e 1.229 em anfíbios. De acordo com Kutter, "embora os esforços contínuos de montagem do genoma tenham mostrado que os genomas das aves têm um genoma menor, não esperávamos que isso também afetasse os genes do tRNA, uma vez que a redundância do gene do tRNA garante que moléculas de tRNA suficientes sejam transcritas para uma tradução eficiente do mRNA."

Isso levou os autores a uma nova questão: o que essa contração nos tRNAs significa para a tradução em pássaros? Embora o número e a complexidade do gene tRNA tenham sido bastante reduzidos em comparação com outros vertebrados, em geral, os autores descobriram que as preferências por certas famílias de isoacceptores estavam em linha com as estratégias de pareamento oscilante observadas em outros genomas eucarióticos, sugerindo que o uso do gene tRNA em aves segue o padrão geral uso de códons visto em vertebrados. Isso levou os pesquisadores a postular que as restrições funcionais em tRNAs observadas em outros vertebrados foram mantidas durante o início da evolução aviária: "Apesar dessa diminuição [em tRNAs] milhões de anos atrás, o pool de anticódons de tRNA e códons de mRNA ainda está equilibrado entre as espécies de aves para garantir a eficiência de tradução ideal. "

Outro elemento surpreendente do estudo foi o impacto dos elementos transponíveis no repertório de genes de tRNA em genomas aviários. Em alguns genomas de aves estudados, além de encontrar genes funcionais de tRNA, Ottenburghs et al. identificou centenas, às vezes milhares, de sequências semelhantes a tRNA incorporadas em elementos transponíveis. Enquanto a maioria dos elementos transponíveis são silenciados por mecanismos de controle epigenético e se tornam não funcionais, alguns podem permanecer ativos e criar novos papéis reguladores por meio de sua mobilização. Por meio da multiplicação de elementos transponíveis, as sequências semelhantes a tRNA incorporadas podem ser transportadas para novos locais genômicos, onde a seleção restringirá a sequência do gene tRNA, enquanto a sequência de elemento transponível acompanhante pode sofrer erosão. Este processo contribui para moldar o pool de genes de tRNA disponíveis em alguns genomas de aves, adicionando outra camada de complexidade à evolução do gene de tRNA nesta linhagem de vertebrados.

A lição aqui, de acordo com Kutter, é que "devemos reconsiderar nossas suposições atuais sobre a funcionalidade do gene no que diz respeito à redundância." Para explorar mais essa ideia, Kutter planeja expandir este trabalho para incluir uma melhor percepção mecanicista e estudos genômicos mais funcionais. "Seria interessante incluir mais espécies e examinar mais profundamente os ramos, bem como investigar genomas de cobras e a radiação inicial dos vertebrados. Realizar estudos que vão além dos organismos-modelo atuais pode revelar descobertas ainda mais inesperadas." Uma limitação desses estudos potenciais é que eles exigirão acesso a conjuntos e recursos genômicos de alta qualidade, como amostras de tecido de diferentes pontos de desenvolvimento e reagentes adequados, como anticorpos que atuam em várias espécies. Kutter acredita que esses esforços valerão a pena no longo prazo: "Nosso trabalho nos mostrou mais uma vez que a evolução ainda tem muitas surpresas na manga, e podemos ter um vislumbre delas olhando além dos organismos modelo."


Métodos

Amostras de DNA genômico pertencentes a várias espécies do gênero Pára-quedas e um representante de seu gênero irmão Harpactócrates, ambos pertencentes à família das aranhas Dysderidae, foram obtidos a partir de um estudo anterior [34], a saber P. riberai (Spain, Balearic Islands, Mallorca, Lluc code LB105), P. teruelis (Spain, Iberian Peninsula, Castilla-León, Guadalajara, Sigüenza code LB103), P. romandiolae (Italy, Toscana, Firenze, Vallombrosa code K352), P. limbarae (Italy, Sardinia, Sassari, Monte Limbara code K475), P. ignavus (France, Corsica, Region d’Ajaccio, Foce di Vizzabona code K479), and Harpactocrates apennicola (Italy, Toscana, Massa Carrara, Passo del Cerreto, code K350). Geographic coordinates, DNA extraction, and purification methods of the vouchers are detailed in the former study [34]. Sequences from 32 additional spider mitogenomes were downloaded from the NCBI Genome-Organelles database, as in November 2017.

Mitogenomes were amplified as two overlapping long PCR fragments using species-specific primers (Additional file 6: Table S2 Additional file 7: Figure S5) designed on short mitochondrial sequences obtained in a previous study [34]. Long PCR protocol followed the method described elsewhere [6] with specific annealing temperature for each primer set (52–64 °C). Primers were designed to amplify a long fragment of about 9 kb comprising the mitochondrial region between cox1 e rrnL (5′ to 3′), and a shorter one of about 5 kb comprising the remaining circular genome from 5′ rrnL to 3′ cox1. Polymerization of the shorter fragment was only successful if annealing temperature decreased from the optimal 68 °C to 62–60 °C probably due to high A + T richness of control region [7]. For some species, the amplification of PCR products was scarce or included secondary bands that would reduce the yield of direct sequencing. Therefore, the candidate band to be sequenced was excised from agarose gel to be re-amplified by PCR. Since UV light nicks DNA, which consequently inhibits DNA polymerization, particularly in long DNA fragments, agarose gel and DNA were stained with crystal violet. This method allows the direct observation and excision of DNA bands under regular light avoiding any DNA damage [66]. Once recovered, DNA was purified in silica columns (QIAquick PCR Purification Kit, QIAGEN, Hilden, Germany) and successfully re-amplified by increasing annealing temperature of two degrees.

The sequence of the mitogenome of the species Parachtes riberai was attained by following the strategy described elsewhere [7, 64]. Briefly, DNA fragments produced by long PCR amplification were digested by individual restriction enzymes (Alu I, Dra I, Rsa eu e Taq I), and then DNA fragments were pooled, purified and cloned. Finally, clones were sequenced using the Sanger protocol and mitochondrial regions with no coverage were extended by primer walking (available upon request) using initial long PCR fragments as template. The mitogenomes of the remaining five species were obtained by constructing libraries from long PCR fragments and subsequently pyrosequecing them using Roche FLX/454 with a unique tag for each species-specific library.

Mitogenomes were annotated in the new MITOS2 version of Mitoswebserver [67] available at http://mitos2.bioinf.uni-leipzig.de/index.py. Many tRNA genes were not identified by Infernal predictions as implemented in the MiTFi algorithm in MITOS2 or by tRNAscan-SE v1.3.1 [68] using the complete mitochondrial sequences as template. Hence, we used sequences between protein coding regions as template allowing an overlapping of 50 bp between genes and a low e-value of 100 for Infernal fast mode to detect tRNAs without arms and with several mismatches in the acceptor arm. The candidate tRNA sequences obtained from the six species using this approach were aligned and secondary structures compared in order to obtain a common optimal and conserved structure for each tRNA across the six species. If DHU or TΨC arms were not conserved across the six species then the secondary structure of an alternative arm-less tRNAs was obtained manually by finding the best complementary sequences forming the acceptor arm. The correct annotation of ribosomal genes rrnL e rrnS was corroborated by aligning the ribosomal sequences of the six species along with the sequences of the 12 spider mitogenomes available in MetAMiGA [52]. Secondary structure of ribosomal genes rrnL e rrnS from MITOS2 were inaccurate since motives from different domains were joined together. Therefore, short motifs of each domain were manually revised using both nucleotide alignments and previously known secondary structures as references. Secondary structures of short motifs were predicted in Mfold v3.6 [61] allowing suboptimal structures that were up to 20% above the estimated minimum free energy. Ribosomal structures were based on the models proposed for the branchipods Artemia salina Linnaeus, 1758 and Artemia franciscana Kellogg, 1906, the amphipods Metacrangonyx “bovei” [6], and the amphipod Pseudoniphargus sorbasiensis Notenboom, 1987 [5], the ascalaphid owlfly Libelloides macaronius Scopoli, 1763 [58], and the nematode Caenorhabditis elegans Maupas, 1900 [60]. Since the reconstruction of the secondary structure of rRNAs 16S and 12S was laborious, we only performed the accurate reconstruction in the species P. romandiolae. DNA sequences were aligned in MAFFT v7.273 [69]. Secondary structures were visualized and modified in VARNA v3.9 [70]. Ancestral gene orders at the inner nodes were estimated in the software TreeREx v.1.85 [71] using the strong consistency method and enforcing the tree topology including the main spider lineages (Fig. 1). The algorithm implemented in TreeREx allows to estimate the molecular mechanisms involved in the gene rearrangements such as transpositions and inversions. Polytomies were removed by trimming terminals since species involved shared identical gene orders. The sequences of Tetragnatha nitens Audouin, 1826 (Araneoidea, Tetragnathidae) and Agelena silvatica Oliger, 1983 (Agelenidae), and Carrhotus xanthogramma Latreille, 1819 (Dionycha, Salticidae) were not included in the analyses since they show complex gene rearrangement patterns. Finally, nucleotide and amino acid composition and codon usage profiles (RSCU) were estimated in MEGA v5.10 [72], and AT and GC skews with the formula ATskew = (A-T)/(A + T) and GCskew = (G-C)/(G + C), as proposed by [73].


Assista o vídeo: La Top 6 Concorrenti di Miss Trans Star International 2019 (Novembro 2021).