Em formação

Como existem códons de iniciação alternativos?


De acordo com a Wikipedia e a sequência completa original do genoma K-12, existem vários códons de início não AUG, como GUG e UUG. Como isso é possível? Estou particularmente curioso sobre o mecanismo de iniciação da tradução na ausência do tRNA canônicofMet.


Na verdade, o códon de início, não importa se é AUG ou GUG / UGG, sempre codifica para Met. Portanto, a tradução é iniciada por tRNAfMet (tradução procariótica). A subunidade do ribossomo 30s liga-se à sequência Shine-Dalgarno e, em seguida, varre a sequência de mRNA dowstream para AUG e o tRNA carregado com Met, que tem o anticódon CAU forma a interação mais estável. Mas, aparentemente, apenas a interação de duas bases entre o códon de início (GUG, UUG) e o anticódon fMet-tRNA são suficientes para o início da tradução (1). Vou olhar mais para a literatura.

1. Iniciação da tradução em procariontes e eucariontes


Como existem códons de iniciação alternativos? - Biologia

Dados os diferentes números de & # 8220 letras & # 8221 no mRNA e na proteína & # 8220alfabetos, & # 8221 os cientistas teorizaram que as combinações de nucleotídeos correspondiam a um único aminoácido. Os dupletos de nucleotídeos não seriam suficientes para especificar todos os aminoácidos porque existem apenas 16 combinações possíveis de dois nucleotídeos (42). Em contraste, existem 64 tripletos de nucleotídeos possíveis (43), o que é muito mais do que o número de aminoácidos. Os cientistas teorizaram que os aminoácidos eram codificados por trigêmeos de nucleotídeos e que o código genético era degenerar. Em outras palavras, um determinado aminoácido pode ser codificado por mais de um tripleto de nucleotídeos. Isso foi posteriormente confirmado experimentalmente. Francis Crick e Sydney Brenner usaram o mutagênico químico proflavina para inserir um, dois ou três nucleotídeos no gene de um vírus. Quando um ou dois nucleotídeos foram inseridos, a síntese de proteínas foi completamente abolida. Quando três nucleotídeos foram inseridos, a proteína foi sintetizada e funcional. Isso demonstrou que três nucleotídeos especificam cada aminoácido. Esses tripletos de nucleotídeos são chamados códons. A inserção de um ou dois nucleotídeos mudou completamente o quadro de leitura tripleto, alterando assim a mensagem para cada aminoácido subsequente (Figura 1). Embora a inserção de três nucleotídeos tenha feito com que um aminoácido extra fosse inserido durante a tradução, a integridade do resto da proteína foi mantida.

Figura 1. A deleção de dois nucleotídeos muda o quadro de leitura de um mRNA e muda toda a mensagem da proteína, criando uma proteína não funcional ou encerrando a síntese de proteínas por completo.

Os cientistas resolveram meticulosamente o código genético traduzindo mRNAs sintéticos in vitro e sequenciando as proteínas que eles especificaram (Figura 2).

Figura 2. Esta figura mostra o código genético para traduzir cada tripleto de nucleotídeos em mRNA em um aminoácido ou um sinal de terminação em uma proteína nascente. (crédito: modificação do trabalho por NIH)

Além de instruir a adição de um aminoácido específico a uma cadeia polipeptídica, três dos 64 códons terminam a síntese proteica e liberam o polipeptídeo do mecanismo de tradução. Esses trigêmeos são chamados de códons sem sentido ou códons de parada. Outro códon, AUG, também tem uma função especial. Além de especificar o aminoácido metionina, também serve como o códon inicial para iniciar a tradução. O quadro de leitura para tradução é definido pelo códon de início AUG próximo ao final 5 & # 8242 do mRNA. Após o códon de início, o mRNA é lido em grupos de três até que um códon de parada seja encontrado.

A disposição da tabela de codificação revela a estrutura do código. Existem dezesseis & # 8220 blocos & # 8221 de códons, cada um especificado pelo primeiro e segundo nucleotídeos dos códons dentro do bloco, por exemplo, o bloco & # 8220AC * & # 8221 que corresponde ao aminoácido treonina (Thr). Alguns blocos são divididos em uma metade pirimidina, na qual o códon termina com U ou C, e uma metade purina, na qual o códon termina com A ou G. Alguns aminoácidos obtêm um bloco inteiro de quatro códons, como a alanina (Ala) , treonina (Thr) e prolina (Pro). Alguns recebem metade da pirimidina de seu bloco, como a histidina (His) e a asparagina (Asn). Outros obtêm a metade purina de seu bloco, como o glutamato (Glu) e a lisina (Lys). Observe que alguns aminoácidos recebem um bloco e meio para um total de seis códons.

A especificação de um único aminoácido por múltiplos códons semelhantes é chamada de & # 8220 degenerescência. & # 8221 Acredita-se que a degenerescência seja um mecanismo celular para reduzir o impacto negativo de mutações aleatórias. Os códons que especificam o mesmo aminoácido normalmente diferem apenas por um nucleotídeo. Além disso, os aminoácidos com cadeias laterais quimicamente semelhantes são codificados por códons semelhantes. Por exemplo, aspartato (Asp) e glutamato (Glu), que ocupam o bloco GA *, têm carga negativa. Essa nuance do código genético garante que uma mutação de substituição de um único nucleotídeo pode especificar o mesmo aminoácido, mas não tem efeito ou especifica um aminoácido semelhante, evitando que a proteína se torne completamente não funcional.

O código genético é universal. Com algumas exceções, virtualmente todas as espécies usam o mesmo código genético para a síntese de proteínas. A conservação de códons significa que um mRNA purificado que codifica a proteína globina em cavalos poderia ser transferido para uma célula de tulipa, e a tulipa sintetizaria globina de cavalo. Ter apenas um código genético é uma evidência poderosa de que toda a vida na Terra compartilha uma origem comum, especialmente considerando que existem cerca de 1084 combinações possíveis de 20 aminoácidos e 64 códons tripletos.

Acredita-se que a degenerescência seja um mecanismo celular para reduzir o impacto negativo de mutações aleatórias. Os códons que especificam o mesmo aminoácido normalmente diferem apenas por um nucleotídeo. Além disso, os aminoácidos com cadeias laterais quimicamente semelhantes são codificados por códons semelhantes. Essa nuance do código genético garante que uma mutação de substituição de um único nucleotídeo pode especificar o mesmo aminoácido, mas não ter efeito, ou especificar um aminoácido semelhante, evitando que a proteína seja tornada completamente não funcional.


Introdução

Embora o número de genes envolvidos no metabolismo celular tenha sido reduzido em micoplasmas, o número de genes envolvidos na transcrição e tradução são comparáveis ​​aos de outras bactérias [1, 2], e os mecanismos básicos de transcrição e tradução em micoplasmas são considerados ser semelhantes aos de bactérias Gram-positivas G + C baixas. A tradução é um processo complexo que envolve quatro fases - iniciação, alongamento, término e reciclagem do ribossomo [3]. A iniciação translacional em bactérias é influenciada por uma série de fatores, incluindo o local de ligação ao ribossoma (RBS) [4], a estrutura secundária do mRNA perto do local de ligação ao ribossoma [5], o códon de início da tradução [6] e a sequência a jusante do início códon [7]. No E. coli Genoma K-12, dos 4288 quadros de leitura abertos anotados, 82% têm um códon de início ATG, 14,3% um códon de início GTG e 3% um códon de início TTG [8]. Uma anotação recente de dez diferentes E. coli cepas encontraram que 82,5% dos códons iniciais eram ATG, 12,3% eram GTG e 5% eram TTG, com CTG, ATT e ATC usados ​​em frequências mais baixas [9]. A eficiência translacional diminuiu em E. coli quando um códon de início diferente de ATG é usado, com uma redução de oito vezes na tradução observada com códons de início GTG ou TTG [10]. No B. subtilis Os códons de início ATG, TTG e GTG são usados ​​em 78%, 13% e 9% dos CDSs, respectivamente [11], com GTG mostrado ser três a cinco vezes menos eficiente do que ATG na iniciação translacional [12].

Os molicutos geralmente têm genomas com baixo conteúdo de G + C e, como resultado, um viés A ou U (T) no uso de códons, especialmente na primeira e terceira posições de códons. Enquanto a região de codificação da maioria dos genes de micoplasma começa com um códon de início ATG, códons de início alternativos, como GTG e TTG, são usados ​​[13]. No genoma de M. galiséptico Rbaixo, baseado em em sílico previsão de sequências de codificação, ATG é o códon de início preferido, seguido por GTG e TTG (http://services.cbib.u-bordeaux2.fr/molligen/). No entanto, todos os genes no vlhUma família multigênica, que codifica a adesão de lipoproteína variável de fase abundante VlhA, tem um códon de iniciação da tradução GTG. A alta prevalência de um códon de iniciação da tradução atípico na família de genes que codificam uma lipoproteína altamente expressa em uma espécie com uma tendência geral contra tais códons ricos em GC sugere que este códon pode não ter os efeitos adversos na tradução do vlhA genes em M. galiséptico que são vistos em outros genes em outras espécies bacterianas. A fim de explorar se o uso de um códon de iniciação da tradução GTG era mais comum em micoplasmas do que em outras espécies bacterianas, examinamos inicialmente os genomas anotados de uma série de Mycoplasma espécies para determinar a prevalência do uso de códons de início de tradução alternativos em sequências de codificação previstas nesta família de bactérias. Atualmente, os genomas de 52 Mycoplasma espécies foram anotadas, mas não há dados agrupados sobre o uso de códons iniciais em micoplasmas. Em seguida, avaliamos o efeito do códon de início da tradução GTG na transcrição e tradução de um gene de lipoproteína repórter em M. galiséptico.


Conteúdo

Os esforços para entender como as proteínas são codificadas começaram depois que a estrutura do DNA foi descoberta em 1953. George Gamow postulou que conjuntos de três bases devem ser empregados para codificar os 20 aminoácidos padrão usados ​​por células vivas para construir proteínas, o que permitiria um máximo de 4 3 = 64 aminoácidos. [3]

Editar códons

O experimento de Crick, Brenner, Barnett e Watts-Tobin demonstrou pela primeira vez que os códons consistem em três bases de DNA. Marshall Nirenberg e Heinrich J. Matthaei foram os primeiros a revelar a natureza de um códon em 1961. [4]

Eles usaram um sistema livre de células para traduzir uma sequência de RNA de poliuracila (isto é, UUUUU) e descobriram que o polipeptídeo que eles haviam sintetizado consistia apenas no aminoácido fenilalanina. [5] Desse modo, deduziram que o códon UUU especificava o aminoácido fenilalanina.

Isso foi seguido por experimentos no laboratório de Severo Ochoa que demonstraram que a sequência de RNA de poliadenina (AAAAA.) Codificava para o polipeptídeo polilisina [6] e que a sequência de RNA de policitosina (CCCCC.) Codificava para o polipeptídeo poli- prolina. [7] Portanto, o códon AAA especificou o aminoácido lisina, e o códon CCC especificou o aminoácido prolina. Usando vários copolímeros, a maioria dos códons restantes foram então determinados.

O trabalho subsequente de Har Gobind Khorana identificou o resto do código genético. Pouco depois, Robert W. Holley determinou a estrutura do RNA de transferência (tRNA), a molécula adaptadora que facilita o processo de tradução do RNA em proteína. Este trabalho foi baseado nos estudos anteriores de Ochoa, rendendo a este último o Prêmio Nobel de Fisiologia ou Medicina em 1959 pelo trabalho sobre a enzimologia da síntese de RNA. [8]

Estendendo esse trabalho, Nirenberg e Philip Leder revelaram a natureza tripla do código e decifraram seus códons. Nesses experimentos, várias combinações de mRNA foram passadas por um filtro que continha ribossomos, os componentes das células que traduzem o RNA em proteína. Tripletos únicos promoveram a ligação de tRNAs específicos ao ribossomo. Leder e Nirenberg foram capazes de determinar as sequências de 54 dos 64 códons em seus experimentos. [9] Khorana, Holley e Nirenberg receberam o Nobel de 1968 por seu trabalho. [10]

Os três códons de parada foram nomeados pelos descobridores Richard Epstein e Charles Steinberg. "Amber" foi nomeado após seu amigo Harris Bernstein, cujo sobrenome significa "âmbar" em alemão. [11] Os outros dois códons de parada foram nomeados "ocre" e "opala" para manter o tema "nomes de cores".

Códigos genéticos expandidos (biologia sintética) Editar

Em um amplo público acadêmico, o conceito de evolução do código genético do código genético original e ambíguo para um código bem definido ("congelado") com o repertório de 20 (+2) aminoácidos canônicos é amplamente aceito. [12] No entanto, existem diferentes opiniões, conceitos, abordagens e ideias, qual é a melhor maneira de mudá-lo experimentalmente. Até modelos são propostos que prevêem "pontos de entrada" para a invasão de aminoácidos sintéticos do código genético. [13]

Desde 2001, 40 aminoácidos não naturais foram adicionados à proteína, criando um códon único (recodificação) e um par correspondente de RNA de transferência: aminoacil - tRNA-sintetase para codificá-lo com diversas propriedades físico-químicas e biológicas, a fim de ser usado como uma ferramenta para explorar a estrutura e função da proteína ou para criar proteínas novas ou aprimoradas. [14] [15]

H. Murakami e M. Sisido estenderam alguns códons para terem quatro e cinco bases. Steven A. Benner construiu um 65º funcional (na Vivo) códon. [16]

Em 2015, N. Budisa, D. Söll e colaboradores relataram a substituição total de todos os 20.899 resíduos de triptofano (códons UGG) por tienopirrol-alanina não natural no código genético da bactéria Escherichia coli. [17]

Em 2016 foi criado o primeiro organismo semissintético estável. Era uma bactéria (única célula) com duas bases sintéticas (chamadas X e Y). As bases sobreviveram à divisão celular. [18] [19]

Em 2017, pesquisadores da Coreia do Sul relataram que desenvolveram um camundongo com um código genético estendido que pode produzir proteínas com aminoácidos não naturais. [20]

Em maio de 2019, pesquisadores, em um esforço importante, relataram a criação de uma nova forma de vida viável sintética (possivelmente artificial), uma variante da bactéria Escherichia coli, reduzindo o número natural de 64 códons no genoma bacteriano para 59 códons em vez disso, a fim de codificar 20 aminoácidos. [21] [22]

Edição de quadro de leitura

Um quadro de leitura é definido pelo tripleto inicial de nucleotídeos a partir do qual a tradução começa. Ele define o quadro para uma série de códons sucessivos e não sobrepostos, que é conhecido como "quadro de leitura aberto" (ORF). Por exemplo, a string 5'-AAATGAACG-3 '(ver figura), se lida a partir da primeira posição, contém os códons AAA, TGA e ACG se lida a partir da segunda posição, ela contém os códons AAT e GAA e se lida da terceira posição, contém os codões ATG e AAC. Cada sequência pode, assim, ser lida em sua direção 5 '→ 3' em três quadros de leitura, cada um produzindo uma sequência de aminoácidos possivelmente distinta: no exemplo dado, Lys (K) -Trp (W) -Thr (T), Asn (N) -Glu (E), ou Met (M) -Asn (N), respectivamente (ao traduzir com o código mitocondrial de vertebrado). Quando o DNA é de fita dupla, seis possíveis quadros de leitura são definidos, três na orientação direta em uma fita e três reversas na fita oposta. [24]: 330 Os quadros de codificação de proteínas são definidos por um códon de início, geralmente o primeiro códon AUG (ATG) na sequência de RNA (DNA).

Em eucariotos, ORFs em exons são freqüentemente interrompidos por íntrons.

Iniciar e parar códons Editar

A tradução começa com um códon de iniciação em cadeia ou códon de início. O códon de início sozinho não é suficiente para iniciar o processo. Sequências próximas, como a sequência Shine-Dalgarno em E. coli e fatores de iniciação também são necessários para iniciar a tradução. Em eucariotos, o códon de iniciação está localizado entre a sequência kozak. [25] O códon inicial mais comum é o AUG, que é lido como metionina ou, em bactérias, como formilmetionina. Códons de início alternativos dependendo do organismo incluem "GUG" ou "UUG" esses códons normalmente representam valina e leucina, respectivamente, mas como códons de início eles são traduzidos como metionina ou formilmetionina. [26]

Os três códons de parada têm nomes: UAG é âmbar, UGA é opala (às vezes também chamado úmero), e UAA é ocre. Os códons de parada também são chamados de códons de "terminação" ou "sem sentido". Eles sinalizam a liberação do polipeptídeo nascente do ribossomo porque nenhum tRNA cognato tem anticódons complementares a esses sinais de parada, permitindo que um fator de liberação se ligue ao ribossomo. [27]

Efeito das mutações Editar

Durante o processo de replicação do DNA, ocasionalmente ocorrem erros na polimerização da segunda fita. Esses erros, mutações, podem afetar o fenótipo de um organismo, especialmente se ocorrerem na sequência codificadora da proteína de um gene. As taxas de erro são normalmente de 1 erro em cada 10–100 milhões de bases - devido à capacidade de "revisão" das DNA polimerases. [29] [30]

Mutações sem sentido e sem sentido são exemplos de mutações pontuais que podem causar doenças genéticas, como doença falciforme e talassemia, respectivamente. [31] [32] [33] Mutações missense clinicamente importantes geralmente alteram as propriedades do resíduo de aminoácido codificado entre os estados básico, ácido, polar ou apolar, enquanto mutações sem sentido resultam em um códon de parada. [24]

As mutações que interrompem a sequência do quadro de leitura por indels (inserções ou deleções) de um não múltiplo de 3 bases de nucleotídeos são conhecidas como mutações de deslocamento de quadro. Essas mutações geralmente resultam em uma tradução completamente diferente do original e provavelmente causam a leitura de um códon de parada, que trunca a proteína. [34] Essas mutações podem prejudicar a função da proteína e, portanto, são raras em na Vivo sequências codificadoras de proteínas. Uma razão pela qual a herança de mutações frameshift é rara é que, se a proteína sendo traduzida é essencial para o crescimento sob as pressões seletivas que o organismo enfrenta, a ausência de uma proteína funcional pode causar a morte antes que o organismo se torne viável. [35] Mutações de frameshift podem resultar em doenças genéticas graves, como a doença de Tay-Sachs. [36]

Embora a maioria das mutações que alteram as sequências de proteínas sejam prejudiciais ou neutras, algumas mutações trazem benefícios. [37] Essas mutações podem permitir que o organismo mutante resista a estresses ambientais específicos melhor do que os organismos do tipo selvagem, ou se reproduza mais rapidamente. Nesses casos, uma mutação tende a se tornar mais comum em uma população por meio da seleção natural. [38] Os vírus que usam RNA como seu material genético têm taxas de mutação rápidas, [39] o que pode ser uma vantagem, uma vez que esses vírus evoluem rapidamente e, portanto, evitam as respostas de defesa do sistema imunológico. [40] Em grandes populações de organismos de reprodução assexuada, por exemplo, E. coli, múltiplas mutações benéficas podem co-ocorrer. Esse fenômeno é chamado de interferência clonal e causa competição entre as mutações. [41]

Edição de degenerescência

A degenerescência é a redundância do código genético. Este termo foi dado por Bernfield e Nirenberg. O código genético tem redundância, mas sem ambigüidade (consulte as tabelas de códons abaixo para obter a correlação completa). Por exemplo, embora os códons GAA e GAG ​​especifiquem o ácido glutâmico (redundância), nenhum especifica outro aminoácido (sem ambigüidade). Os códons que codificam um aminoácido podem diferir em qualquer uma de suas três posições. Por exemplo, o aminoácido leucina é especificado por YvocêR ou CUN (UUA, UUG, CUU, CUC, CUA ou CUG) códons (diferença na primeira ou terceira posição indicada usando a notação IUPAC), enquanto o aminoácido serina é especificado por UCN ou AGY (UCA, UCG, UCC, UCU, AGU ou AGC) códons (diferença na primeira, segunda ou terceira posição). [42] Uma consequência prática da redundância é que erros na terceira posição do códon tripleto causam apenas uma mutação silenciosa ou um erro que não afetaria a proteína porque a hidrofilicidade ou hidrofobicidade é mantida pela substituição equivalente de aminoácidos, por exemplo, um códon de NUN (onde N = qualquer nucleotídeo) tende a codificar para aminoácidos hidrofóbicos. NCN produz resíduos de aminoácidos que são pequenos em tamanho e moderada em hidropatia. NAN codifica resíduos hidrofílicos de tamanho médio. O código genético é tão bem estruturado para hidropaticidade que uma análise matemática (Decomposição de Valor Singular) de 12 variáveis ​​(4 nucleotídeos x 3 posições) produz uma correlação notável (C = 0,95) para prever a hidropatia do aminoácido codificado diretamente do sequência de nucleotídeos triplos, sem tradução. [43] [44] Observe na tabela abaixo, oito aminoácidos não são afetados por mutações na terceira posição do códon, enquanto na figura acima, uma mutação na segunda posição pode causar uma mudança radical nas propriedades físico-químicas do aminoácido codificado. No entanto, as mudanças na primeira posição dos códons são mais importantes do que as mudanças na segunda posição em uma escala global. [45] A razão pode ser que a reversão de carga (de uma carga positiva para uma carga negativa ou vice-versa) só pode ocorrer em mutações na primeira posição de certos códons, mas não em mudanças na segunda posição de qualquer códon. Essa inversão de carga pode ter consequências dramáticas para a estrutura ou função de uma proteína. Esse aspecto pode ter sido amplamente subestimado por estudos anteriores. [45]

Edição de polarização de uso de códon

A frequência de códons, também conhecida como viés de uso de códons, pode variar de espécie para espécie com implicações funcionais para o controle da tradução.

Edição de aminoácidos não padrão

Em algumas proteínas, aminoácidos não padrão são substituídos por códons de parada padrão, dependendo das sequências de sinal associadas no RNA mensageiro. Por exemplo, UGA pode codificar para selenocisteína e UAG pode codificar para pirrolisina. A selenocisteína passou a ser vista como o 21º aminoácido e a pirrolisina como o 22º. [47] Ao contrário da selenocisteína, o UAG codificado pela pirrolisina é traduzido com a participação de uma aminoacil-tRNA sintetase dedicada. [48] ​​Tanto a selenocisteína quanto a pirrolisina podem estar presentes no mesmo organismo. [47] Embora o código genético seja normalmente fixado em um organismo, o procarioto achaeal Acetohalobium arabaticum pode expandir seu código genético de 20 para 21 aminoácidos (incluindo a pirrolisina) em diferentes condições de crescimento. [49]

Edição de variações

Variações no código padrão foram previstas na década de 1970. [50] O primeiro foi descoberto em 1979, por pesquisadores que estudavam genes mitocondriais humanos. [51] Muitas variantes leves foram descobertas depois disso, [52] incluindo vários códigos mitocondriais alternativos. [53] Essas variantes menores, por exemplo, envolvem a tradução do códon UGA como triptofano em Mycoplasma espécie, e tradução de CUG como uma serina em vez de leucina em leveduras do "clado CTG" (como Candida albicans) [54] [55] [56] Como os vírus devem usar o mesmo código genético de seus hospedeiros, modificações no código genético padrão podem interferir na síntese ou no funcionamento da proteína viral. No entanto, vírus como os totivírus se adaptaram à modificação do código genético do hospedeiro. [57] Em bactérias e arquéias, GUG e UUG são códons de início comuns. Em casos raros, certas proteínas podem usar códons de início alternativos. [52] Surpreendentemente, variações na interpretação do código genético também existem em genes codificados por núcleos humanos: em 2016, pesquisadores que estudaram a tradução da malato desidrogenase descobriram que em cerca de 4% dos mRNAs que codificam esta enzima, o códon de parada é usado naturalmente para codificar os aminoácidos triptofano e arginina. [58] Este tipo de recodificação é induzido por um contexto de códon de parada de alta leitura [59] e é referido como leitura translacional funcional. [60]

Os códigos genéticos variantes usados ​​por um organismo podem ser inferidos pela identificação de genes altamente conservados codificados nesse genoma e pela comparação de seu uso de códons com os aminoácidos em proteínas homólogas de outros organismos. Por exemplo, o programa FACIL [61] infere um código genético pesquisando quais aminoácidos em domínios de proteínas homólogas estão mais frequentemente alinhados a cada códon. As probabilidades de aminoácidos resultantes para cada códon são exibidas em um logotipo do código genético, que também mostra o suporte para um códon de parada.

Apesar dessas diferenças, todos os códigos de ocorrência natural conhecidos são muito semelhantes. O mecanismo de codificação é o mesmo para todos os organismos: códons de três bases, tRNA, ribossomos, leitura de direção única e tradução de códons únicos em aminoácidos únicos. [62] As variações mais extremas ocorrem em certos ciliados, onde o significado dos códons de parada depende de sua posição no mRNA. Quando perto da extremidade 3 ', eles agem como terminadores, enquanto em posições internas eles codificam para aminoácidos como em Condylostoma magnum [63] ou desencadear frameshifting ribossomal como em Euplotes. [64]

O código genético é uma parte fundamental da história da vida, de acordo com uma versão da qual moléculas de RNA autorreplicantes precederam a vida como a conhecemos. Esta é a hipótese do mundo do RNA. Sob essa hipótese, qualquer modelo para o surgimento do código genético está intimamente relacionado a um modelo de transferência de ribozimas (enzimas de RNA) para proteínas como as principais enzimas nas células. Em consonância com a hipótese do mundo do RNA, as moléculas de RNA de transferência parecem ter evoluído antes das modernas aminoacil-tRNA sintetases, de modo que a última não pode ser parte da explicação de seus padrões. [65]

Um código genético hipotético desenvolvido aleatoriamente motiva ainda mais um modelo bioquímico ou evolutivo para sua origem. Se os aminoácidos fossem atribuídos aleatoriamente a códons tripletos, haveria 1,5 × 10 84 códigos genéticos possíveis. [66]: 163 Este número é encontrado calculando o número de maneiras que 21 itens (20 aminoácidos mais uma parada) podem ser colocados em 64 caixas, em que cada item é usado pelo menos uma vez. [67] No entanto, a distribuição das atribuições de códons no código genético não é aleatória. [68] Em particular, o código genético agrupa certas atribuições de aminoácidos.

Os aminoácidos que compartilham a mesma via biossintética tendem a ter a mesma primeira base em seus códons. Isso poderia ser uma relíquia evolutiva de um código genético antigo e mais simples, com menos aminoácidos, que posteriormente evoluiu para codificar um conjunto maior de aminoácidos. [69] Ele também pode refletir propriedades estéricas e químicas que tiveram outro efeito sobre o códon durante sua evolução. Aminoácidos com propriedades físicas semelhantes também tendem a ter códons semelhantes, [70] [71] reduzindo os problemas causados ​​por mutações pontuais e erros de tradução. [68]

Dado o esquema de codificação tripla genética não aleatória, uma hipótese sustentável para a origem do código genético poderia abordar vários aspectos da tabela de códons, como ausência de códons para D-aminoácidos, padrões de códons secundários para alguns aminoácidos, confinamento de sinônimos posições para a terceira posição, o pequeno conjunto de apenas 20 aminoácidos (em vez de um número que se aproxima de 64), e a relação dos padrões de códon de parada com os padrões de codificação de aminoácidos. [72]

Três hipóteses principais tratam da origem do código genético. Muitos modelos pertencem a um deles ou a um híbrido: [73]


Desafios de estudar ORFs N-terminalmente estendidos, quase cognatos iniciados

Um punhado de isoformas de proteínas estendidas no terminal N foram identificadas e caracterizadas por estudos de gene único, mas antes dos estudos de perfil de ribossomo de todo o genoma, elas eram geralmente consideradas anomalias (Chang e Wang, 2004, Heublein et al. 2019, Kearse e Wilusz 2017, Kritsiligkou et al. 2017, Suomi et al. 2014, Tang et al. 2004, Touriol et al. 2003). Nosso trabalho, junto com trabalhos recentes de outros grupos, indica que as isoformas de proteínas estendidas são muito mais prevalentes do que se pensava anteriormente, em leveduras e outros organismos (Fields et al. 2015, Fritsch et al. 2012, Ingolia et al. 2011, Ivanov et al. 2011, Monteuuis et al. 2019, Sapkota et al. 2019). Como a maioria escapou da detecção por tanto tempo? Uma série de características torna-os particularmente desafiadores de identificar ou detectar, tornando compreensível que possam ser perdidos, mesmo para genes bem estudados.

A principal razão pela qual essas proteínas foram negligenciadas é que elas não estão em conformidade com as regras típicas de anotação de genes. As isoformas estendidas, que por definição começam a montante do AUG no quadro mais a montante de um ORF, não podem iniciar em um AUG. Em vez disso, eles iniciam em códons de início quase cognatos, que diferem de AUG por uma base (revisado em Kearse e Wilusz 2017). Uma vez que os códons de início quase cognatos não estão incluídos nas anotações ORF tradicionais, essas isoformas nunca seriam previstas para existir nessa estrutura. A iniciação quase cognata também é menos eficiente do que a iniciação AUG e, portanto, as isoformas de proteínas estendidas resultantes são frequentemente de baixa abundância e difíceis de detectar em relação à sua isoforma canônica correspondente (Chen et al. 2008, Clements et al. 1988, Kolitz et al. . 2009).

A maioria das extensões que identificamos também são relativamente próximas em tamanho à isoforma iniciada por AUG, tornando-as difíceis de distinguir pelo método que pareceria mais simples, um western blot da proteína. A maioria (

80%) das extensões em nosso conjunto eram menos de 10% maiores do que sua isoforma anotada correspondente, o que normalmente é uma diferença muito pequena para distinguir com segurança em um western blot padrão, especialmente se a proteína estiver em baixa abundância, como as extensões frequentemente são (Figura 2A Eisenberg et al. 2020). Se um pesquisador não tivesse evidência externa de uma extensão (como a partir do perfil do TIS), ele não teria razão para suspeitar que uma segunda isoforma estava sendo produzida. Se, por outro lado, houver razão para procurar mais por uma isoforma estendida, é possível isolar apenas a isoforma estendida por mutação do códon de início AUG da isoforma anotada. No entanto, observamos que, em muitos casos, isso, por sua vez, leva ao decaimento mediado por nonsense (NMD) do transcrito produzido a partir desse locus mutado, diminuindo significativamente a produção de proteína desse gene. Esses transcritos estão provavelmente sujeitos a NMD porque, na ausência do códon de início de AUG para a isoforma anotada, a iniciação no códon cognato próximo a montante não é suficiente para prevenir a iniciação em códons AUG fora de quadro subsequentes, sinalizando para recrutamento de Fatores NMD e decadência da transcrição (Figura 2B Celik et al. 2017). Para muitos genes, só fomos capazes de detectar a isoforma de proteína estendida em um upf1 e # x00394 histórico, que anula a via NMD (revisado em Hug et al. 2016).

(a) Comprimento da isoforma da proteína anotada em comparação com a razão da isoforma estendida para a isoforma anotada. Os pontos cinza representam genes com uma extensão que difere em menos de 10% em comprimento da isoforma anotada. (b) Esquema dos efeitos de NMD resultantes da mutação do códon de início de AUG. A transcrição WT no fundo WT (painel esquerdo) resulta em transcrições estáveis ​​que produzem ambas as isoformas de proteínas. A transcrição M1A (mutação do códon de início anotado para alanina) no fundo WT (painel direito, seta para a esquerda) resulta na tradução de ORFs curtos iniciados por AUG fora do quadro e dispara NMD. Transcrição M1A em upf1 e # x00394 o fundo não pode ser degradado via NMD e pode ser traduzido para produzir a isoforma estendida sozinha. (c) Gráfico de barras de todos os possíveis códons de início quase cognatos geradores de extensão (em quadro sem códon de parada em quadro) em 5 & # x02019 líderes de genes de levedura em comparação com códons de início geradores de extensão com evidência de tradução em TIS- dados de perfil.

Estabelecemos que isoformas estendidas podem ser facilmente perdidas por abordagens de biologia molecular padrão e estão compreensivelmente ausentes das anotações de genes. A análise de conservação, no entanto, é outra estratégia para a detecção de região de codificação que tem forças complementares a outras abordagens de anotação. Poderia ter sido útil para detectar essas isoformas antes do perfil de TIS? No conjunto de extensões que identificamos, tentamos encontrar assinaturas de conservação dentro das 5 & # x02019-maioria das regiões que são exclusivas para as extensões relativas à isoforma anotada (Eisenberg et al. 2020). Para nossa surpresa, mesmo extensões caracterizadas anteriormente, como para a tRNA sintetase ALA1, showed little evidence of conservation across yeast species (Tang et al. 2004). We suspect that, rather than suggesting a lack of functional relevance, this instead may indicate that the selective pressures acting on some extensions may be difficult to detect by sequence conservation analysis alone. In cases in which the properties of the amino acids (for example, charge or hydrophobicity) are more important than the specific sequence, we would expect to see conservation of the ability to make the extension, but not necessarily strong conversation of the sequence itself. Signal sequences are a particularly salient example, as they are often present at N-termini of proteins and can tolerate a large amount of sequence degeneracy while still maintaining the same function indeed, most of the currently characterized extended protein isoforms have been shown to have altered protein localization (Chang and Wang 2004, Kaiser and Botstein 1990, Kritsiligkou et al. 2017, Suomi et al. 2014, Tang et al. 2004). Further characterization of extended protein isoforms will be necessary to understand the types of functions they serve and whether those functions are indeed less subject to sequence-level constraints. Regardless of the reason for their general lack of sequence conservation, however, this feature again illustrates the difficulty in detecting extended protein isoforms without empirical data.

While extremely useful for empirically identifying translation initiation sites, it is important to note that TIS-profiling data can include both false-positives and false-negatives. Some translation elongation inhibitors, such as cycloheximide, have been shown to cause pre-initiation complex stacking and artificially enhance near-cognate initiation (Kearse et al. 2019). This is not thought to occur with post-initiation inhibitors like lactimidomycin and harringtonine, but it remains important to be vigilant to artifacts that could be introduced through drug treatment (Kearse et al. 2019). For example, our study showed that while TIS peak heights are generally roughly quantitative to translation levels, near-cognate codons in particular appear to have artificially high peak heights relative to measured protein output, for reasons that are not fully understood (Eisenberg et al. 2020). These data are nonetheless incredibly useful in identifying likely alternative protein isoforms, enabling both genome-wide analysis of regulatory trends and making careful individual validation and characterization much more tractable.


Alternative mechanisms of translation initiation: An emerging dynamic regulator of the proteome in health and disease

Eukaryotic mRNAs were historically thought to rely exclusively on recognition and binding of their 5' cap by initiation factors to effect protein translation. While internal ribosome entry sites (IRESs) are well accepted as necessary for the cap-independent translation of many viral genomes, there is now recognition that eukaryotic mRNAs also undergo non-canonical modes of translation initiation. Recently, high-throughput assays have identified thousands of mammalian transcripts with translation initiation occurring at non-canonical start codons, upstream of and within protein coding regions. In addition to IRES-mediated events, regulatory mechanisms of translation initiation have been described involving alternate 5' cap recognition, mRNA sequence elements, and ribosome selection. These mechanisms ensure translation of specific mRNAs under conditions where cap-dependent translation is shut down and contribute to pathological states including cardiac hypertrophy and cancer. Such global and gene-specific dynamic regulation of translation presents us with an increasing number of novel therapeutic targets. While these newly discovered modes of translation initiation have been largely studied in isolation, it is likely that several act on the same mRNA and exquisite coordination is necessary to maintain 'normal' translation. In this short review, we summarize the current state of knowledge of these alternative mechanisms of eukaryotic protein translation, their contribution to normal and pathological cell biology, and the potential of targeting translation initiation therapeutically in human disease.


Opções de acesso

Obtenha acesso completo ao diário por 1 ano

Todos os preços são preços NET.
O IVA será adicionado mais tarde no check-out.
O cálculo do imposto será finalizado durante o checkout.

Obtenha acesso limitado por tempo ou ao artigo completo no ReadCube.

Todos os preços são preços NET.


Codon selection in translation is not entirely universal

Even though the genetic code is often seen as universal, it has been known for a long time 15 that there are numerous deviations from it throughout known life forms. 16,17 As far as initiation of translation in the eukaryotic cell is concerned, many reports indicate that non-AUG codons are and can be used as alternative initiation codons. 18 It might be the case that Met-tRNAeu is not the only initiator tRNA. For example, Starck etਊl. showed that Leu-tRNA can be the initiator at CUG start codons 19 but possibly not as efficiently as AUG. 20,21 Moreover, there are various reports as to which alternative start codon would be most preferred. Kolitz etਊl. rank CUG as the best option based on their experiments using a luciferase reporter assay. 8 Peabody etਊl. obtain ACG as their best candidate based on their study of translation of dihydrofolate reductase in mammalian cells 9 and Donahue and Cigan find that AUA is preferred in S. cerevisiae with a HIS4-lacZ fusion construct. 22 There can be various reasons for why different alternative initiation codons are reported and perhaps there is no preferred alternative start codon at all. Here, the details of how the experiments are set up may be an explanation for the possible discrepancies. For instance, the lengths of the 5’UTR's can vary, or there might be deviations in the sequences making the Kozak context suboptimal for the tested start codon in the different studies. 23 Specifically, both CUG and ACG have been reported to be used in initiation with up to 15% of the efficiency of AUG. 8,9 Our calculations, however, suggest that with the standard eukaryotic initiation complex with eIF1 and eIF1A present, the selection for AUG is extremely precise. If these initiation factors are not present it is possible to point out a few codons that could probably be read by Met-tRNAeu. Hence, the reading of GUG, CUG and AUA is predicted to be considerably easier in the absence of the initiation factors. Looking into other translational systems, that do not have the same level of regulation as the eukaryotic cytosolic initiation process, we can see that a wide range of alternative start codons are being used. In yeast mitochondria, the AUA codon is reassigned from the standard isoleucine to methionine and it is decoded by Met-tRNA, thus making it a suitable alternative start codon. In fact, in some vertebrate species AUA and GUG are used as an alternative initiation codon in mitochondrial translation. 17,24


Start Codon

A start codon is the starting point of translation in a cell. Read the following article to gain more information about this subject.

A start codon is the starting point of translation in a cell. Read the following article to gain more information about this subject.

What is a Codon?

A codon is a kind of genetic code, which is a set of rules, by which certain information is encoded in the genetic material that may be either DNA or mRNA sequences, from where it is translated into proteins. These proteins consist of amino acids that are strung together in a specific sequence. Any change in this sequence signifies a change in the coding this is normally seen in cases of genetic mutations. Each codon is made up of three bases, which are codes for a single amino acid, and they form a mapping that is encoded in the tRNA of the organism. Altogether, there are four bases that are present in the DNA: adenine, cytosine, guanine, and thymine.

What is a Start Codon?

Você gostaria de escrever para nós? Bem, estamos procurando bons escritores que queiram espalhar a palavra. Entre em contato conosco e conversaremos.

A start codon in DNA initiates the translation of the first amino acid in the polypeptide chain. The first three bases of the coding sequence of mRNA to be translated into proteins, is where the initiation codon is located. This is an important structure, because the actual protein sequence that is translated is defined by a start codon. The initiation codon is almost always preceded by an untranslated region called 5′ UTR, which is also known as the leader sequence. It is a particular section of mRNA, which starts at the +1 position. This is the region where transcription begins and ends, just before the codon start of the coding region.

This is usually the first AUG codon in the mRNA sequence. Additionally, in cases of DNA start codons, the material typically consists of the ATG codon bases. It is only in very rare cases that higher organisms, i.e., eukaryotes, have non AUG initiation codons. However, in addition to AUG, there also are certain alternative ones like GUG and UUG. These are seen in lower and less differentiated organisms, i.e., in prokaryotes. For example, E. coli uses ATG (AUG) 83% of the time, GTG (GUG) 14% of the time, and TTG (UUG) 3% of the time. One or two others, like ATT and CTG, are seen very rarely. Every time, there may not be the same start codon even within the same species. Bacteria and archaea have UUG and GUG as their initiation codons on most occasions. However, it has been seen that in certain rare cases, specific proteins may use alternative initiation codons, which may not be used by that species.

All start codons code for methionine, as this is the first amino acid that is coded during protein synthesis. Even if alternative initiation codons are present, it eventually does get translated as methionine, even if the codon present normally does encode for a different amino acid. This happens because a separate tRNA is used for initiation in such cases. Translation starts with chain initiation or start codon. There is one major difference between start codon and stop codon. Unlike the later ones, the former alone are not sufficient to begin the process of protein synthesis. Nearby sequences and certain initiation factors are also required to the start the process of translation.

In cases of start codon mutation, as usual, the mutated mRNA would be shunted to the ribosomes, but the translation would not take place. This is because an initiation codon is responsible for starting translation, not a transcription start codon. Hence, it cannot necessarily produce proteins, as this codon lacks a proper nucleotide sequence that can act as a reading frame.

The information provided above is a brief insight into the start codon structure, function, and what happens when there is mutation of this initiation code. This codon plays a pivotal role in translation, and hence, it is a very important component of the genetic composition of every cell.

Postagens Relacionadas

Você sabia que os fungos não têm clorofila? Este tipo de forma de vida pode causar doenças em humanos e também pode ser usado para fazer queijo pelo processo.

Células vegetais sempre despertaram curiosidade entre estudantes de biologia, entre outros. Portanto, aqui neste artigo, forneci algumas informações detalhadas.

Sexual and asexual reproduction are the two means of producing offspring. Read this article to gain more information about asexual reproduction in the animal kingdom.


ORF finder? - ORF finder? (Jun/09/2005 )

There are many programs that will find open reading frames (ORFs) (start codon->stop codon) in a given sequence.

However, the first ATG used to create the ORF may not be the correct start codon - it may be one further into the sequence.

Does anyone know of a program that will return ALL of these potential ORFs - that might be termed "ORFs within ORFs"?

Please post or email if you know of anything suitable - maybe someone has written a BioPerl program to do this?

There are many programs that will find open reading frames (ORFs) (start codon->stop codon) in a given sequence.

However, the first ATG used to create the ORF may not be the correct start codon - it may be one further into the sequence.

Does anyone know of a program that will return ALL of these potential ORFs - that might be termed "ORFs within ORFs"?

Please post or email if you know of anything suitable - maybe someone has written a BioPerl program to do this?

hi ,
u can use the biology workbench ..it is a nice program .

If you click on "six frames" in the NCBI Orf Finder, it will indicate the possible start codons in each frame (in blue). Note that the start need not be ATG, but can be TTG or GTG (not usually CTG).
I believe there is a button on orf finder to turn on alternative initiation codons.

Are these TTG and GTG also the start codons for the eukaryotes? I never heard of it.

Are these TTG and GTG also the start codons for the eukaryotes? I never heard of it.

Should be only in prokaryotes bah, not sure though.

Alternative starts are for prokaryotes.

Let's you choose what start codon you want, along with other nifty features.