Em formação

Quantas proteínas existem no proteoma da Terra?


Só os humanos têm milhares de proteínas. Com isso em mente, parece que o número total de proteínas entre todas as espécies seria muito grande.

Existem estimativas disponíveis de quantas proteínas existem na Terra em todos os organismos? Também estou interessado em saber quantas dessas proteínas são únicas, em oposição a proteínas que são muito semelhantes a outras proteínas, ou seja uma estimativa de proteínas não redundantes ao lado das proteínas redundantes.


Registros atuais

De acordo com o Uniprot, existem 85.381.808 registros de proteínas, e com o filtro UniRef90 (ou seja removendo registros que podem ser representados por uma entrada com pelo menos 90% de similaridade de sequência), existem 42.424.511. No entanto, esses bancos de dados são alvos móveis e mudarão com o tempo. Vamos sequenciar mais espécies, encontrar novas isoformas de splice e vários outros métodos irão expandir os bancos de dados. Na verdade, os bancos de dados também ficarão truncados de vez em quando, pois algumas proteínas hipotéticas podem ser baseadas em genes que acabam não codificando proteínas.

Em 2007, um estudo estimou que o proteoma da Terra conteria cerca de 5 milhões de sequências, e que a maioria delas seria elucidada em 2012. Suspeito que este seja um estudo muito completo, no entanto, muita coisa mudou nos últimos 10 anos. Esta estimativa é, na verdade, menor do que os quase 9 milhões de espécies estimadas em estudos mais recentes.

Estimativa aproximada

Então, vamos fazer algumas contas de volta do envelope. Vamos supor que o artigo que estima quase 9 milhões de espécies está correto e que catalogamos apenas cerca de 1,2 milhão. Mas o UniProt não chega nem perto desse número. O UniProt contém 25477 nomes científicos em seu vocabulário controlado. Portanto, para 25 mil nomes, temos 85 milhões de registros de proteínas. E se tivéssemos 8,75 milhões de nomes? Vamos assumir:

$ frac {Predito ~ Proteínas} {Predito ~ Espécies} = frac {Conhecidas ~ Proteínas} {Conhecidas ~ Espécies} $

Podemos reorganizar isso para:

$ frac {Espécies ~ preditas ~ times ~ {Proteínas ~ conhecidas}} {Espécies ~ conhecidas} = Proteínas ~ preditas $

Estimativa generosa (Uniprot, 335527 proteínas por espécie):

$ frac {8750000 times {85381808}} {25477} = 2,932413e ^ {+ 10} $

Estimativa conservadora (Swissprot, 41 proteínas por espécie):

$ frac {8750000 times {554241}} {13408} = 3,616952e ^ {+ 7} $

Para fins de integridade, vamos supor que o número de proteínas <90% idênticas permanecerá em torno da metade desse valor. Podemos dizer que pode haver por aí $ 1,8e ^ {+ 7} $ para $ 1,5 {e} ^ {+ 10} $ proteínas "únicas", menos de um trilhão ($ 1e ^ {+ 12} $) Dados os absurdamente generosos 335 mil proteínas e as muito mesquinhas 41 proteínas por espécie, podemos ter quase certeza de que, se houver de fato 8,75 milhões de espécies, o número de proteínas ficará entre essas estimativas.

A maior suposição aqui é que as proteínas têm uma relação linear com as espécies, o que é improvável que seja o caso, e na estimativa generosa estamos fingindo que não há proteínas no UniProt que não tenham anotação de espécie. Quanto a Swissprot, isso inclui apenas proteínas que foram curadas manualmente, portanto, isso ignora muitas proteínas que são seguras de supor que existem e, normalmente, cobre apenas proteínas que são do interesse dos cientistas.


Uma pequena correção para sua pergunta, o UniProt lista ~ 20 mil genes codificadores de proteínas no proteoma humano, não milhões. Esses genes codificadores de proteínas estão sujeitos a várias modificações pós-tradução e splicing de isoformas, portanto, haverá mais proteínas finais do que 20k.


Como construir uma fábrica de proteínas

A complexidade das estruturas moleculares da célula é incrível. Tendo alcançado grande sucesso na elucidação dessas estruturas nos últimos anos, os biólogos agora estão assumindo o próximo desafio: descobrir mais sobre como elas são construídas. Um novo projeto de pesquisa agora fornece uma visão sobre um processo de construção muito incomum no parasita unicelular Trypanosoma brucei.

As células consistem em uma infinidade de estruturas moleculares, algumas delas exibindo uma complexidade impressionante. Os ribossomos, as fábricas de proteínas da célula, pertencem aos maiores e mais sofisticados complexos e são constituídos por RNA e também por um grande número de proteínas. Eles existem em todos os seres vivos e são considerados como uma das máquinas celulares que menos mudou em todos os estágios da evolução. Mas há exceções: nas mitocôndrias, organelas celulares que funcionam como usinas de energia, os ribossomos têm uma aparência consideravelmente diferente.

Uma extensa maquinaria

Os cientistas não estão apenas interessados ​​na estrutura e função desses ribossomos, mas também no "processo de construção" - como as células gerenciam a montagem dessas estruturas complexas? E como esses métodos de construção diferem, para estruturas diferentes? É claro que uma extensa maquinaria celular é necessária para garantir uma montagem tranquila de todos os tijolos de construção. Essa maquinaria celular responsável pela montagem do ribossomo na mitocôndria ainda não foi descrita. Agora, pesquisadores do grupo Andr & eacute Schneider da Universidade de Berna e do grupo Nenad Ban da ETH Zurich, investigaram o processo de montagem do ribossomo mitocondrial usando o parasita unicelular Trypanosoma brucei. Eles puderam acompanhar o processo de construção e identificar o maquinário celular associado dedicado a montar esses mitorribossomos. Como o T. brucei causa doenças dificilmente tratáveis, incluindo a doença do sono, os resultados podem levar a novas terapias. O projeto foi viabilizado pelo Centro Nacional de Competência em Pesquisa "RNA & amp Disease", que estuda o papel do RNA nos mecanismos de doenças. As descobertas já foram publicadas em "Ciência."

Elementos desconhecidos no "negócio da construção"

O parasita Trypanosoma brucei foi usado como sistema modelo, uma vez que seus mitorribossomos são particularmente complexos e, portanto, provavelmente requerem muitas etapas de montagem. Os pesquisadores poderiam seguir todas essas etapas detalhadamente. "Encontramos diferenças fascinantes", diz Moritz Niemann, do Departamento de Química e Bioquímica da Universidade de Berna, co-autor. Nos ribossomos mitocondriais, o RNA pode ser considerado como o aço do concreto armado, enquanto em outros ribossomos pode ser considerado como desempenhando um papel estrutural importante, como em estruturas baseadas em ferro, como a Torre Eiffel. A análise mostrou que a montagem de mitorribossomos em T. brucei prossegue através da formação de vários intermediários de montagem. Também envolve um grande número de proteínas que formam uma enorme estrutura adaptativa em torno do mitorribossomo emergente que não está presente na estrutura completa. Martin Saurer, do Departamento de Biologia da ETH Zurich e primeiro autor, diz que muitas dessas proteínas eram desconhecidas no "negócio da construção". “A microscopia crioeletrônica não só nos permite visualizar complexos conhecidos, mas também descobrir e descrever todo um processo celular: o canteiro de obras e as máquinas envolvidas na montagem dos ribossomos mitocondriais”, acrescenta. Moritz Niemann ficou especialmente perplexo com o enorme esforço que a célula está colocando nisso: "Até um quarto de todas as proteínas na mitocôndria são componentes dos mitocôndrios ou são necessários para construí-los."

Uma melhor compreensão leva a novas terapias

Uma vez que várias das proteínas de montagem são semelhantes em outros organismos, os pesquisadores acreditam que os insights obtidos fornecem informações gerais para uma melhor compreensão da maturação ribossômica em todos os organismos. E como todas essas proteínas são essenciais para o funcionamento da célula, essas descobertas podem ser úteis para o desenvolvimento de terapias contra T. brucei e parasitas relacionados que causam muitas doenças devastadoras em humanos e animais.


Quantas proteínas existem no proteoma da Terra? - Biologia

Figura 1: Galeria de proteínas. Exemplos representativos do tamanho da proteína são mostrados com exemplos desenhados para ilustrar alguns dos principais papéis funcionais que desempenham. Todas as proteínas na figura são mostradas na mesma escala para dar uma impressão de seus tamanhos relativos. Os pequenos objetos vermelhos mostrados em algumas das moléculas são os substratos para a proteína de interesse. Por exemplo, na hexoquinase, o substrato é a glicose. O identificador na ATP sintase é conhecido por existir, mas a estrutura exata não estava disponível e, portanto, apenas esquematicamente desenhada. Os nomes entre parênteses são os IDs das entradas das estruturas do banco de dados PDB. (Figura cortesia de David Goodsell).

As proteínas são freqüentemente chamadas de burros de carga da célula. Uma impressão dos tamanhos relativos dessas diferentes máquinas moleculares pode ser obtida na galeria mostrada na Figura 1. Um exemplo favorito é fornecido pela proteína Rubisco mostrada na figura que é responsável pela fixação de carbono na atmosfera, literalmente construindo a biosfera a partir de finas ar. Essa molécula, uma das proteínas mais abundantes da Terra, é responsável por extrair cerca de cem gigatoneladas de carbono da atmosfera a cada ano. Isso é ≈10 vezes mais do que todas as emissões de dióxido de carbono feitas pela humanidade a partir de escapamentos de carros, motores a jato, usinas de energia e todas as nossas outras tecnologias movidas a combustíveis fósseis. No entanto, os níveis de carbono continuam aumentando globalmente a taxas alarmantes porque esse carbono fixo é subsequentemente reemitido em processos como a respiração, etc. Essa fixação química é realizada por essas moléculas de Rubisco com uma massa monomérica de 55 kDa fixando CO2 um de cada vez, com cada CO2 com uma massa de 0,044 kDa (apenas outra forma de escrever 44 Da que esclarece a relação 1000: 1 em massa). Para outro jogador dominante em nossa biosfera, considere a ATP sintase (MW≈500-600 kDa, BNID 106276), também mostrada na Figura 1, que decora nossas membranas mitocondriais e é responsável por sintetizar as moléculas de ATP (MW = 507 Da) que alimentam muito da química da célula. Essas fábricas moleculares produzem tantas moléculas de ATP que todos os ATPs produzidos pelas mitocôndrias em um corpo humano em um dia teriam quase tanta massa quanto o próprio corpo. Como discutimos na vinheta sobre "Qual é o tempo de rotação dos metabólitos?" a rápida rotatividade torna isso menos improvável do que pode parecer.

Figura 2: Uma galeria de homooligômeros mostrando a bela simetria desses complexos de proteínas comuns. Destacadas em rosa estão as subunidades monoméricas que constituem cada oligômero. Figura de David Goodsell.

O tamanho de proteínas como Rubisco e ATP sintase e muitas outras podem ser medidos geometricamente em termos de quanto espaço ocupam e em termos de tamanho de sequência, conforme determinado pelo número de aminoácidos que são unidos para formar a proteína . Dado que o aminoácido médio tem uma massa molecular de 100 Da, podemos facilmente interconverter entre a massa e o comprimento da sequência. Por exemplo, o monômero Rubisco de 55 kDa tem cerca de 500 aminoácidos que compõem sua cadeia polipeptídica. A extensão espacial das proteínas solúveis e seu tamanho de sequência muitas vezes exibem uma propriedade de escalonamento aproximado onde o volume escala linearmente com o tamanho da sequência e, portanto, os raios ou diâmetros tendem a escalar como o tamanho da sequência para 1/3 da potência. Uma regra simples para pensar sobre proteínas solúveis típicas como o monômero Rubisco é que elas têm 3-6 nm de diâmetro, conforme ilustrado na Figura 1, que mostra não apenas Rubisco, mas muitas outras proteínas importantes que fazem as células funcionarem. Em quase metade dos casos, verifica-se que as proteínas funcionam quando várias cópias idênticas estão simetricamente ligadas umas às outras, como mostrado na Figura 2. Eles são chamados de homo-oligômeros para diferenciá-los dos casos em que diferentes subunidades de proteínas são unidas formando o chamados hetero-oligômeros. Os estados mais comuns são o dímero e o tetrâmero (e os monômeros não oligoméricos). Os homo-oligômeros são cerca de duas vezes mais comuns que os hetero-oligômeros (BNID 109185).

Há uma diferença de tamanho freqüentemente surpreendente entre uma enzima e os substratos nos quais ela atua. Por exemplo, nas vias metabólicas, os substratos são metabólitos que geralmente têm uma massa inferior a 500 Da, enquanto as enzimas correspondentes são geralmente cerca de 100 vezes mais pesadas. Na via da glicólise, pequenas moléculas de açúcar são processadas para extrair energia e blocos de construção para uma biossíntese posterior. Esta via é caracterizada por uma série de máquinas de proteína, todas muito maiores do que seus substratos de açúcar, com exemplos mostrados no canto inferior direito da Figura 1, onde vemos o tamanho relativo dos substratos indicados em vermelho ao interagir com suas enzimas .

Figura 3: Distribuição de comprimentos de proteína em E. coli, levedura de brotamento e células HeLa humanas. (A) O comprimento da proteína é calculado em aminoácidos (AA), com base nas sequências de codificação no genoma. (B) As distribuições são desenhadas após pesar cada gene com o número de cópias da proteína inferido a partir de estudos proteômicos de espectrometria de massa (M. Heinemann no prelo, M9 + glicose LMF de Godoy et al. Nature 455: 1251, 2008, meio definido T. Geiger et al., Mol. Cell Proteomics 11: M111.014050, 2012). Linhas contínuas são estimativas de densidade de kernel gaussiana para as distribuições que servem como um guia para o olho.

Tabela 1: Comprimento médio das sequências de codificação de proteínas com base em genomas de diferentes espécies. As entradas nesta tabela são baseadas em uma análise bioinformática por L. Brocchieri e S. Karlin, Nuc. Ácidos. Res., 33: 3390, 2005, BNID 106444. Conforme discutido no texto, propomos uma métrica alternativa que pondera proteínas por sua abundância, conforme revelado em recentes censos de amplo espectro de espectrometria de massa. Os resultados não são muito diferentes das entradas nesta tabela, com os eucariotos tendo cerca de 400 aa em média e as bactérias com cerca de 300 aa.

Valores concretos para o comprimento médio do gene podem ser calculados a partir de sequências do genoma como um exercício de bioinformática. A Tabela 1 relata esses valores para vários organismos, mostrando uma tendência para sequências codificadoras de proteínas mais longas ao passar de organismos unicelulares para organismos multicelulares. Na Figura 3, vamos além dos tamanhos médios de proteínas para caracterizar a distribuição completa de comprimentos de sequência de codificação no genoma, relatando valores para três organismos modelo. Se nosso objetivo era aprender sobre o espectro de tamanhos de proteínas, esta definição baseada no comprimento genômico pode ser suficiente. Mas quando queremos entender o investimento em recursos celulares que vai para a síntese de proteínas, ou para prever o comprimento médio de uma proteína escolhida aleatoriamente da célula, defendemos uma definição alternativa, que se tornou possível graças aos recentes censos em todo o proteoma. Para esses tipos de questões, as proteínas mais abundantes devem receber um peso estatístico maior no cálculo do comprimento esperado da proteína. Assim, calculamos a distribuição ponderada dos comprimentos das proteínas mostradas na Figura 3, dando a cada proteína um peso proporcional ao seu número de cópias. Esta distribuição representa o comprimento esperado de uma proteína pescada aleatoriamente para fora da célula, em vez de extraída aleatoriamente do genoma. As distribuições que emergem dessa abordagem centrada no proteoma dependem das condições específicas de crescimento da célula. Neste livro, optamos por usar como uma regra simples para o comprimento da proteína “típica” em procariotos ≈300 aa e em eucariotos ≈400 aa. As distribuições na Figura 3 mostram que esta é uma estimativa razoável, embora possa ser uma superestimativa em alguns casos.

Um dos encantos da biologia é que a evolução necessita de elementos funcionais muito diversos criando outliers em quase todas as propriedades (que também é a razão pela qual discutimos medianas e não médias acima). Quando se trata do tamanho da proteína, a titina é uma grande exceção. A titina é uma proteína multifuncional que se comporta como uma mola não linear nos músculos humanos, com seus vários domínios se desdobrando e redobrando na presença de forças e dando aos músculos sua elasticidade. A titina é cerca de 100 vezes mais longa do que a proteína média com sua cadeia polipeptídica de 33.423 aa (BNID 101653). Identificar as menores proteínas do genoma ainda é controverso, mas proteínas ribossômicas curtas de cerca de 100 aa são comuns.

É muito comum usar a marcação GFP de proteínas para estudar tudo, desde sua localização até suas interações. Munidos do conhecimento do tamanho característico de uma proteína, estamos agora preparados para revisitar o ato aparentemente inócuo de rotular uma proteína. O GFP tem 238 aa de comprimento, composto por um barril beta dentro do qual os aminoácidos-chave formam o cromóforo fluorescente, conforme discutido na vinheta “Qual é o tempo de maturação para proteínas fluorescentes?”. Como resultado, para muitas proteínas, o ato de rotular deve realmente ser pensado como a criação de um complexo de proteínas que agora é duas vezes maior do que a proteína original não perturbada.


O que é uma proteína? Um biólogo explica

Apenas 20 aminoácidos para cadeias em várias combinações para criar as milhares de variedades de proteínas em nosso corpo. Crédito: David Goodsell / ProteinDatabase, CC BY-SA

Nota do editor: Nathan Ahlgren é professor de biologia na Clark University. Nesta entrevista, ele explica exatamente o que são as proteínas, como são feitas e a grande variedade de funções que desempenham no corpo humano.

Uma proteína é uma estrutura básica encontrada em todas as formas de vida. É uma molécula. E o principal aspecto de uma proteína é que ela é composta de componentes menores, chamados aminoácidos. Gosto de pensar neles como um colar de contas de cores diferentes. Cada conta representaria um aminoácido, que são moléculas menores contendo átomos de carbono, oxigênio, hidrogênio e às vezes de enxofre. Portanto, uma proteína é essencialmente uma cadeia composta por esses pequenos aminoácidos individuais. Existem 22 aminoácidos diferentes que você pode combinar de qualquer maneira diferente.

Uma proteína geralmente não existe como um fio, mas na verdade se dobra em uma forma particular, dependendo da ordem e de como esses diferentes aminoácidos interagem entre si. Essa forma influencia o que a proteína faz em nosso corpo.

De onde vêm os aminoácidos?

Os aminoácidos em nosso corpo vêm dos alimentos que comemos. Também os fazemos em nosso corpo. Por exemplo, outros animais produzem proteínas e nós as comemos. Nossos corpos pegam essa cadeia e a decompõem em aminoácidos individuais. Em seguida, ele pode refazê-los em qualquer proteína de que precisamos.

Uma vez que as proteínas são quebradas em aminoácidos no sistema digestivo, elas são levadas para nossas células e meio que flutuam dentro dela, como aquelas pequenas contas individuais em nossa analogia. E então, dentro da célula, seu corpo basicamente os conecta para fazer as proteínas que seu corpo precisa produzir.

Podemos produzir sozinhos cerca de metade dos aminoácidos de que necessitamos, mas temos de obter os outros com a nossa alimentação.

O que as proteínas fazem em nosso corpo?

Os cientistas não têm certeza, mas a maioria concorda que existem cerca de 20.000 proteínas diferentes em nosso corpo. Alguns estudos sugerem que pode haver ainda mais. Eles realizam uma variedade de funções, desde fazer algumas conversões metabólicas até manter as células unidas e fazer com que os músculos funcionem.

Suas funções se enquadram em algumas categorias amplas. Um é estrutural. Seu corpo é feito de muitos tipos diferentes de estruturas - pense em estruturas semelhantes a fios, glóbulos, âncoras, etc. Eles formam o material que mantém seu corpo coeso. O colágeno é uma proteína que dá estrutura à pele, aos ossos e até aos dentes. Integrina é uma proteína que faz ligações flexíveis entre as células. Seu cabelo e unhas são feitos de uma proteína chamada queratina.

Outro grande papel que eles desempenham é a bioquímica - como seu corpo realiza reações específicas em sua célula, como quebrar gordura ou aminoácidos. Lembra quando eu disse que nosso corpo quebra as proteínas dos alimentos que comemos? Mesmo essa função é realizada por proteínas como a pepsina. Outro exemplo é a hemoglobina - a proteína que transporta oxigênio no sangue. Então, eles estão realizando essas reações químicas especiais dentro de você.

As proteínas também podem processar sinais e informações, como as proteínas do relógio circadiano que marcam o tempo em nossas células, mas essas são algumas categorias principais de funções que as proteínas desempenham na célula.

Por que a proteína é freqüentemente associada aos músculos e à carne?

Diferentes tipos de alimentos têm diferentes tipos de conteúdo de proteína. Existem muitos carboidratos em plantas como trigo e arroz, mas eles são menos ricos em proteínas. Mas a carne em geral tem mais conteúdo de proteína. É necessária muita proteína para formar os músculos do corpo. É por isso que a proteína é frequentemente associada com comer carne e construir músculos, mas as proteínas estão realmente envolvidas em muito, muito mais do que isso.

Este artigo foi republicado de The Conversation sob uma licença Creative Commons. Leia o artigo original.


O Instituto de Pesquisa Criativa

Evolução significa mudança, mas quando olhamos para o mundo dos vivos, não vemos nenhuma mudança significativa (macroevolução). Considere as criaturas problemáticas que Darwin rotulou de “fósseis vivos”. Esses são organismos que foram supostamente extintos por muitos milhões de anos, apenas para aparecer nos séculos XX e XXI vivos e em ação.

A Austrália é o lar de um besouro descoberto vivo em 1998, mas pelos darwinistas supostamente extinto por "200 milhões de anos". Não mudou em nada. Existem fósseis de libélulas com mais de "300 milhões de anos", com veias de asas virtualmente idênticas às asas das libélulas de hoje. Não há mudança. Supostamente, milípedes estão rastejando por & quot420 milhões de anos & quot! Um exemplo de planta fascinante é o pinheiro Wollemi de & quot150 milhões de anos & quot, descoberto em 1994 e 2000 a oeste de Sydney, Austrália. Deve-se perguntar: é lógico supor que um grupo de árvores pode permanecer em um local físico por mais de 150 milhões de anos e não chegar a algum morte? Os afortunados pesquisadores que obtiverem licenças para visitar o local secreto dos estandes do Pinheiro Wollemi devem primeiro trocar de roupa para evitar possível contaminação das árvores com bactérias, vírus ou esporos estranhos. Mas por que se preocupar com o contágio? O pinheiro Wollemi deve ser incrivelmente saudável depois de todos aqueles milhões de anos. Correntes de ar e chuvas aleatórias ao longo dos milênios devem trazer todo tipo de "inseto" para infectar essas árvores e seus ancestrais cem mil vezes.

Outro indicador de terra jovem envolve a degradação de compostos orgânicos (ou seja, proteínas) em um ambiente geológico. Não há dúvida, mesmo entre alguns naturalistas evolucionistas, que osso de dinossauro não mineralizado ainda contendo proteína óssea reside em muitos locais do mundo. 1 Isso é incrível e destrói o mantra dos dinossauros em extinção "há 65 milhões de anos". Simplificando, o osso contendo uma proteína tão bem preservada não poderia ter existido por mais de alguns milhares de anos nos ambientes geológicos em que são encontrados.

Em agosto de 2004, a BBC News relatou que o Projeto Núcleo de Gelo da Groenlândia do Norte (NGrip) recuperou o que parece ser folhas de grama ou agulhas de pinheiro de núcleos a duas milhas abaixo da superfície. Embora supostamente com vários milhões de anos, a possível matéria orgânica sugere que a camada de gelo da Groenlândia se formou rapidamente. 2

Os biólogos criacionistas veem a idade da Terra em termos de apenas milhares de anos. Fósseis vivos, "matéria vegetal" antiga e proteína de dinossauro não são um problema se a Terra for jovem. Os evolucionistas, por outro lado, devem postular períodos impossivelmente longos de nenhuma mudança evolucionária quando uma criatura "extinta" parece viva, e então dar desculpas por que a criatura nunca mudou.


As sequências de aminoácidos influenciam as propriedades químicas de uma proteína

A descoberta de Sanger com a insulina revelou não apenas como as proteínas definiram estruturas químicas, mas também porque proteínas diferentes têm funções diferentes. Assim como letras diferentes do alfabeto têm sons diferentes, as várias cadeias R fornecem aos vinte aminoácidos propriedades químicas diferentes. Assim, amarrar aminoácidos em combinações diferentes leva a proteínas com propriedades e formas extremamente diversas.

A pesquisa de insulina de Sanger atuou como um trampolim para o trabalho de outros químicos de proteínas durante os anos 1950 e 60, envolvendo como a estrutura se relaciona com a função. Ao passar raios-X por várias proteínas, os pesquisadores obtiveram imagens de suas estruturas tridimensionais. Estudando as imagens e resolvendo questões relacionadas à física das ligações químicas, os bioquímicos de meados do século 20 aprenderam que a sequência de aminoácidos representa a estrutura da proteína em apenas um nível. Eles começaram a se referir à sequência como a estrutura primária, já que ela leva a cadeia da proteína a se torcer e dobrar de forma a dar à proteína uma forma mais complexa.

Certos aminoácidos permitem que uma cadeia polipeptídica dobre, por exemplo, enquanto outros aminoácidos mantêm a cadeia mais rígida (Figura 9). Algumas cadeias R são muito hidrofílicas, gostam de estar na água e, portanto, tornam o aminoácido solúvel em água. Outras cadeias R são hidrofóbicas e não se misturam com água. Freqüentemente, ter uma área hidrofóbica, ou "bolso", dentro de uma proteína pode ajudar a proteína a fazer seu trabalho específico, por exemplo, agarrar um substrato hidrofóbico para modificá-lo quimicamente.

Estrutura primária Estrutura Secundária
Estrutura terciária Estrutura quaternária
Figura 9: As várias estruturas proteicas.

Dependendo de suas cadeias R, os aminoácidos também podem variar em termos de acidez e alcalinidade. Quando o ambiente é neutro (pH 7), os aminoácidos aspartato e glutamato atuam como ácidos, enquanto a arginina e a lisina atuam como bases, e isso também tem implicações importantes para as propriedades de uma proteína.


Um aminoácido de papel acabado.

Temos uma atividade divertida de dobrar papel. Lembra-se de como as proteínas são feitas de blocos de construção chamados aminoácidos e têm sua própria forma especial? As proteínas não apenas parecem diferentes, mas também desempenham funções diferentes dentro da célula para manter seu corpo funcionando sem problemas.

A proteína que produzimos é um canal que fica na superfície externa da célula, ou membrana, e funciona como uma porta que permite a passagem de certas moléculas. Alguns canais estão abertos o tempo todo, enquanto outros podem ser fechados dependendo dos sinais da célula ou do ambiente. Quando o canal está aberto, outras moléculas podem entrar na célula passando pelo buraco no meio.

Como você descobrirá ao construir seu canal de origami, a forma de uma proteína é muito importante. Se você não dobrar seus aminoácidos de origami corretamente, eles não se encaixariam para formar uma cadeia de proteína. Ou, se você cometer um erro ao juntar aminoácidos, o canal finalizado pode não conseguir abrir e fechar corretamente.

Na natureza, a mesma coisa pode acontecer. Se uma proteína tiver o formato incorreto, ela não funcionará corretamente.

Materiais: Você precisará de 8 pedaços quadrados de papel do mesmo tamanho.

Pontas: A melhor maneira de fazer dobras é colocar o papel sobre uma superfície plana e dura, como uma mesa. É importante prestar atenção à direção do papel e não alterar sua orientação ao seguir as instruções.

Você pode descobrir mais sobre como as proteínas se dobram em formas exclusivas para fazer e funcionar dentro do seu corpo na seção Ciência das proteínas.

Você também pode baixar e imprimir nosso Origami Protein Handout (PDF) para obter instruções passo a passo de como fazer seu canal de proteína ou assistir a este vídeo passo a passo.

1. Dobre um único pedaço de papel ao meio diagonalmente
2. Dobre o papel ao meio na diagonal novamente
3. Seu papel dobrado deve ser parecido com este
4. Desdobre o papel

5. Dobre o papel ao meio
6. Dobre o papel ao meio novamente
7. Seu papel dobrado deve ser parecido com este

8. Desdobre a camada superior do quadrado até a metade
9. Abra a camada superior do quadrado e alise-o em um triângulo, usando os vincos existentes.
10. Seu papel dobrado deve ser parecido com este

11. Vire-o
12. Desdobre a camada superior até a metade
13. Abra a camada superior e alise-a em um triângulo, usando os vincos existentes.
14. Seu papel dobrado deve ser parecido com este

15. Dobre as bordas da camada superior apenas na linha central
16. Seu papel dobrado deve ser parecido com este
17. Vire-o
18. Dobre as bordas da camada superior apenas na linha central
19. Agora você completou um aminoácido. Repita essas etapas com outro pedaço de papel até criar um total de oito aminoácidos.

E é isso! Depois de ter os aminoácidos, você está pronto para passar para a Parte 2 para criar o canal de proteína.


3.4 Proteínas

Nesta seção, você investigará as seguintes questões:

  • Quais são as funções das proteínas nas células e tecidos?
  • Qual é a relação entre aminoácidos e proteínas?
  • Quais são os quatro níveis de organização de proteínas?
  • Qual é a relação entre a forma e a função da proteína?

Conexão para Cursos AP ®

As proteínas são longas cadeias de diferentes sequências dos 20 aminoácidos, cada uma contendo um grupo amino (-NH2), um grupo carboxila (-COOH) e um grupo variável. (Pense em quantas “palavras” de proteínas podem ser feitas com 20 “letras” de aminoácidos). Cada aminoácido está ligado ao seu vizinho por uma ligação peptídica formada por uma reação de desidratação. Uma longa cadeia de aminoácidos é conhecida como polipeptídeo. As proteínas desempenham muitas funções nas células. Eles agem como enzimas que catalisam reações químicas, fornecem suporte estrutural, regulam a passagem de substâncias através da membrana celular, protegem contra doenças e coordenam as vias de sinalização celular. A estrutura da proteína é organizada em quatro níveis: primário, secundário, terciário e quaternário. A estrutura primária é a sequência única de aminoácidos. Uma mudança em apenas um aminoácido pode alterar a estrutura e função da proteína. Por exemplo, a anemia falciforme resulta da substituição de apenas um aminoácido em uma molécula de hemoglobina que consiste em 574 aminoácidos. A estrutura secundária consiste no dobramento local do polipeptídeo por formação de ligação de hidrogênio levando à hélice α e conformações de folha pregueada β. Na estrutura terciária, várias interações, por exemplo, ligações de hidrogênio, ligações iônicas, ligações dissulfeto e interações hidrofóbicas entre grupos R, contribuem para o dobramento do polipeptídeo em diferentes configurações tridimensionais. A maioria das enzimas tem configuração terciária. Se uma proteína é desnaturada, perde sua forma tridimensional, ela pode não ser mais funcional. As condições ambientais, como temperatura e pH, podem desnaturar as proteínas. Algumas proteínas, como a hemoglobina, são formadas a partir de vários polipeptídeos, e as interações dessas subunidades formam a estrutura quaternária das proteínas.

As informações apresentadas e os exemplos destacados na seção, apoiam os conceitos e os Objetivos de Aprendizagem descritos na Grande Ideia 4 do AP ® Biology Curriculum Framework. Os Objetivos de Aprendizagem listados na Estrutura Curricular fornecem uma base transparente para o curso AP ® Biologia, uma experiência laboratorial baseada em investigação, atividades instrucionais e questões do exame AP ®. Um objetivo de aprendizagem mescla o conteúdo necessário com uma ou mais das sete práticas científicas.

Grande Ideia 4 Os sistemas biológicos interagem, e esses sistemas e suas interações possuem propriedades complexas.
Compreensão Duradoura 4.A As interações dentro dos sistemas biológicos levam a propriedades complexas.
Conhecimento Essencial 4.A.1 The subcomponents of biological molecules and their sequence determine the properties of that molecule.
Prática de Ciências 7.1 The student can connect phenomena and models across spatial and temporal scales.
Objetivo do aprendizado 4.1 The student is able to explain the connection between the sequence and the subcomponents of a biological polymer and its properties.
Conhecimento Essencial 4.A.1 The subcomponents of biological molecules and their sequence determine the properties of that molecule.
Prática de Ciências 1.3 The student can refine representations and models of natural or man-made phenomena and systems in the domain.
Objetivo do aprendizado 4.2 The student is able to refine representations and models to explain how the subcomponents of a biological polymer and their sequence determine the properties of that polymer.
Conhecimento Essencial 4.A.1 The subcomponents of biological molecules and their sequence determine the properties of that molecule.
Prática de Ciências 6.1 The student can justify claims with evidence.
Prática de Ciências 6.4 O aluno pode fazer afirmações e previsões sobre fenômenos naturais com base em teorias e modelos científicos.
Objetivo do aprendizado 4.3 The student is able to use models to predict and justify that changes in the subcomponents of a biological polymer affect the functionality of the molecules.

Teacher Support

Twenty amino acids can be formed into a nearly limitless number of different proteins. The sequence of the amino acids ultimately determines the final configuration of the protein chain, giving the molecule its specific function.

Teacher Support

Emphasize that proteins have a variety of functions in the body. Table 3.1 contains some examples of these functions. Note that not all enzymes work under the same conditions. Amylase only works in an alkaline medium, such as in saliva, while pepsin works in the acid environment of the stomach. Discuss other materials that can be carried by protein in body fluids in addition to the substances listed for transport in the text. Proteins also carry insoluble lipids in the body and transport charged ions, such as calcium, magnesium, and zinc. Discuss another important structural protein, collagen, as it is found throughout the body, including in most connective tissues. Emphasize that not all hormones are proteins and that steroid based hormones were discussed in the previous section.

The amino group of an amino acid loses an electron and becomes positively charged. The carboxyl group easily gains an electron, becoming negatively charged. This results in the amphipathic characteristic of amino acids and gives the compounds solubility in water. The presence of both functional groups also allows dehydration synthesis to join the individual amino acids into a peptide chain.

Protein structure is explained as though it occurs in three to four discrete steps. In reality, the structural changes that result in a functional protein occur on a continuum. As the primary structure is formed off the ribosomes, the polypeptide chain goes through changes until the final configuration is achieved. Have the students imagine a strand of spaghetti as it cooks in a clear pot. Initially, the strand is straight (ignore the stiffness for this example). While it cooks, the strand will bend and twist and (again, for this example), fold itself into a loose ball made up of the strand of pasta. The resulting strand has a particular shape. Ask the students what types of chemical bonds or forces might affect protein structure. These shapes are dictated by the position of amino acids along the strand. Other forces will complete the folding and maintain the structure.

As Questões do Desafio da Prática de Ciências contêm questões de teste adicionais para esta seção que o ajudarão a se preparar para o exame AP. Essas questões abordam os seguintes padrões:
[APLO 1.14] [APLO 2.12] [APLO 4.1] [APLO 4.3][APLO 4.15][APLO 4.22]

Types and Functions of Proteins

Proteins are one of the most abundant organic molecules in living systems and have the most diverse range of functions of all macromolecules. Proteins may be structural, regulatory, contractile, or protective they may serve in transport, storage, or membranes or they may be toxins or enzymes. Each cell in a living system may contain thousands of proteins, each with a unique function. Their structures, like their functions, vary greatly. They are all, however, polymers of amino acids, arranged in a linear sequence.

Enzymes , which are produced by living cells, are catalysts in biochemical reactions (like digestion) and are usually complex or conjugated proteins. Each enzyme is specific for the substrate (a reactant that binds to an enzyme) it acts on. The enzyme may help in breakdown, rearrangement, or synthesis reactions. Enzymes that break down their substrates are called catabolic enzymes, enzymes that build more complex molecules from their substrates are called anabolic enzymes, and enzymes that affect the rate of reaction are called catalytic enzymes. It should be noted that all enzymes increase the rate of reaction and, therefore, are considered to be organic catalysts. An example of an enzyme is salivary amylase, which hydrolyzes its substrate amylose, a component of starch.

Hormones are chemical-signaling molecules, usually small proteins or steroids, secreted by endocrine cells that act to control or regulate specific physiological processes, including growth, development, metabolism, and reproduction. For example, insulin is a protein hormone that helps to regulate the blood glucose level. The primary types and functions of proteins are listed in Table 3.1.

ModeloExemplosFunções
Digestive EnzymesAmylase, lipase, pepsin, trypsinHelp in digestion of food by catabolizing nutrients into monomeric units
TransporteHemoglobin, albuminCarry substances in the blood or lymph throughout the body
StructuralActin, tubulin, keratinConstruct different structures, like the cytoskeleton
HormôniosInsulin, thyroxineCoordinate the activity of different body systems
DefenseImmunoglobulinsProtect the body from foreign pathogens
ContractileActin, myosinEffect muscle contraction
ArmazenarLegume storage proteins, egg white (albumin)Provide nourishment in early development of the embryo and the seedling

Proteins have different shapes and molecular weights some proteins are globular in shape whereas others are fibrous in nature. For example, hemoglobin is a globular protein, but collagen, found in our skin, is a fibrous protein. Protein shape is critical to its function, and this shape is maintained by many different types of chemical bonds. Changes in temperature, pH, and exposure to chemicals may lead to permanent changes in the shape of the protein, leading to loss of function, known as denaturation . All proteins are made up of different arrangements of the most common 20 types of amino acids.

Aminoácidos

Os aminoácidos são os monômeros que constituem as proteínas. Each amino acid has the same fundamental structure, which consists of a central carbon atom, also known as the alpha (α) carbon, bonded to an amino group (NH2), a carboxyl group (COOH), and to a hydrogen atom. Every amino acid also has another atom or group of atoms bonded to the central atom known as the R group (Figure 3.24).

The name "amino acid" is derived from the fact that they contain both amino group and carboxyl-acid-group in their basic structure. As mentioned, there are 20 common amino acids present in proteins. Nine of these are considered essential amino acids in humans because the human body cannot produce them and they are obtained from the diet. For each amino acid, the R group (or side chain) is different (Figure 3.25).

Visual Connection

  1. Polar and charged amino acids will be found on the surface. Non-polar amino acids will be found in the interior.
  2. Polar and charged amino acids will be found in the interior. Non-polar amino acids will be found on the surface.
  3. Non-polar and uncharged proteins will be found on the surface as well as in the interior.

The chemical nature of the side chain determines the nature of the amino acid (that is, whether it is acidic, basic, polar, or nonpolar). For example, the amino acid glycine has a hydrogen atom as the R group. Amino acids such as valine, methionine, and alanine are nonpolar or hydrophobic in nature, while amino acids such as serine, threonine, and cysteine are polar and have hydrophilic side chains. The side chains of lysine and arginine are positively charged, and therefore these amino acids are also known as basic amino acids. Proline has an R group that is linked to the amino group, forming a ring-like structure. Proline is an exception to the standard structure of an animo acid since its amino group is not separate from the side chain (Figure 3.25).

Amino acids are represented by a single upper case letter or a three-letter abbreviation. For example, valine is known by the letter V or the three-letter symbol val. Just as some fatty acids are essential to a diet, some amino acids are necessary as well. They are known as essential amino acids, and in humans they include isoleucine, leucine, and cysteine. Essential amino acids refer to those necessary for construction of proteins in the body, although not produced by the body which amino acids are essential varies from organism to organism.

A sequência e o número de aminoácidos determinam, em última instância, a forma, o tamanho e a função da proteína. Each amino acid is attached to another amino acid by a covalent bond, known as a peptide bond , which is formed by a dehydration reaction. The carboxyl group of one amino acid and the amino group of the incoming amino acid combine, releasing a molecule of water. The resulting bond is the peptide bond (Figure 3.26).

The products formed by such linkages are called peptides. As more amino acids join to this growing chain, the resulting chain is known as a polypeptide. Each polypeptide has a free amino group at one end. This end is called the N terminal, or the amino terminal, and the other end has a free carboxyl group, also known as the C or carboxyl terminal. While the terms polypeptide and protein are sometimes used interchangeably, a polypeptide is technically a polymer of amino acids, whereas the term protein is used for a polypeptide or polypeptides that have combined together, often have bound non-peptide prosthetic groups, have a distinct shape, and have a unique function. After protein synthesis (translation), most proteins are modified. These are known as post-translational modifications. They may undergo cleavage or phosphorylation, or may require the addition of other chemical groups. Only after these modifications is the protein completely functional.

Link para aprendizagem

Click through the steps of protein synthesis in this interactive tutorial.


6 Questions About Hydrolyzed Protein, Answered

You’ve probably seen it listed on labels. But what exactly is it—and what are the benefits?

Hydrolyzed protein: It’s a complicated name for a complicated process. But its benefits can’t be overstated for people who have trouble digesting whole and conventional food sources of protein.

Protein is a necessary macronutrient in the human diet—one that supports everything from cell function to muscle maintenance and generation. It’s composed of long chains of amino acids, many of which are individually necessary for human health.

But for people with compromised digestive function, separating and absorbing those complex chains of amino acids can be difficult, or even impossible, says Vanessa Carr, M.S., R.D.N., L.D.N., clinical nutrition manager for Kate Farms. That’s where hydrolyzed protein comes in.

What the heck does “hydrolyzed” mean?

“Basically, it’s the unchaining of long protein strands into smaller chains or single amino acids,” says Carr. This process involves breaking down the peptide bonds that hold amino acids together, and it’s accomplished using enzymes like the ones produced in the human pancreas or other digestive organs.

Protein molecules can be “partially” hydrolyzed, meaning their amino acid chains are cut down into smaller segments, or they can be fully hydrolyzed, meaning every amino acid has been isolated, Carr explains.

Why is this necessary?

Digestion involves breaking down food molecules so the body can put them to good use. But again, for some, that breakdown capability is impaired. Because hydrolyzed proteins are already broken down—basically, pre-digested—the body can absorb them with little to no effort, Carr says.

Who benefits most from hydrolyzed proteins?

They’re especially important for people who are missing parts of their intestine, along with those who have pancreatic disease or other conditions that make protein digestion a struggle.

“People with malabsorption disorders,” Carr says, “and people with food allergies or sensitivities can usually tolerate a hydrolyzed protein formula better than the others.” It’s used in hypoallergenic infant formulas, for example.

Hydrolyzed proteins may also cause less of an upset stomach for those with gut conditions like irritable bowel syndrome. They have also been shown to benefit those with slow stomach digestion.

Historically, all hydrolyzed proteins were dairy-based. That’s since changed, and Kate Farms has been at the forefront—more on this later.

How many amino acids are found in protein?

Twenty different amino acids can combine to make protein, says Carr, though a single protein molecule can include a sequence of 200 or more single amino acids in various combinations.

Think of a protein molecule is a train. A big train can have 200 cars, made up of 20 types of cars.

Are all of them essential?

Não. Only nine of them are essential, which means the human body cannot produce them on its own.

Ever hear that some foods are “complete” proteins? That means the food contains all nine essential amino acids in the right proportion. While it’s true that animal sources of protein are complete, Carr says, it isn’t necessary to eat only animal products to get all the essential amino acids.

What makes Kate Farms’ hydrolyzed protein different from everyone else’s?

Kate Farms Peptide Formulas contain hydrolyzed pea protein, supplemented with other plant-based amino acids. “We’re the first company to hydrolyze a complete plant-based protein,” Carr says. “Every other hydrolyzed formula—every single one—uses whey, which is from dairy.”

Carr says some people with dairy allergies (or intolerances) can benefit from a hydrolyzed whey protein, but they may experience symptoms when exposed to whey-sourced amino acids. “All Kate Farms products are vegan,” she says, “so there’s no animal sourcing whatsoever.”

In addition, pea protein is not one of the top 8 food allergens. Kate Farms shakes are free of corn as well, unlike the single amino acid formulas on the market.

If you are under a doctor’s care and need a peptide formula, check out our Peptide Formulas to learn about products, free samples, insurance coverage, and talking to your doctor about how peptides may be used in your treatment plan.

If you are not a medical patient and have come to our site just looking for great health knowledge, be sure to try nutritious and delicious Kate Farms Nutrition Shakes, featuring organic pea protein, powerful phytonutrients, and more.


Machine-learning model helps determine protein structures

As imagens para download no site do MIT News office são disponibilizadas para entidades não comerciais, imprensa e público em geral sob uma licença Creative Commons Atribuição Não Comercial Sem Derivados. Você não pode alterar as imagens fornecidas, a não ser para recortá-las no tamanho certo. Uma linha de crédito deve ser usada ao reproduzir as imagens, se não for fornecida abaixo, credite as imagens ao "MIT".

Imagem anterior Próxima imagem

Cryo-electron microscopy (cryo-EM) allows scientists to produce high-resolution, three-dimensional images of tiny molecules such as proteins. This technique works best for imaging proteins that exist in only one conformation, but MIT researchers have now developed a machine-learning algorithm that helps them identify multiple possible structures that a protein can take.

Unlike AI techniques that aim to predict protein structure from sequence data alone, protein structure can also be experimentally determined using cryo-EM, which produces hundreds of thousands, or even millions, of two-dimensional images of protein samples frozen in a thin layer of ice. Computer algorithms then piece together these images, taken from different angles, into a three-dimensional representation of the protein in a process termed reconstruction.

Em um Métodos da Natureza paper, the MIT researchers report a new AI-based software for reconstructing multiple structures and motions of the imaged protein — a major goal in the protein science community. Instead of using the traditional representation of protein structure as electron-scattering intensities on a 3D lattice, which is impractical for modeling multiple structures, the researchers introduced a new neural network architecture that can efficiently generate the full ensemble of structures in a single model.

“With the broad representation power of neural networks, we can extract structural information from noisy images and visualize detailed movements of macromolecular machines,” says Ellen Zhong, an MIT graduate student and the lead author of the paper.

With their software, they discovered protein motions from imaging datasets where only a single static 3D structure was originally identified. They also visualized large-scale flexible motions of the spliceosome — a protein complex that coordinates the splicing of the protein coding sequences of transcribed RNA.

“Our idea was to try to use machine-learning techniques to better capture the underlying structural heterogeneity, and to allow us to inspect the variety of structural states that are present in a sample,” says Joseph Davis, the Whitehead Career Development Assistant Professor in MIT’s Department of Biology.

Davis and Bonnie Berger, the Simons Professor of Mathematics at MIT and head of the Computation and Biology group at the Computer Science and Artificial Intelligence Laboratory, are the senior authors of the study, which appears today in Métodos da Natureza. MIT postdoc Tristan Bepler is also an author of the paper.

Visualizing a multistep process

The researchers demonstrated the utility of their new approach by analyzing structures that form during the process of assembling ribosomes — the cell organelles responsible for reading messenger RNA and translating it into proteins. Davis began studying the structure of ribosomes while a postdoc at the Scripps Research Institute. Ribosomes have two major subunits, each of which contains many individual proteins that are assembled in a multistep process.

To study the steps of ribosome assembly in detail, Davis stalled the process at different points and then took electron microscope images of the resulting structures. At some points, blocking assembly resulted in accumulation of just a single structure, suggesting that there is only one way for that step to occur. However, blocking other points resulted in many different structures, suggesting that the assembly could occur in a variety of ways.

Because some of these experiments generated so many different protein structures, traditional cryo-EM reconstruction tools did not work well to determine what those structures were.

“In general, it’s an extremely challenging problem to try to figure out how many states you have when you have a mixture of particles,” Davis says.

After starting his lab at MIT in 2017, he teamed up with Berger to use machine learning to develop a model that can use the two-dimensional images produced by cryo-EM to generate all of the three-dimensional structures found in the original sample.

In the new Métodos da Natureza study, the researchers demonstrated the power of the technique by using it to identify a new ribosomal state that hadn’t been seen before. Previous studies had suggested that as a ribosome is assembled, large structural elements, which are akin to the foundation for a building, form first. Only after this foundation is formed are the “active sites” of the ribosome, which read messenger RNA and synthesize proteins, added to the structure.

In the new study, however, the researchers found that in a very small subset of ribosomes, about 1 percent, a structure that is normally added at the end actually appears before assembly of the foundation. To account for that, Davis hypothesizes that it might be too energetically expensive for cells to ensure that every single ribosome is assembled in the correct order.

“The cells are likely evolved to find a balance between what they can tolerate, which is maybe a small percentage of these types of potentially deleterious structures, and what it would cost to completely remove them from the assembly pathway,” he says.

Viral proteins

The researchers are now using this technique to study the coronavirus spike protein, which is the viral protein that binds to receptors on human cells and allows them to enter cells. The receptor binding domain (RBD) of the spike protein has three subunits, each of which can point either up or down.

“For me, watching the pandemic unfold over the past year has emphasized how important front-line antiviral drugs will be in battling similar viruses, which are likely to emerge in the future. As we start to think about how one might develop small molecule compounds to force all of the RBDs into the ‘down’ state so that they can’t interact with human cells, understanding exactly what the ‘up’ state looks like and how much conformational flexibility there is will be informative for drug design. We hope our new technique can reveal these sorts of structural details,” Davis says.

The research was funded by the National Science Foundation Graduate Research Fellowship Program, the National Institutes of Health, and the MIT Jameel Clinic for Machine Learning and Health. This work was supported by MIT Satori computation cluster hosted at the MGHPCC.


Assista o vídeo: 1. Proteomics: The proteome (Dezembro 2021).