Em formação

Diferenças de comprimento entre proteínas que interagem fisicamente


O que pode ser dito sobre as diferenças de comprimento entre proteínas que interagem? Eles geralmente têm comprimentos de sequência semelhantes ou não têm?


Pelo menos em uma rede de interação de proteínas humanas, parece que as proteínas de fato se ligam principalmente a proteínas de comprimento de sequência semelhante. Considere a figura abaixo, com base na análise de uma rede de interação de proteínas humanas da plataforma Protein Interaction Network Analysis (PINA). No conjunto de dados, o tamanho médio relativo da proteína (o maior comprimento de sequência de aminoácidos dividido pelo menor em cada par de interação) foi 1,9, o valor máximo foi 293,6 e o ​​percentil 99, que é o ponto de corte para o gráfico, foi 15,2 .

Edit: De acordo com o comentário de stords abaixo, você obtém essencialmente o mesmo resultado para uma rede aleatória:

Nesse caso, a rede foi gerada escolhendo duas proteínas aleatoriamente da rede original, criando uma interação entre elas e repetindo até que a rede aleatória tivesse o mesmo número de interações que a original.

Imediatamente, pode parecer que o PIN PINA é dominado por interações aleatórias. Eu faria algumas análises de rede para determinar suas características, mas como é uma rede bastante grande, levaria mais tempo do que tenho agora. Os resultados são semelhantes para duas redes adicionais com interações em Saccharomyces cerevisiae e Caenorhabditis elegans, respectivamente baixadas do PINA. Observe que todas as três redes foram construídas a partir de bancos de dados com vários níveis de curadoria (consulte a publicação original do PINA: http://www.nature.com/nmeth/journal/v6/n1/full/nmeth.1282.html). Como tal, muitas das interações podem não ser biologicamente significativas.

Levando em consideração o acima, você pode definir "proteínas que interagem" com mais precisão. Pode-se esperar que uma rede melhor organizada contendo apenas interações com uma função ou efeito conhecido possa fornecer uma imagem diferente. No entanto, usando uma rede de "interação funcional" humana construída de forma mais rígida publicada por Wu et al. (http://genomebiology.com/content/11/5/R53, FIs_043009.txt no arquivo adicional nº 3) ainda deu um resultado semelhante.

Método: fiz um script Python para calcular os comprimentos relativos da sequência de aminoácidos para todas as interações em uma rede de interação proteína-proteína humana (PIN) disponível na PINA ((http://cbg.garvan.unsw.edu.au/pina/ interactome.stat.do). O arquivo de rede está localizado em: http://cbg.garvan.unsw.edu.au/pina/download/Homo%20sapiens-20121210.sif. PINs para outros organismos também estão disponíveis no mesmo site e muitos outros lugares. O script pode ser usado com qualquer PIN no formato SIF usando identificadores UniProt.

O script pode ser baixado aqui: https://github.com/jarlemag/misc-bioinformatics/blob/master/ProteinInteractionNetwork.py

A parte mais demorada foi baixar os comprimentos de sequência do UniProt. Para evitar ter que fazer isso, os comprimentos da sequência da proteína podem ser salvos e carregados de um arquivo de texto. A lista de comprimentos de sequência de proteínas está aqui: https://github.com/jarlemag/misc-bioinformatics/blob/master/protlengths.txt Para criar a figura, coloque todos os três arquivos no mesmo diretório e execute o script usando Python 2.7 .

Lembre-se de que os dados do PIN podem não ser totalmente confiáveis.


Diferenças de comprimento entre proteínas que interagem fisicamente - Biologia

Durante e após a tradução, aminoácidos individuais podem ser modificados quimicamente, sequências de sinal podem ser anexadas e a nova proteína & # 8220 dobra & # 8221 em uma estrutura tridimensional distinta como resultado de interações intramoleculares. UMA sequência de sinal é uma cauda curta de aminoácidos que direciona uma proteína para um compartimento celular específico. Essas sequências na extremidade amino ou na extremidade carboxila da proteína podem ser consideradas como a proteína & # 8217s & # 8220 passagem do trem & # 8221 para seu destino final. Outros fatores celulares reconhecem cada sequência de sinal e ajudam a transportar a proteína do citoplasma para seu compartimento correto. Por exemplo, uma sequência específica no terminal amino irá direcionar uma proteína para a mitocôndria ou cloroplastos (em plantas). Uma vez que a proteína atinge seu destino celular, a sequência de sinal geralmente é cortada.

Muitas proteínas se dobram espontaneamente, mas algumas proteínas requerem moléculas auxiliares, chamadas chaperonas, para evitar que se agreguem durante o complicado processo de dobramento. Mesmo se uma proteína for especificada corretamente por seu mRNA correspondente, ela pode assumir uma forma completamente disfuncional se a temperatura anormal ou condições de pH impedirem que ela se dobre corretamente.


Síntese proteíca

A síntese de proteínas ocorre nos ribossomos e prossegue juntando o terminal carboxila do primeiro aminoácido ao terminal amino do próximo (Figura 2.19). O final da proteína que possui o grupo alfa-amino livre é referido como terminal amino ou terminal N. A outra extremidade é chamada de terminal carboxila ou terminal C, uma vez que contém o único grupo alfa-carboxila livre. Todos os outros grupos alfa-amino e alfa-carboxila estão ligados na formação de peptídeos. Figura 2.19 Ligação de aminoácidos através de ligações de formação de ligações peptídicas que unem aminoácidos adjacentes. As proteínas são sintetizadas começando com o terminal amino e terminando no terminal carboxila.

Figura 2.20 - Orientação cis vs trans de grupos R em torno da ligação peptídica Imagem de Aleia Kim

Esquematicamente, na Figura 2.18, podemos ver como os grupos R sequenciais de uma proteína são organizados em uma orientação alternada em cada lado da cadeia polipeptídica. A organização dos grupos R desta forma não é aleatória. O impedimento estérico pode ocorrer quando grupos R consecutivos são orientados no mesmo lado de uma estrutura de peptídeo (Figura 2.20)

Estrutura primária

A estrutura primária é o determinante final da conformação geral de uma proteína. A estrutura primária de qualquer proteína chegou ao seu estado atual como resultado de mutação e seleção ao longo do tempo evolutivo. A estrutura primária das proteínas é comandada pela sequência de DNA que as codifica no genoma. As regiões de proteínas que especificam o DNA são conhecidas como regiões codificadoras (ou genes).

As sequências de bases dessas regiões especificam diretamente a sequência de aminoácidos nas proteínas, com uma correspondência um a um entre os códons (grupos de três bases consecutivas) no DNA e os aminoácidos na proteína codificada. A sequência de códons no DNA, copiada para o RNA mensageiro, especifica uma sequência de aminoácidos em uma proteína. (Figura 2.21).

Figura 2.21 - Do RNA aos aminoácidos - o código genético Wikipedia

A ordem em que os aminoácidos são unidos na síntese de proteínas começa a definir um conjunto de interações entre os aminoácidos, mesmo quando a síntese está ocorrendo. Ou seja, um polipeptídeo pode dobrar mesmo enquanto está sendo feito. A ordem das estruturas do grupo R e as interações resultantes são muito importantes porque as interações iniciais afetam as interações posteriores. Isso ocorre porque as interações começam a estabelecer estruturas - secundárias e terciárias. Se uma estrutura helicoidal (estrutura secundária), por exemplo, começa a se formar, as possibilidades de interação de um grupo R de um determinado aminoácido podem ser diferentes do que se a hélice não tivesse se formado (Figura 2.22). As interações do grupo R também podem causar curvas em uma sequência polipeptídica (estrutura terciária) e essas curvas podem criar (em alguns casos) oportunidades para interações que não seriam possíveis sem a curvatura ou impedir (em outros casos) possibilidades de interação semelhantes.

Estrutura Secundária

À medida que a síntese de proteínas progride, as interações entre os aminoácidos próximos uns dos outros começam a ocorrer, dando origem a padrões locais chamados de estrutura secundária. Essas estruturas secundárias incluem as bem conhecidas hélice alfa e fitas beta. Ambos foram previstos por Linus Pauling, Robert Corey e Herman Branson em 1951. Cada estrutura tem características únicas.

Figura 2.22 - A hélice alfa. As ligações de hidrogênio (linhas pontilhadas) entre o oxigênio da carbonila e o hidrogênio da amina estabilizam a estrutura. Imagem de Aleia Kim

A hélice alfa possui uma estrutura em espiral, com 3,6 aminoácidos por volta da hélice (5 voltas helicoidais = 18 aminoácidos). As hélices são predominantemente destras - apenas em casos raros, como em sequências com muitas glicinas, podem formar-se alfa-hélices canhotas. Na hélice alfa, as ligações de hidrogênio se formam entre os grupos C = O e os grupos N-H na estrutura polipeptídica que estão a quatro aminoácidos de distância. Essas ligações de hidrogênio são as forças primárias que estabilizam a hélice alfa.

Figura 2.23 - & alfa-hélices em uma proteína com um domínio estrutural de zíper de leucina. As hélices alfa são mostradas em azul e verde e estão ligadas a uma dupla hélice de DNA em marrom.

Usamos os termos aumento, repetição e inclinação para descrever os parâmetros de qualquer hélice. A repetição é o número de resíduos em uma hélice antes de começar a se repetir. Para uma hélice alfa, a repetição é de 3,6 aminoácidos por volta da hélice. O aumento é a distância que a hélice eleva com a adição de cada resíduo. Para uma hélice alfa, isso é 0,15 nm por aminoácido. O passo é a distância entre as voltas completas da hélice. Para uma hélice alfa, isso é 0,54 nm. A estabilidade de uma hélice alfa é aumentada pela presença do aminoácido aspartato.

Figura 2.24 - escultura em hélice alfa do lado de fora de Linus Pauling e rsquos página inicial da infância Wikipedia Figura 2.25 - Representação da roda helicoidal de uma hélice alfa. O código genético de uma letra é usado. A hélice começa na Serina # 77 à direita e termina na lisina # 92 na parte inferior direita. Os aminoácidos hidrofóbicos são mostrados em amarelo e os aminoácidos ionizantes são mostrados em azul. Os aminoácidos hidrofóbicos tendem a interagir uns com os outros e não com os aminoácidos ionizantes. Wikipedia

& fita beta / folha

Figura 2.26 - fita & beta

Uma hélice é, obviamente, um objeto tridimensional. Uma forma achatada de hélice em duas dimensões é uma descrição comum para uma fita beta. Em vez de bobinas, os fios & beta têm curvas e às vezes são chamadas de pregas, como as pregas de uma cortina. & beta-strands podem ser organizados para formar estruturas elaboradamente organizadas, como folhas, barris e outros arranjos.

Estruturas de alta ordem e de fita beta são algumas vezes chamadas de estruturas supersecundárias, uma vez que envolvem interações entre aminoácidos não próximos na sequência primária. Essas estruturas também são estabilizadas por ligações de hidrogênio entre átomos de oxigênio carbonil e hidrogênios de grupos amina na estrutura polipeptídica (Figura 2.28). Em uma estrutura de ordem superior, os fios podem ser dispostos paralelos (orientações de amino para carboxil iguais) ou antiparalelas (orientações de amino para carboxil opostas entre si (na Figura 2.27, a direção do fio é mostrada pela ponta de seta na fita diagramas).

Figura 2.27 - Representações da fita de arranjos supersecundários e beta-folhas (A-D) e alfa-hélice (E-F) Imagem de Aleia Kim

As voltas (às vezes chamadas de voltas reversas) são um tipo de estrutura secundária que, como o nome sugere, causa uma volta na estrutura de uma cadeia polipeptídica. Em última análise, as curvas dão origem à estrutura terciária, causando interrupções nas estruturas secundárias (alfa-hélices e fitas beta) e freqüentemente servem como regiões de conexão entre duas regiões da estrutura secundária em uma proteína. A prolina e a glicina desempenham papéis comuns nas curvas, proporcionando menos flexibilidade (iniciar a curva) e maior flexibilidade (facilitar a curva), respectivamente.

Figura 2.28 - Componentes de uma folha beta em um arranjo paralelo. Ligações H em amarelo. Imagem de Aleia Kim

Existem pelo menos cinco tipos de curvas, com inúmeras variações de cada um dando origem a muitas curvas diferentes. Os cinco tipos de voltas são

& bull & delta-turn - aminoácidos finais são separados por uma ligação peptídica

e voltas de touro e gama - separação por duas ligações peptídicas

& bull & beta-turn - separação por três ligações peptídicas

& bull & alpha-turn - separação por quatro ligações peptídicas

& bull & pi-turn - separação por cinco ligações

Destas, as voltas & beta são a forma mais comum e as voltas & delta são teóricas, mas improváveis, devido às limitações estéricas. A Figura 2.29 mostra uma curva & beta.

310 hélices

Figura 2.29 - curva e beta. Os grupos R são mostrados em laranja, os hidrogênios em amarelo, os carbonos no carvão, os nitrogênios em roxo e os oxigênio em verde. Uma ligação de hidrogênio estabilizada é indicada com a linha pontilhada. Imagem de Aleia Kim

Além da hélice alfa, das fitas beta e de várias voltas, outras estruturas regulares e repetitivas são vistas nas proteínas, mas ocorrem com muito menos frequência. Os 310 hélice é a quarta estrutura secundária mais abundante em proteínas, constituindo cerca de 10-15% de todas as hélices. A hélice deriva seu nome do fato de conter 10 aminoácidos em 3 voltas. É destro. As ligações de hidrogênio se formam entre os aminoácidos que estão separados por três resíduos. Mais comumente, o 310 a hélice aparece na extremidade amina ou carboxila de uma hélice alfa. Como a & alfa-hélice, o 310 a hélice é estabilizada pela presença de aspartato em sua sequência.

Figura 2.30 - Vista superior de uma 310 Helix. Os grupos carbonil estão em vermelho e apontados para cima. Observe a quase perfeita simetria tripla da Wikipedia Figura 2.31 - Ressonância da ligação peptídica Wikipedia Figura 2.32 - & pi hélice Wikipedia

Figura 2.33 - Planos (azul claro) definidos pelo caráter de ligação dupla da ligação peptídica Imagem de Aleia Kim

Uma hélice & pi pode ser considerada um tipo especial de hélice & alfa. Algumas fontes o descrevem como uma hélice alfa com um aminoácido extra preso no meio (Figura 2.32). As hélices & pi não são exatamente raras, ocorrendo pelo menos uma vez em até 15% de todas as proteínas. Como a hélice & alfa, a hélice & pi é destra, mas onde a hélice & alfa tem 18 aminoácidos em 5 voltas, a hélice & pi tem 22 aminoácidos em 5 voltas. As hélices & pi normalmente não se estendem por distâncias muito longas. A maioria tem apenas cerca de 7 aminoácidos de comprimento e a sequência quase sempre ocorre no meio de uma região alfa-helicoidal.

Ramachandran plotagens

Figura 2.34 - ângulos de rotação & omega, & psi e & phi em um peptídeo Imagem de Aleia Kim

Em 1963, G.N. Ramachandran, C. Ramakrishnan e V. Sasisekharan descreveram uma nova maneira de descrever a estrutura da proteína. Se considerarmos a espinha dorsal de uma cadeia polipeptídica, ela consiste em um conjunto repetitivo de três ligações. Sequencialmente (na direção amino para carboxila) eles são 1) uma ligação rotativa (& psi) entre & alfa-carbono e & alfa-carboxil precedendo a ligação peptídica (veja AQUI), 2) uma ligação peptídica não rotativa (& ômega) entre & alfa -carboxil e & alfa-amina), e 3) uma ligação rotativa (& phi) entre a & alfa-amina e & alfa-carbono após a ligação peptídica (veja AQUI). Observe nas Figuras 2.33 e 2.34 que a direção de amino para carboxil é da direita para a esquerda.

A presença do oxigênio carbonila no grupo alfa-carboxila permite que a ligação peptídica exista como uma estrutura ressonante, o que significa que ela se comporta algumas vezes como uma ligação dupla. As ligações duplas não podem, é claro, girar, mas as ligações de cada lado dele têm alguma liberdade de rotação. Os ângulos & phi e & psi são restritos a certos valores, porque alguns ângulos resultarão em impedimento estérico. Além disso, cada tipo de estrutura secundária possui uma faixa de valores característicos para & phi e & psi.

Figura 2.35 - Gráfico teórico de Ramachandran Imagem de Penelope Irving

Ramachandran e colegas fizeram cálculos teóricos da estabilidade energética de todos os ângulos possíveis de 0 & deg a 360 & deg para cada um dos ângulos & phi e & psi e plotaram os resultados em um gráfico de Ramachandran (também chamado de gráfico & phi- & psi), delineando regiões de ângulos que foram teoricamente, o mais estável (Figura 2.35).

Três regiões primárias de estabilidade foram identificadas, correspondendo aos ângulos & phi & psi das cadeias & beta (canto superior esquerdo), alfa-hélices destras (canto inferior esquerdo) e alfa-hélices canhotas (canto superior direito). Os gráficos de estabilidade prevista são notavelmente precisos quando comparados aos ângulos & phi & psi de proteínas reais.

Previsão de estrutura secundária

Tabela 2.3 - Tendências relativas de cada aminoácido para estar em uma estrutura secundária. Valores mais altos indicam tendência maior Imagem de Penelope Irving

Ao comparar a estrutura primária (sequências de aminoácidos) com estruturas conhecidas de proteínas 3D, pode-se calcular cada vez que um aminoácido é encontrado em uma hélice alfa, fita beta / folha ou uma volta. A análise por computador de milhares dessas sequências permite atribuir a probabilidade de qualquer aminoácido aparecer em cada uma dessas estruturas. Usando essas tendências, pode-se, com até 80% de precisão, prever regiões de estrutura secundária em uma proteína com base apenas na sequência de aminoácidos.

Isso é visto na Tabela 2.3. A ocorrência na sequência primária de três aminoácidos consecutivos com tendências relativas superiores a um é um indicador de que aquela região do polipeptídeo está na estrutura secundária correspondente. Um recurso online para prever estruturas secundárias chamado PSIPRED está disponível AQUI.

Hidrofobicidade

Tabela 2.4 - Pontuações de hidropatia

A química dos grupos R de aminoácidos afeta as estruturas em que são mais comumente encontrados. Subconjuntos de suas propriedades químicas podem fornecer pistas sobre a estrutura e, às vezes, a localização celular. Um excelente exemplo é a hidrofobicidade (tendências para evitar água) de alguns Rgroups. Dado o ambiente aquoso da célula, não é provável que tais grupos R estejam na superfície externa de uma proteína dobrada.

No entanto, esta regra não se aplica a regiões de proteínas que podem estar incorporadas nas bicamadas lipídicas das membranas celulares / organelas. Isso ocorre porque a região de tais proteínas que formam os domínios transmembrana estão enterrados no ambiente hidrofóbico no meio da bicamada lipídica.

Não surpreendentemente, a varredura de sequências primárias para trechos de aminoácidos hidrofóbicos de tamanho / espaçamento específico pode ajudar a identificar proteínas encontradas nas membranas. A Tabela 2.4 mostra os valores de hidrofobicidade para grupos R dos aminoácidos. Neste conjunto, a escala vai de valores positivos (hidrofóbicos) a valores negativos (hidrofílicos). Um gráfico de hidropatia KyteDoolittle para a proteína de membrana do protooncogene RET é mostrado na Figura 2.36. Duas regiões da proteína são muito hidrofóbicas, como pode ser visto nos picos próximos aos aminoácidos 5-10 e 630-640. Pode-se razoavelmente esperar que tais regiões estejam situadas no interior da proteína dobrada ou que façam parte dos domínios transmembranares.

Bobinas aleatórias

Figura 2.36 Gráfico de hidropatia Kyte-Doolittle para o protooncogene RET Wikipedia

Algumas seções de uma proteína não assumem nenhuma estrutura regular e discernível e, às vezes, diz-se que não têm estrutura secundária, embora possam ter ligações de hidrogênio. Tais segmentos são descritos como sendo em bobinas aleatórias e podem ter fluidez em sua estrutura que resulta em eles terem múltiplas formas estáveis.Bobinas aleatórias são identificáveis ​​com métodos espectroscópicos, como dicroísmo circular Wikipedia e ressonância magnética nuclear (NMR) em que sinais distintos são observados. Veja também proteínas metamórficas (AQUI) e proteínas intrinsecamente desordenadas (AQUI).

Figura 2.37 - Representação da fita de um grampo de cabelo & beta. São mostradas duas fitas & beta em turquesa interagindo entre si.

Estrutura supersecundária

Outro elemento da estrutura da proteína é mais difícil de categorizar porque incorpora elementos de estrutura secundária e terciária. Chamada de estrutura supersecundária (ou motivos estruturais), essas estruturas contêm vários componentes da estrutura secundária próximos, organizados de uma maneira específica e que aparecem em várias proteínas. Uma vez que existem muitas maneiras de fazer estruturas secundárias a partir de diferentes estruturas primárias, também podem surgir motivos semelhantes de diferentes sequências primárias. Um exemplo de motivo estrutural é mostrado na Figura 2.37.

Estrutura terciária

Figura 2.38 - Dobramento de uma cadeia polipeptídica

As proteínas são diferenciadas umas das outras pela sequência de aminoácidos que as compõem. A sequência de aminoácidos de uma proteína determina a forma da proteína, uma vez que as propriedades químicas de cada aminoácido são forças que dão origem a interações intermoleculares para começar a criar estruturas secundárias, como hélices alfa e fitas beta. A sequência também define voltas e bobinas aleatórias que desempenham papéis importantes no processo de dobramento de proteínas.

Como a forma é essencial para a função da proteína, a sequência de aminoácidos dá origem a todas as propriedades de uma proteína. À medida que a síntese de proteínas prossegue, os componentes individuais da estrutura secundária começam a interagir uns com os outros, dando origem a dobras que aproximam os aminoácidos que não estão próximos uns dos outros na estrutura primária (Figura 2.38). No nível terciário da estrutura, as interações entre os grupos R dos aminoácidos na proteína, bem como entre a estrutura polipeptídica e os grupos laterais dos aminoácidos desempenham um papel no dobramento.

Proteínas globulares

Figura 2.39 - Desdobramento (desnaturação) de uma proteína Wikipedia

O dobramento dá origem a formas 3-D distintas em proteínas que não são fibrosas. Essas proteínas são chamadas de globulares. Uma proteína globular é estabilizada pelas mesmas forças que impulsionam sua formação. Isso inclui interações iônicas, ligações de hidrogênio, forças hidrofóbicas, ligações iônicas, ligações dissulfeto e ligações metálicas. Tratamentos como calor, mudanças de pH, detergentes, ureia e mercaptoetanol superam as forças estabilizadoras e fazem com que uma proteína se desdobre, perdendo sua estrutura e (geralmente) sua função (Figura 2.39). A capacidade do calor e dos detergentes de desnaturar as proteínas é o motivo pelo qual cozinhamos nossos alimentos e lavamos as mãos antes de comer - esses tratamentos desnaturam as proteínas dos microrganismos em nossas mãos. Organismos que vivem em ambientes de alta temperatura (acima de 50 e degC) têm proteínas com mudanças nas forças estabilizadoras - ligações de hidrogênio adicionais, pontes de sal adicionais (interações iônicas) e compactação podem desempenhar papéis em impedir que essas proteínas se desdobrem.

Forças de estabilização de proteínas

Antes de considerar o processo de dobramento, vamos considerar algumas das forças que ajudam a estabilizar as proteínas.

Ligações de hidrogênio

Figura 2.40 - Ligações de hidrogênio (linhas pontilhadas) entre duas moléculas de ácido acético

As ligações de hidrogênio surgem como resultado de hidrogênios parcialmente carregados encontrados nas ligações covalentes. Isso ocorre quando o átomo ao qual o hidrogênio está ligado tem uma eletronegatividade maior do que o próprio hidrogênio, resultando em hidrogênio com carga parcial positiva porque não é capaz de manter os elétrons perto de si (Figura 2.40).

O hidrogênio parcialmente carregado dessa forma é atraído por átomos, como o oxigênio e o nitrogênio, que possuem cargas negativas parciais, devido a terem maiores eletronegatividades e, portanto, manter os elétrons mais próximos de si. Os hidrogênios parcialmente carregados positivamente são chamados de doadores, enquanto os átomos parcialmente negativos pelos quais eles são atraídos são chamados de aceitadores. (Veja a Figura 1.30).

Figura 2.41 - Ligação de hidrogênio em água líquida Wikipedia

As ligações de hidrogênio individuais são muito mais fracas do que uma ligação covalente, mas, coletivamente, podem exercer forças fortes. Considere a água líquida, que contém um número enorme de ligações de hidrogênio (Figura 2.41). Essas forças ajudam a água a permanecer líquida em temperatura ambiente. Outras moléculas sem ligações de hidrogênio de peso molecular igual ou maior do que a água, como metano ou dióxido de carbono, são gases à mesma temperatura. Assim, as interações intermoleculares entre as moléculas de água ajudam a "manter" a água unida e a permanecer líquida. Notavelmente, somente elevando a temperatura da água à ebulição as forças da ligação de hidrogênio são superadas, permitindo que a água se torne totalmente gasosa.

As ligações de hidrogênio são forças importantes em biopolímeros que incluem DNA, proteínas e celulose. Todos esses polímeros perdem suas estruturas nativas com a fervura. As ligações de hidrogênio entre aminoácidos próximos uns dos outros na estrutura primária podem dar origem a estruturas repetidas regulares, como hélices ou pregas, nas proteínas (estrutura secundária).

Interações iônicas

As interações iônicas são forças importantes que estabilizam a estrutura da proteína que surgem da ionização de grupos R nos aminoácidos que constituem uma proteína. Estes incluem os carboxilaminoácidos (AQUI), os aminoácidos amina, bem como o sulfidril da cisteína e às vezes o hidroxil da tirosina.

Forças hidrofóbicas

As forças hidrofóbicas estabilizam a estrutura da proteína como resultado de interações que favorecem a exclusão de água. Os aminoácidos não polares (comumente encontrados no interior das proteínas) favorecem a associação entre si e isso tem o efeito de excluir a água. A água excluída tem uma entropia mais alta do que a água interagindo com as cadeias laterais hidrofóbicas. Isso ocorre porque a água se alinha muito regularmente e em um padrão distinto ao interagir com moléculas hidrofóbicas.

Quando a água é impedida de ter esse tipo de interação, ela é muito mais desordenada do que se pudesse se associar às regiões hidrofóbicas. É em parte por essa razão que os aminoácidos hidrofóbicos são encontrados no interior das proteínas - portanto, eles podem excluir a água e aumentar a entropia.

Ligações dissulfureto

Figura 2.42 - Formação de uma ligação dissulfeto

As ligações dissulfeto, que são feitas quando duas cadeias laterais de sulfidrila de cisteína são colocadas em proximidade, unem-se covalentemente a diferentes regiões de proteína e podem dar grande força à estrutura geral (Figuras 2.42 e 2.43). Uma Ode à Estrutura da Proteína por Kevin Ahern Os vinte pequenos amino A's Definem uma proteína de várias maneiras Sua ordem em uma cadeia de peptídeo Determina as formas que as proteínas ganham acontece quando uma proteína se dobra Mas as cadeias dobradas são totalmente assustadoras Quando colocadas juntas São as maravilhas da natureza, com certeza Criando problemas, fazendo curas Um tolo pode fazer poemas de peptídeo Mas as proteínas vêm de ribossomos. cistina. As ligações dissulfeto são as forças mais fortes que estabilizam a estrutura da proteína.

Figura 2.43 - Cistina - Duas cisteínas unidas por uma ligação dissulfeto

forças de van der Waals

Forças de van der Waals é um termo usado para descrever várias interações fracas, incluindo aquelas causadas pela atração entre uma molécula polar e um dipolo transiente, ou entre dois dipolos temporários. As forças de van der Waals são dinâmicas devido à natureza flutuante da atração e geralmente são fracas em comparação com ligações covalentes, mas podem, em distâncias muito curtas, ser significativas.

Modificações pós-traducionais

As modificações pós-tradução podem resultar na formação de proteínas de estabilização de ligações covalentes também. A hidroxilação de lisina e prolina em filamentos de colágeno pode resultar na reticulação desses grupos e as ligações covalentes resultantes ajudam a fortalecer e estabilizar o colágeno.

Modelos dobráveis

Dois modelos populares de dobramento de proteínas estão atualmente sob investigação. No primeiro (modelo de colisão de difusão), um evento de nucleação inicia o processo, seguido pela formação da estrutura secundária. Colisões entre as estruturas secundárias (como no grampo & beta na Figura 2.37) permitem que o dobramento comece. Em contraste, no modelo de nucleação-condensação, as estruturas secundária e terciária se formam juntas.

O dobramento nas proteínas ocorre com bastante rapidez (0,1 a 1000 segundos) e pode ocorrer durante a síntese - o terminal amino de uma proteína pode começar a se dobrar antes mesmo do terminal carboxila ser feito, embora nem sempre seja esse o caso.

Processo de dobragem

Figura 2.44 Modelo de energia do funil de dobramento da Wikipedia dobrável

O enovelamento de proteínas é hipotetizado para ocorrer em uma paisagem de energia de & ldquofolding & rdquo em que um estado nativo de proteína dobrada corresponde à energia livre mínima possível nas condições do meio (geralmente solvente aquoso) em que a proteína é dissolvida. Como visto no diagrama (Figura 2.44), o funil de energia tem vários mínimos locais (quedas) nos quais uma proteína em dobramento pode ficar presa à medida que se move para baixo no gráfico de energia. Outros fatores, como temperatura, campos elétricos / magnéticos e considerações espaciais provavelmente desempenham papéis.

Se as forças externas afetam os mínimos de energia local durante o dobramento, o processo e o produto final podem ser influenciados. Assim como a velocidade de um carro descendo uma estrada afetará a segurança da viagem, também as considerações de energia influenciam e orientam o processo de dobramento, resultando em proteínas totalmente funcionais e devidamente dobradas em alguns casos, e mal dobradas em outros.

Ficar preso

Conforme o processo de dobramento prossegue em direção a um mínimo de energia (parte inferior do funil na Figura 2.44), uma proteína pode obter & ldquostuck & rdquo em qualquer um dos mínimos locais e não atingir o estado final dobrado. Embora o estado dobrado seja, em geral, mais organizado e, portanto, tenha entropia reduzida do que o estado desdobrado, existem duas forças que superam a diminuição da entropia e impulsionam o processo.

O primeiro é a magnitude da diminuição da energia, conforme mostrado no gráfico. Como & DeltaG = & DeltaH -T & DeltaS, uma diminuição em & DeltaH pode superar um & DeltaS negativo para tornar & DeltaG negativo e empurrar o processo de dobra para frente. Condições de energia favoráveis ​​(diminuídas) surgem com a formação de ligações iônicas, ligações de hidrogênio, ligações dissulfeto e ligações metálicas durante o processo de dobramento. Além disso, o efeito hidrofóbico aumenta a entropia, permitindo que os aminoácidos hidrofóbicos no interior de uma proteína dobrada excluam a água, contrariando assim o impacto da ordenação da estrutura da proteína, tornando o & DeltaS menos negativo.

Previsão de estrutura

Os programas de computador são muito bons em prever a estrutura secundária apenas com base na sequência de aminoácidos, mas têm dificuldade em determinar a estrutura terciária usando as mesmas informações. Isto é parcialmente devido ao fato de que as estruturas secundárias têm pontos repetidos de estabilização com base na geometria e qualquer estrutura secundária regular (por exemplo, & alfa-hélice) varia muito pouco de uma para outra. As estruturas dobradas, entretanto, têm um número enorme de estruturas possíveis, como mostrado pelo Paradoxo de Levinthal & rsquos.

Espectroscopia

Devido à nossa incapacidade de prever com precisão a estrutura terciária com base na sequência de aminoácidos, as estruturas das proteínas são, na verdade, determinadas usando técnicas de espectroscopia. Nessas abordagens, as proteínas são submetidas a formas variadas de radiação eletromagnética e as formas como elas interagem com a radiação permitem que os pesquisadores determinem as coordenadas atômicas na resolução Angstrom das densidades de elétrons (veja cristalografia de raios-X) e como os núcleos interagem (veja NMR).

Paradoxo de Levinthal e rsquos

No final da década de 1960, Cyrus Levinthal descreveu a magnitude da complexidade do problema de dobramento de proteínas. Ele apontou que, para uma proteína com 100 aminoácidos, ela teria 99 ligações peptídicas e 198 considerações para ângulos & phi e & psi. Se cada um deles tivesse apenas três conformações, isso resultaria em 3198 diferentes dobras possíveis ou 2,95x1094.

Mesmo permitindo uma quantidade de tempo razoável (um nanossegundo) para cada dobra possível ocorrer, levaria mais tempo do que a idade do universo para amostrar todas elas, o que significa claramente que o processo de dobramento não está ocorrendo por uma amostragem aleatória sequencial e que as tentativas de determinar a estrutura da proteína por amostragem aleatória estavam fadadas ao fracasso. Levinthal, portanto, propôs que o dobramento ocorre por um processo sequencial que começa com um evento de nucleação que guia o processo rapidamente e não é diferente do processo de funil ilustrado na Figura 2.44.

Doenças do dobramento incorreto de proteínas

Figura 2.45 - Enrolamento incorreto da proteína PRPc normal induzida por PRPsc Imagem de Penelope Irving

O dobramento adequado das proteínas é essencial para sua função. Segue-se então que o dobramento incorreto de proteínas (também chamado de proteopatia) pode ter consequências. Em alguns casos, isso pode simplesmente resultar em uma proteína inativa. O enovelamento incorreto da proteína também desempenha um papel em várias doenças, como a doença da vaca louca, Alzheimer, doença de Parkinson e rsquos e doença de CreutzfeldJakob. Muitas doenças, mas não todas, afetam o tecido cerebral.

Figura 2.46 - Vacas com doença da vaca louca perdem a capacidade de ficar em pé

Depósitos insolúveis

As proteínas mal dobradas geralmente formam agregados chamados amiloides, que são prejudiciais aos tecidos que os contêm, pois mudam de solúveis para insolúveis em água e formam depósitos. O processo pelo qual ocorre o dobramento incorreto (Figura 2.45) não é completamente claro, mas em muitos casos, foi demonstrado que uma proteína & ldquoseed & rdquo que está dobrada incorretamente pode induzir o mesmo dobramento incorreto em outras cópias da mesma proteína. Essas proteínas de sementes são conhecidas como príons e agem como agentes infecciosos, resultando na disseminação de doenças. A lista de doenças humanas relacionadas ao dobramento incorreto de proteínas é longa e continua a crescer. Um link da Wikipedia está AQUI.

Figura 2.47 - Amiloidose difusa em um vaso sanguíneo (pontos vermelhos) Wikipedia

Os príons são partículas de proteínas infecciosas que causam encefalopatias espongiformes transmissíveis (EET), das quais a mais conhecida é a doença da vaca louca. Outras manifestações incluem doença, scrapie, em ovelhas e doenças humanas, como doença de CreutzfeldtJakob (CJD), Insônia familiar fatal e kuru. A proteína envolvida nessas doenças é uma proteína de membrana chamada PrP. O PrP é codificado no genoma de muitos organismos e é encontrado na maioria das células do corpo. PrPc é o nome dado à estrutura do PrP que é normal e não está associada a doenças. PrPSc é o nome dado a uma forma mal dobrada da mesma proteína, que está associada ao desenvolvimento dos sintomas da doença (Figura 2.45).

O PrPSc mal dobrado está associado às doenças TSE e atua como uma partícula infecciosa. Uma terceira forma de PrP, chamada PrPres, pode ser encontrada nas EET, mas não é infecciosa. O & lsquores & rsquo de PrPres indica que é resistente à protease. É importante notar que todas as três formas de PrP têm a mesma sequência de aminoácidos e diferem umas das outras apenas na forma como as cadeias polipeptídicas são dobradas. A forma mais perigosamente mal dobrada do PrP é o PrPSc, devido à sua capacidade de agir como um agente infeccioso - uma proteína de semente que pode induzir o mal dobrado do PrPc, convertendo-o em PrPSc.

Figura 2.48 - Um modelo de propagação de príons Wikipedia

A função de PrPc é desconhecida. Os camundongos sem o gene PrP não apresentam grandes anormalidades. Eles parecem apresentar problemas com a memória de longo prazo, sugerindo uma função para PrPc. Stanley Prusiner, que descobriu os príons e cunhou o termo, recebeu o Prêmio Nobel de Medicina em 1997 por seu trabalho. Eu acho que se por acaso eu estivesse em uma proteína A formando um príon, eu poderia torcer e, pelo amor de Deus, pare de cometer erros de dobra

Amilóides são uma coleção de agregados de proteínas incorretamente dobrados que são encontrados no corpo humano. Como consequência de seu dobramento incorreto, são insolúveis e contribuem para cerca de vinte doenças humanas, incluindo doenças neurológicas importantes que envolvem príons. As doenças incluem (proteína afetada entre parênteses) - doença de Alzheimer e rsquos (amiloide e beta), doença de Parkinson e rsquos (alfa-sinucleína), doença de Huntington e rsquos (huntingtina), artrite reumatóide (amilóide sérica A), insônia familiar fatal (PrPSc) e outras.

A sequência de aminoácidos desempenha um papel na amiloidogênese. Polipeptídeos ricos em glutamina são comuns em leveduras e príons humanos. As repetições de trinucleotídeos são importantes na doença de Huntington e rsquos. Onde a sequência não é um fator, a associação hidrofóbica entre as folhas & beta pode desempenhar um papel.

Figura 2.49 - Huntingtin

Amilóide e beta referem-se a coleções de pequenas proteínas (36-43 aminoácidos) que parecem desempenhar um papel na doença de Alzheimer e rsquos. (A proteína tau é o outro fator.) Eles são, na verdade, os principais componentes das placas amilóides encontradas nos cérebros de pacientes que sofrem da doença e surgem da clivagem proteolítica de uma glicoproteína precursora amilóide maior chamada Proteína Precursora Amilóide, uma membrana integral proteína de células nervosas cuja função é desconhecida. Duas proteases, & beta-secretase e & gama-secretase, desempenham esta função. Proteínas amilóide e beta são incorretamente dobradas e parecem induzir outras proteínas a se dobrarem incorretamente e, assim, precipitar e formar a característica amilóide da doença. As placas são tóxicas para as células nervosas e dão origem à demência característica da doença.

Pensa-se que a agregação de proteínas amilóide e beta durante o dobramento incorreto leva à geração de espécies reativas de oxigênio e que este é o meio pelo qual os neurônios são danificados. Não se sabe qual é a função real da amilóide e beta. Mutações autossômicas dominantes na proteína levam ao início precoce da doença, mas isso ocorre em não mais do que 10% dos casos. As estratégias para o tratamento da doença incluem a inibição das secretases que geram os fragmentos de peptídeo da proteína precursora amilóide.

Huntingtina é o gene central na doença de Huntington e rsquos. A proteína produzida a partir dele é rica em glutamina, com 6-35 desses resíduos em sua forma selvagem. Na doença de Huntington e rsquos, esse gene sofre mutação, aumentando o número de glutaminas na proteína mutante para entre 36 e 250. O tamanho da proteína varia com o número de glutaminas na proteína mutante, mas a proteína do tipo selvagem tem mais de 3100 aminoácidos. ácidos e um peso molecular de cerca de 350.000 Da. Sua função precisa não é conhecida, mas a huntingtina é encontrada nas células nervosas, com o nível mais alto no cérebro. Acredita-se que possivelmente desempenhe papéis no transporte, sinalização e proteção contra apoptose. A Huntingtina também é necessária para o desenvolvimento embrionário inicial. Dentro da célula, a huntingtina encontra-se localizada principalmente nos microtúbulos e vesículas.

Repetição de trinucleotídeo

O gene da huntingtina contém muitas cópias da sequência CAG (denominadas repetições de trinucleótidos), que codificam as muitas glutaminas da proteína. A doença de Huntington e rsquos surge quando cópias extras da sequência CAG são geradas quando o DNA do gene está sendo copiado. A expansão de sequências repetidas pode ocorrer devido ao deslizamento da polimerase em relação ao molde de DNA durante a replicação. Como resultado, várias cópias adicionais da repetição de trinucleotídeos podem ser feitas, resultando em proteínas com números variáveis ​​de resíduos de glutamina. Até 35 repetições podem ser toleradas sem problemas. O número de repetições pode se expandir ao longo da vida de uma pessoa, entretanto, pelo mesmo mecanismo. Indivíduos com 36-40 repetições começam a apresentar sinais da doença e se houver mais de 40, a doença estará presente.

Chaperones moleculares

A importância do dobramento adequado das proteínas é destacada pelas doenças associadas às proteínas mal dobradas, portanto, não é surpresa, então, que as células gastem energia para facilitar o dobramento adequado das proteínas. As células usam duas classes de proteínas conhecidas como chaperones moleculares, para facilitar esse dobramento nas células. Os chaperones moleculares são de dois tipos, os chaperones e os chaperonins. Um exemplo da primeira categoria é a classe de proteínas Hsp70. Hsp significa "proteína de choque de calor", com base no fato de que essas proteínas foram observadas pela primeira vez em grandes quantidades em células que foram brevemente submetidas a altas temperaturas. Hsps funcionam para ajudar as células em estresses decorrentes de choque térmico e exposição a condições oxidantes ou metais pesados ​​tóxicos, como cádmio e mercúrio. No entanto, eles também desempenham um papel importante em condições normais, onde auxiliam no dobramento adequado dos polipeptídeos, evitando interações aberrantes que podem levar ao dobramento incorreto ou agregação. As proteínas Hsp70 são encontradas em quase todas as células e usam a hidrólise do ATP para estimular mudanças estruturais na forma da chaperona para acomodar a ligação das proteínas do substrato. O domínio de ligação de Hsp70s contém uma estrutura de barril beta que envolve a cadeia polipeptídica do substrato e tem afinidade para cadeias laterais hidrofóbicas de aminoácidos. Conforme mostrado na Figura 2.50, Hsp70 liga-se a polipeptídeos à medida que emergem dos ribossomos durante a síntese de proteínas. A ligação do substrato estimula a hidrólise do ATP e isso é facilitado por outra proteína de choque térmico conhecida como Hsp40. A hidrólise do ATP faz com que a Hsp70 assuma uma conformação fechada que ajuda a proteger os resíduos hidrofóbicos expostos e a prevenir a agregação ou dobramento local incorreto.

Após a síntese da proteína estar completa, o ADP é liberado e substituído por ATP e isso resulta na liberação da proteína substrato, que então permite que o polipeptídeo de comprimento total se dobre corretamente.

Figura 2.50 - Ação da Hsp70 (azul) para facilitar o dobramento adequado de uma proteína (laranja) Imagem de Aleia Kim

Em choque térmico

Em tempos de choque térmico ou estresse oxidativo, as proteínas Hsp70 ligam-se às regiões hidrofóbicas desdobradas das proteínas para prevenir a agregação delas e permitir que se redobrem adequadamente. Quando as proteínas são danificadas, a Hsp70 recruta enzimas que ubiquitinam a proteína danificada para direcioná-la para a destruição em proteassomas. Assim, as proteínas Hsp70 desempenham um papel importante em garantir não apenas que as proteínas sejam devidamente dobradas, mas que as proteínas danificadas ou não funcionais sejam removidas por degradação no proteassoma.

Chaperoninas

Uma segunda classe de proteínas envolvidas em ajudar outras proteínas a se dobrarem adequadamente são conhecidas como chaperoninas. Existem duas categorias principais de chaperoninas - Classe I (encontrada em bactérias, cloroplastos e mitocôndrias) e Classe II (encontrada no citosol de eucariotos e arqueobactérias). As chaperoninas mais bem estudadas são as proteínas do complexo GroEL / GroES encontradas nas bactérias (Figura 2.51).

Figura 2.51 - Vista da parte inferior do GroEL (esquerda) e do complexo GroEL / GroES (direita) Wikipedia

GroEL / GroES pode não ser capaz de desfazer proteínas agregadas, mas ao facilitar o dobramento adequado, ele fornece competição para o dobramento incorreto como um processo e pode reduzir ou eliminar problemas decorrentes do dobramento impróprio. GroEL é um 14mer de anel duplo com uma região hidrofóbica que pode facilitar o dobramento de substratos de 15-60 kDa de tamanho. GroES é um heptâmero único que se liga a GroEL na presença de ATP e funciona como uma cobertura sobre GroEL. A hidrólise do ATP pelas chaperoninas induz grandes mudanças conformacionais que afetam a ligação das proteínas do substrato e seu enovelamento. Não se sabe exatamente como as chaperoninas dobram as proteínas. Os modelos passivos postulam o funcionamento inerte do complexo da chaperonina evitando interações intermoleculares desfavoráveis ​​ou colocando restrições nos espaços disponíveis para que ocorra o dobramento. Modelos ativos propõem que mudanças estruturais no complexo da chaperonina induzem mudanças estruturais na proteína substrato.

Quebra de proteína

Figura 2.52 - Proteassoma 26S. Site ativo mostrado na Wikipédia em vermelho

Outro complexo de proteínas que tem uma função importante na dinâmica da vida das proteínas é o proteassoma (Figura 2.52). Os proteassomas, que são encontrados em todos os eucariotos e arqueanos, bem como em algumas bactérias, funcionam para quebrar proteínas desnecessárias ou danificadas por degradação proteolítica. Os proteassomas ajudam a regular a concentração de algumas proteínas e degradam aquelas que estão mal dobradas. A via de degradação proteassomal desempenha um papel importante nos processos celulares que incluem a progressão ao longo do ciclo celular, a modulação da expressão gênica e a resposta ao estresse oxidativo.

A degradação no proteassoma produz peptídeos curtos de sete a oito aminoácidos de comprimento. As proteases da treonina desempenham papéis importantes. A quebra desses peptídeos produz aminoácidos individuais, facilitando assim sua reciclagem nas células. As proteínas são direcionadas para degradação em proteassomas eucarióticos por ligação a múltiplas cópias de uma pequena proteína chamada ubiquitina (8,5 kDa - 76 aminoácidos). A enzima que catalisa a reação é conhecida como ubiquitina ligase. A cadeia de poliubiquitina resultante é ligada pelo proteassoma e a degradação começa. Ubiquitina foi nomeada devido ao fato de ser ubiquamente encontrada em células eucarióticas.

Figura 2.53 - Ubiquitina (cadeias laterais de lisina mostradas em amarelo) Wikipedia

Ubiquitina (Figura 2.53) é uma pequena proteína multifuncional (8,5 kDa) encontrada em células eucarióticas. É comumente adicionado às proteínas alvo pela ação das enzimas ubiquitina ligase (E3 na Figura 2.54). Uma (ubiquitinação) ou muitas moléculas de ubiquitina (poliubiquitinação) podem ser adicionadas. A ligação da ubiquitina é feita através da cadeia lateral de um dos sete resíduos de lisina diferentes na ubiquitina.

A adição de ubiquitina às proteínas tem muitos efeitos, o mais conhecido deles é direcionar a proteína para degradação no proteassoma. O direcionamento proteassomal é observado quando a poliubiquitinação ocorre nas lisinas # 29 e 48. A polubiquitinação ou monoubiquitinação em outras lisinas pode resultar em localização celular alterada e interações proteína-proteína alteradas. Este último pode afetar a inflamação, o tráfego endocítico, a tradução e o reparo do DNA.

Figura 2.54 - Caminho para ubiquitinação de uma proteína substrato alvo Imagem de Pehr Jacobson

Mau funcionamento da ubiquitina ligase

Parkin é uma proteína relacionada à doença de Parkinson e rsquos que, quando mutada, está ligada a uma forma hereditária da doença chamada doença de Parkinson e rsquos juvenil autossômica recessiva. A função da proteína não é conhecida, mas é um componente do sistema E3 ubiquitina ligase responsável pela transferência da ubiquitina da proteína E2 para uma cadeia lateral de lisina na proteína alvo. Pensa-se que mutações na parkina levam à disfunção proteassomal e à consequente incapacidade de quebrar proteínas prejudiciais aos neurônios dopaminérgicos. Isso resulta na morte ou mau funcionamento desses neurônios, resultando na doença de Parkinson e rsquos.

Proteínas intrinsecamente desordenadas

Filme 2.1 - Movimento dinâmico do citocromo C na solução Wikipedia

Como fica evidente a partir dos muitos exemplos descritos em outras partes do livro, a estrutura 3-D das proteínas é importante para sua função. Mas, cada vez mais, está se tornando evidente que nem todas as proteínas se dobram em uma estrutura estável. Estudos sobre as chamadas proteínas intrinsecamente desordenadas (IDPs) nas últimas décadas mostraram que muitas proteínas são biologicamente ativas, mesmo que não se dobrem em estruturas estáveis. No entanto, outras proteínas exibem regiões que permanecem desdobradas (regiões IDP), mesmo quando o resto do polipeptídeo se dobra em uma forma estruturada.

Proteínas intrinsecamente desordenadas e regiões desordenadas dentro das proteínas são, de fato, conhecidas há muitos anos, mas eram consideradas uma anomalia. Só recentemente, com a constatação de que IDPs e regiões IDP estão disseminadas entre as proteínas eucarióticas, foi reconhecido que o distúrbio observado é uma "característica, não um inseto".

Filme 2.2 SUMO-1, uma proteína com seções intrinsecamente desordenadas Wikipedia

A comparação de IDPs mostra que eles compartilham características de sequência que parecem favorecer seu estado desordenado. Isto é, assim como algumas sequências de aminoácidos podem favorecer o dobramento de um polipeptídeo em uma estrutura particular, as sequências de aminoácidos de IDPs favorecem seu desdobramento restante. As regiões IDP são consideradas baixas em resíduos hidrofóbicos e excepcionalmente ricas em resíduos polares e prolina. A presença de um grande número de aminoácidos carregados nos IDPs pode inibir o dobramento por meio da repulsão de carga, enquanto a falta de resíduos hidrofóbicos torna difícil formar um núcleo hidrofóbico estável e a prolina desencoraja a formação de estruturas helicoidais. As diferenças observadas entre as sequências de aminoácidos em IDPs e proteínas estruturadas foram usadas para projetar algoritmos para prever se uma determinada sequência de aminoácidos será desordenada.

Qual é o significado de proteínas ou regiões intrinsecamente desordenadas? O fato de essa propriedade ser codificada em suas sequências de aminoácidos sugere que seu distúrbio pode estar ligado à sua função. A natureza flexível e móvel de algumas regiões IDP pode desempenhar um papel crucial em sua função, permitindo uma transição para uma estrutura dobrada ao se ligar a um parceiro de proteína ou sofrer modificação pós-tradução. Estudos em várias proteínas conhecidas com regiões IDP sugerem algumas respostas. As regiões IDP podem aumentar a capacidade de proteínas como o repressor lac de translocar ao longo do DNA para pesquisar locais de ligação específicos. A flexibilidade dos IDPs também pode ser um ativo nas interações proteína-proteína, especialmente para proteínas que são conhecidas por interagir com muitos parceiros proteicos diferentes.

Figura 2.55 - Desnaturação e renaturação da ribonuclease Wikipedia

Por exemplo, p53 tem regiões IDP que podem permitir que a proteína interaja com uma variedade de parceiros funcionais. A comparação das funções conhecidas de proteínas com previsões de distúrbio nessas proteínas sugere que IDPs e regiões IDP podem funcionar desproporcionalmente na sinalização e regulação, enquanto proteínas mais estruturadas desviam para papéis na catálise e transporte. Curiosamente, muitas das proteínas encontradas tanto nos ribossomos quanto nos spliceossomos possuem regiões IDP que podem desempenhar um papel na montagem correta desses complexos. Embora os IDPs não tenham sido estudados intensivamente por muito tempo, o pouco que se sabe sobre eles sugere que desempenham um papel importante e subestimado nas células.

Proteínas metamórficas

Outro grupo de proteínas que mudou recentemente nosso pensamento sobre a estrutura e função das proteínas são as chamadas proteínas metamórficas. Essas proteínas são capazes de formar mais de um estado dobrado estável, começando com uma única sequência de aminoácidos. Embora seja verdade que múltiplas conformações dobradas não sejam excluídas pelas leis da física e da química, as proteínas metamórficas são uma descoberta relativamente nova. Era sabido, é claro, que as proteínas príon eram capazes de se dobrar em estruturas alternativas, mas as proteínas metamórficas parecem ser capazes de alternar entre duas estruturas estáveis. Embora, em alguns casos, a proteína metamórfica passe por essa mudança em resposta à ligação de outra molécula, algumas proteínas podem realizar essa transição por conta própria. Um exemplo interessante é a molécula de sinalização, linfotactina. A linfotactina tem duas funções biológicas que são realizadas por seus dois conformadores - uma forma monomérica que se liga ao receptor da linfotactina e uma forma dimérica que se liga à heparina. É possível que esse tipo de troca seja mais difundido do que se pensava.

Reenovelamento de proteínas desnaturadas

Todas as informações para o dobramento de proteínas estão contidas na sequência de aminoácidos da proteína. Pode parecer curioso, então, que a maioria das proteínas não se dobram em sua forma adequada e totalmente ativa após terem sido +++ desnaturada e o desnaturante removido. Alguns sim, na verdade. Um bom exemplo é a ribonuclease bovina (Figura 2.55). Sua atividade catalítica é muito resistente ao calor e à uréia e as tentativas de desnaturá-la não funcionam muito bem. No entanto, se alguém tratar a enzima com & beta-mercaptoetanol (que quebra as ligações dissulfeto) antes do tratamento com ureia e / ou aquecimento, a atividade é perdida, indicando que as ligações dissulfeto covalentes ajudam a estabilizar a estrutura geral da enzima e quando são quebradas, a desnaturação pode ocorrer prontamente. Quando a mistura esfria de volta à temperatura ambiente, com o tempo, alguma atividade enzimática reaparece, indicando que a ribonuclease foi redobrada sob as novas condições.

Curiosamente, a renaturação ocorrerá ao máximo se uma pequena quantidade de beta-mercaptoetanol for deixada na solução durante o processo. A razão para isso é porque o beta-mercaptoetanol permite a redução (e quebra) de ligações dissulfeto incorretas e acidentais durante o processo de dobramento. Sem ele, essas ligações dissulfeto impedirão a formação de dobras adequadas.

Desnaturação irreversível

A maioria das enzimas, entretanto, não se comporta como a ribonuclease bovina. Uma vez desnaturado, sua atividade não pode ser recuperada de forma significativa. Não há muitas maneiras de inativar RNase It & rsquos estável quando ele & rsquos quente ou frio Porque dissulfetos seguram firmemente Se você deseja pará-lo Use extensão de mercaptoetanol quente. Isso pode parecer contradizer a ideia de que as informações de dobramento são inerentes à sequência de aminoácidos da proteína. Isso não.

A maioria das enzimas não se redobram adequadamente após a desnaturação por duas razões. Primeiro, o dobramento normal pode ocorrer à medida que as proteínas estão sendo feitas. As interações entre os aminoácidos no início da síntese não são & ldquoconfundidas & rdquo por interações com os aminoácidos mais tarde na síntese porque esses aminoácidos não estão presentes no início do processo.

Chaperonins e papel rsquo

Em outros casos, o processo de dobramento de algumas proteínas na célula dependia da ação das proteínas chaperoninas (veja AQUI). Na ausência de chaperoninas, ocorrem interações que podem resultar em dobramento incorreto, evitando assim o dobramento adequado. Assim, o dobramento precoce e a assistência de chaperoninas eliminam algumas interações potenciais de & ldquowrong-dobramento & rdquo que podem ocorrer se toda a sequência estiver presente quando o dobramento começar.

Estrutura quaternária

Um quarto nível da estrutura da proteína é o da estrutura quaternária. Refere-se a estruturas que surgem como resultado de interações entre vários polipeptídeos. As unidades podem ser cópias múltiplas idênticas ou podem ser cadeias polipeptídicas diferentes. A hemoglobina adulta é um bom exemplo de proteína com estrutura quaternária, sendo composta por duas cadeias idênticas chamadas & alfa e duas cadeias idênticas chamadas & beta.

Embora as cadeias alfa sejam muito semelhantes às cadeias beta, elas não são idênticas. Ambas as cadeias alfa e beta também estão relacionadas à cadeia polipeptídica única na proteína relacionada chamada mioglobina. Tanto a mioglobina quanto a hemoglobina têm semelhanças na ligação do oxigênio, mas seu comportamento em relação à molécula difere significativamente. Notavelmente, as subunidades múltiplas de hemoglobina e rsquos (com estrutura quaternária) em comparação com a subunidade única de mioglobina e rsquos (sem estrutura quaternária) dão origem a essas diferenças.


Métodos para detecção e análise de interações de proteína e proteína

Interações proteína-proteína (PPIs) são a base de muitos processos celulares importantes, como transdução de sinal, transporte molecular e várias vias do metabolismo, enquanto os PPIs aberrantes são a base de várias doenças relacionadas à agregação, como a doença de Alzheimer, e podem levar ao câncer. Portanto, os PPIs têm sido estudados extensivamente na área de biociências e pesquisa médica. Aqui, revisamos as principais abordagens contemporâneas utilizadas para detecção e análise da interação proteína-proteína.

Tabela 1: Resumo dos métodos comuns de detecção de PPI
Técnica Princípio
Coimunoprecipitação
(Co-IP)
Um experimento de imunoprecipitação projetado para purificar por afinidade um antígeno de proteína de isca junto com seu parceiro de ligação usando um anticorpo específico contra a isca.
Ensaios de pull-down Um método de cromatografia de afinidade que envolve o uso de uma isca marcada ou marcada para criar uma matriz de afinidade específica que permitirá a ligação e purificação de uma proteína presa a partir de uma amostra de lisado ou outra mistura contendo proteína.
Dois híbridos de levedura (Y2H) Monitore a formação de complexos por meio da ativação transcricional de genes repórter.
Far-Western Blotting Estratégia semelhante ao Western blotting, com uma diferença fundamental. A sonda de anticorpo em uma detecção típica de Western blotting é substituída por uma proteína isca marcada como a sonda.
Massa de purificação de afinidade em tandem
espectroscopia
(TAP-MS)
O TAP-MS é baseado na marcação dupla da proteína de interesse em seu locus cromossômico, seguida por um processo de purificação em duas etapas e análise espectroscópica de massa.
Microarrays de proteínas A análise baseada em microarray permite a análise simultânea de milhares de parâmetros em um único experimento.
Interferometria de bio-camada (BLI) A mudança no número de moléculas ligadas à ponta do biossensor causa uma mudança no padrão de interferência que pode ser medida em tempo real.
Ressonância de plasma de superfície (SPR) O ângulo SPR muda com os índices de refração da superfície, que estão em proporção direta com a massa molecular da biomolécula ligada à superfície do metal.

Coimunoprecipitação (Co-IP)

A co-imunoprecipitação (Co-IP) é uma técnica popular para identificar e validar interações proteína-proteína fisiologicamente relevantes. Ao usar anticorpos específicos de proteína alvo para capturar indiretamente proteínas que estão ligadas a uma proteína alvo específica, o Co-IP é aplicado para rastrear novas interações proteína-proteína ou confirmar a existência de interações proteína-proteína.

Em Co-IP, as proteínas interagem em uma condição não desnaturante que é quase fisiológica. No entanto, baixa afinidade ou interação transitória entre as proteínas podem não ser detectadas.Por outro lado, o resultado do Co-IP não permitiu determinar se a interação é direta ou indireta, uma vez que não foi possível descartar a possibilidade de envolvimento de proteínas adicionais.

Ensaios de pull-down

O ensaio pull-down é um método in vitro usado para determinar uma interação física entre duas ou mais proteínas. Pode ser usado para confirmação de interações proteína-proteína existentes descobertas por outras técnicas ou triagem inicial para identificar novas interações proteína-proteína.

O princípio básico do ensaio pull down é utilizar uma proteína de fusão de tag (como tag de GST, tag de His e tag de biotina) imobilizada em resina de afinidade como a proteína isca. As proteínas que se ligam à proteína isca (proteína de presa) podem ser capturadas e “puxadas para baixo” quando a proteína alvo ou o lisado celular flui. Por eluição e análise subsequentes usando Western Blot ou Espectrometria de Massa, uma interação prevista pode ser confirmada ou interações previamente desconhecidas podem ser descobertas.

Dois híbridos de levedura (Y2H)

O sistema de dois híbridos é um dos métodos mais amplamente usados ​​para rastrear ou confirmar as interações proteína-proteína. Dois domínios de proteína são necessários no ensaio Y2H, que terá duas funções específicas: (i) um domínio de ligação ao DNA (DBD) que ajuda na ligação ao DNA e (ii) um domínio de ativação (AD) responsável por ativar a transcrição do DNA. Ambos os domínios são necessários para a transcrição do gene areporter. A análise Y2H permite o reconhecimento direto de PPI entre pares de proteínas. No entanto, o método pode incorrer em um grande número de interações falso-positivas. Por outro lado, muitas interações verdadeiras podem não ser rastreadas usando o ensaio Y2H, levando a resultados falsos negativos.

Far-Western Blotting

Far-western blotting é um método de biologia molecular baseado na técnica de western blotting para detectar a interação proteína-proteína in vitro. Enquanto o western blotting normal usa um anticorpo para detectar uma proteína de interesse, o far-western blotting usa uma proteína não-anticorpo, que pode se ligar à proteína de interesse. Assim, enquanto o western blotting é usado para a detecção de certas proteínas, o far-western blotting é mais utilizado para detectar interações entre proteínas e proteínas.

Espectroscopia de massa de purificação de afinidade em tandem (TAP-MS)

A marcação TAP foi desenvolvida para estudar PPIs sob as condições intrínsecas da célula. Este método é baseado na marcação dupla da proteína de interesse em seu locus cromossômico, seguida por um processo de purificação em duas etapas. As proteínas que permanecem associadas à proteína alvo podem então ser examinadas e identificadas por meio de SDS-PAGE seguido por análise de espectrometria de massa, identificando assim o colaborador PPI da proteína original de interesse.

Os microarranjos de proteínas estão rapidamente se estabelecendo como um meio poderoso para detectar proteínas, monitorar seus níveis de expressão e sondar as interações e funções das proteínas. Um microarray de proteína é um pedaço de vidro no qual várias moléculas de proteína foram fixadas em locais separados de uma maneira ordenada. Os microarranjos de proteínas têm visto um enorme progresso e interesse no momento e se tornaram uma das áreas ativas emergentes na biotecnologia. O objetivo por trás do desenvolvimento de microarranjos de proteínas é alcançar uma análise de proteína de alto rendimento eficiente e sensível, realizando um grande número de determinações em paralelo por processo automatizado.

BiologicsCorp fornece um serviço de produção de proteínas tranquilizante. Basta nos dar um pedido e obterá a proteína com a pureza que deseja. Mais detalhes a seguir

V.Srinivasa Rao, K. Srinivas, G. N. Sujin e G.N.Sunand Kumar. Detecção da Interação Proteína-Proteína: Métodos e Análise. Int J Proteomics, 2014: 147648.

T.Berggard, S. Linse e P. James. Methods for the Detection and Analysis of Protein-Protein Interactions, Proteomics, 2007, 7 (16): 2833–2842.

Phizicky E. M. e Fields S. Protein-Protein Interactions: Methods for Detection and Analysis. Microbiol Rev. 1995,59 (1): 94-123.


3. Estrutura terciária

Estrutura terciária refere-se à estrutura 3-D abrangente da cadeia polipeptídica de uma proteína. Existem vários tipos de ligações e forças que mantêm uma proteína em sua estrutura terciária.

  • Interações hidrofóbicas contribuem grandemente para o enovelamento e modelagem de uma proteína. O grupo "R" do aminoácido é hidrofóbico ou hidrofílico. Os aminoácidos com grupos "R" hidrofílicos buscarão contato com seu meio aquoso, enquanto os aminoácidos com grupos "R" hidrofóbicos buscarão evitar a água e se posicionar em direção ao centro da proteína.
  • Ligação de hidrogênio na cadeia polipeptídica e entre os grupos de aminoácidos "R" ajuda a estabilizar a estrutura da proteína, mantendo a proteína na forma estabelecida pelas interações hidrofóbicas.
  • Devido ao dobramento de proteínas, ligação iônica pode ocorrer entre os grupos "R" carregados positivamente e negativamente que entram em contato próximo uns com os outros.
  • O dobramento também pode resultar na ligação covalente entre os grupos "R" de aminoácidos de cisteína. Este tipo de ligação forma o que é chamado de ponte dissulfeto. As interações chamadas forças de van der Waals também auxiliam na estabilização da estrutura da proteína. Essas interações pertencem às forças de atração e repulsão que ocorrem entre as moléculas que se tornam polarizadas. Essas forças contribuem para a ligação que ocorre entre as moléculas.

Métodos

Experimentos de teste em pares

Testamos experimentalmente as 500 principais previsões de L3 em comparação com as 500 principais previsões de CRA 29 na rede humana, testadas por HI. HI-testado é um subconjunto do conjunto de dados de interação humana HI-II-14 5, restrito a uma única ORF para cada gene, presente em HI-III 26, e omitindo queratinas (KRT *). Para testar a eficiência geral do experimento, incluímos 94 interações com curadoria de literatura com evidências múltiplas (Lit-BM-13 5), bem como um conjunto de 88 interações de referência positivas da literatura (PRS). Em princípio, as proteínas de nossas principais previsões podem ter características especiais, que modificam localmente a taxa de recuperação de suas interações. Para ter uma avaliação mais específica, nosso conjunto positivo selecionado (PPIs "conhecidos") contém 100 links conhecidos selecionados aleatoriamente em HI-testado, conectado a pelo menos um dos nós nas 500 principais previsões L3. Para controlar a taxa de falsos positivos, selecionamos um conjunto de 144 pares de nós aleatórios no conjunto de referência aleatório (RRS) e um conjunto mais específico de 100 pares aleatórios envolvendo as proteínas nas 500 principais previsões L3 (RND). Ao todo, testamos em pares 1.485 pares não redundantes, em duas orientações, classificando cada par como positivo, negativo ou indeterminado. Os detalhes do protocolo experimental estão resumidos na Nota Complementar 1.

Análise estatística

Todas as análises estatísticas foram realizadas usando o pacote R (v3.2.3, http://www.r-project.org/). Os detalhes da avaliação quantitativa de desempenho estão listados na Nota Complementar 2.

Atribuição de probabilidades às previsões L3

Para estimar a probabilidade de cada link previsto testar positivamente em um experimento de teste de pares, primeiro calculamos uma pontuação de previsão para cada link existente em HI testado em um cenário de deixar um de fora e classificamos esses PPIs conhecidos junto com os links recém-previstos com base em suas pontuações de previsão. Assumindo que em torno de uma determinada classificação, os pares são mais prováveis ​​de serem reais se cercados por links já conhecidos, estimamos a probabilidade de validação em uma determinada classificação calculando a proporção de interações conhecidas para todos os pares em uma janela de ± 50 interações conhecidas em torno do classificação. Em seguida, somamos essas probabilidades até uma determinada classificação, fornecendo o número esperado de interações validadas até essa classificação.

Disponibilidade de código

O código de previsão L3, junto com conjuntos de dados de exemplo, arquivos de dados de entrada e previsões, está disponível em [https://doi.org/10.5281/zenodo.2008592]. Outros códigos escritos e usados ​​neste estudo estão disponíveis com o autor correspondente, mediante solicitação razoável.

Resumo de relatórios

Mais informações sobre o projeto experimental estão disponíveis no Nature Research Reporting Summary vinculado a este artigo.


(1). Estrutura primária

Ø A estrutura primária de uma proteína fornece os detalhes da sequência de aminoácidos de uma proteína.

Ø A estrutura primária dirá a você duas coisas principais: (i) o número de resíduos de aminoácidos na proteína e (ii) o sequência de aminoácidos.

Ø A informação de 'sequência' contém a ordem correta dos aminoácidos na proteína, começando do N-terminal ao C-terminal.

Ø A estrutura primária de uma proteína determinará todos os outros níveis de organização estrutural de uma proteína (secundário, terciário e quaternário).

Ø A estrutura primária é estabilizada por Ligações peptídicas (Ligação covalente).

Ø O primeiro estudo sobre uma proteína desconhecida será a determinação da sua sequência (determinação da estrutura primária).

Ø Primeira proteína sequenciada: Insulina por Frederick Sanger.

Estrutura primária da insulina

Importância da Estrutura Primária:

Ø A estrutura primária de uma proteína oferecerá insights sobre:

(uma). Tridimensional Estrutura (3D)

(b). Função da proteína

(c). Celular localização

(d). Evolução da proteína

Ø Os dados da estrutura primária podem ser usados ​​para a busca de sequência a partir do bancos de dados de proteínas.

Estruturas tridimensionais de proteínas

Ø A espinha dorsal de uma proteína contém centenas de indivíduos títulos.

Ø A rotação livre é possível em torno de muitas dessas ligações.

Ø A rotação livre permite um número ilimitado de conformações em torno dessas ligações.

Ø No entanto, cada proteína tem um específico (único) conformação estrutural.

Ø Esta formação estrutural única de uma proteína é chamada de Estrutura 3D.

Ø O arranjo espacial dos átomos em uma proteína é chamado de 'Conformação’.

Ø Proteínas em suas conformações dobradas funcionais são chamadas proteínas nativas.

Ø As conformações de uma proteína são estabilizadas principalmente por interações fracas, como ligações de hidrogênio, interações hidrofílicas, interações hidrofóbicas etc.

Ø Essas interações fracas podem ser facilmente distorcidas com menos gasto de energia.

Ø As proteínas podem ter três níveis de organizações tridimensionais (3D). Eles são:

Estrutura secundária

Estrutura terciária

Estrutura quaternária

(2) Estrutura Secundária

Ø Estrutura secundária é a conformação local especial de alguma parte de uma cadeia polipeptídica.

Ø É o padrão de dobramento da estrutura polipeptídica regular.

Ø Diferentes tipos de estruturas secundárias ocorrem na natureza.

Ø As estruturas secundárias são estabilizadas principalmente por Ligações de hidrogênio.

Ø As três estruturas secundárias mais importantes na proteína são:

B. Conformações β (placas β)

(UMA). α-Helix

Ø A α-hélice é a estrutura secundária mais comum.

Ø São estruturas regulares que se repetem a cada 5,4 Å.

Ø É o arranjo mais simples de uma cadeia polipeptídica.

Ø A estrutura α-helicoidal da proteína foi proposta por Pauling e Corey em 1951.

Ø A estrutura polipeptídica é firmemente enrolada em torno de um eixo imaginário desenhado longitudinalmente através do meio da hélice, e os grupos R dos resíduos de aminoácidos projetam-se para fora da estrutura helicoidal.

Ø Passo da hélice: A unidade de repetição da hélice.

Ø O passo é uma única volta da hélice que se estende sobre 5,4 Å.

Ø Cada volta helicoidal em α-hélice contém 3,6 aminoácidos.

Ø A torção helicoidal da α-hélice em todas as proteínas é destro.

Ø A α-hélice é estabilizada por ligações de hidrogênio.

Ø A α-hélice é tão comum na proteína porque faz o uso ideal das ligações de hidrogênio internas.

Ø As ligações de hidrogênio são formadas entre o hidrogênio ligado ao átomo de nitrogênio eletronegativo da ligação peptídica e o átomo de oxigênio carbonil eletronegativo do quarto aminoácido no lado amino-terminal da ligação peptídica.

Ø Dentro da α-hélice, cada ligação peptídica participa da ligação de hidrogênio.

Ø Todas as ligações de hidrogênio juntas fornecem estabilidade considerável para a α-hélice.

Ø Todos os polipeptídeos não podem formar uma hélice α sable.

Ø As interações entre as cadeias laterais de aminoácidos podem estabilizar ou desestabilizar a α-hélice.

Ø Por exemplo, se uma cadeia polipeptídica tem um longo trecho de resíduos de ácido glutâmico, este segmento da cadeia não formará uma α-hélice.

Ø O grupo carboxila carregado negativamente dos resíduos Glu adjacentes repele um ao outro fortemente de modo que evita a formação da α-hélice.

Ø Da mesma forma, um polipeptídeo rico em Proline não formará uma α-hélice.

Ø Na prolina, o átomo de nitrogênio é parte de um anel rígido e rotação em torno do N - Cα vínculo NÃO é possível.

Ø Assim, a prolina introduz um desestabilizador torção no polipeptídeo e, portanto, a prolina é muito raramente encontrada na α-hélice.

Conformações β (placas β)

Ø A conformação β ou placas β organizam as cadeias polipeptídicas em lençóis.

Ø A conformação β é uma estendido forma de uma cadeia polipeptídica.

Ø Aqui, a estrutura polipeptídica é estendida em um ziguezague estrutura.

Ø As cadeias polipeptídicas em zigue-zague podem ser dispostas lado a lado para formar uma estrutura semelhante a uma série de pregas chamadas folhas β.

Ø Aqui também a estrutura é estabilizada por ligações de hidrogênio.

Ø No entanto, ao contrário da α-hélice, as ligações de hidrogênio são formadas entre segmentos adjacentes da cadeia.

Ø Os grupos R de aminoácidos adjacentes projetam-se da estrutura em zigue-zague na direção oposta, criando o padrão alternado.

Ø As cadeias polipeptídicas nas folhas β podem ser dispostas em paralelo (na mesma direção) ou antiparalelas (direção oposta).

Ø Com base nisso, as placas β são classificadas em dois tipos: (diagrama)

(a) Placas β antiparalelas

(b) Placas β paralelas

Ø As voltas β são muito comuns em proteínas, onde o peptídeo faz uma volta ou alça (o peptídeo faz uma direção reversa).

Ø Nas proteínas globulares, quase um terço dos resíduos de aminoácidos estão em voltas β.

Ø As voltas β são os elementos de conexão que ligam cadeias polipeptídicas sucessivas.

Ø A volta β conecta as extremidades de dois segmentos adjacentes de folhas β anti-paralelas.

Ø A estrutura β-turn é um Giro de 180º envolvendo quatro resíduos de aminoácidos

Ø O oxigênio carbonílico do primeiro resíduo forma uma ligação de hidrogênio com o grupo amino hidrogênio do quarto aminoácido na volta.

Ø Glycine (Gly) e Proline (Pro) residem freqüentemente ocorre em β-voltas.

Ø A glicina devido ao seu tamanho muito pequeno (o grupo R é - H) permite voltas β.

Ø A prolina é um iminoácido com sua cadeia lateral covalentemente ligada ao grupo amino.

Ø O resíduo de prolina na ligação peptídica assume o ‘Cis’ configuração.

Ø O ‘Cis’ a conformação é muito receptiva a curvas fechadas.

Ø Existem vários tipos de voltas β com tipo I e Tipo II são os mais comuns.

Ø O β-turn tipo I é encontrado mais de duas vezes a frequência do tipo II.

Ø No tipo II, o terceiro resíduo será sempre um resíduo de glicina.

(3). Proteínas de Estrutura Terciária

Ø Estrutura terciária: O arranjo tridimensional geral de todos os átomos em uma proteína é conhecido como estrutura terciária.

Ø A estrutura terciária terá um único polipeptídeo & # 8220 espinha dorsal & # 8221 com uma ou mais estruturas secundárias.

Ø A estrutura terciária é definida pelo coordenadas atômicas.

Ø Estruturas terciárias em uma proteína são estabilizadas por ligações covalentes e não covalentes.

Ø Ligação covalente: Ligações dissulfureto (entre dois resíduos Cys)

Ø Interações não covalentes: interações iônicas (atrações eletrostáticas), interações hidrofílicas, interações de van der Waals.

Ø O termo 'Domínio'É usado para denotar uma única unidade funcional de uma proteína.

Ø Uma proteína pode ter muitos domínios com funções específicas.

Ø Uma proteína com uma única subunidade tem apenas até a estrutura terciária.

(4). Estrutura quaternária

Ø A maioria das proteínas funcionais contém mais de uma cadeia polipeptídica e tal proteína é considerada oligomérico.

Ø Cada peptídeo forma um subunidade ou monômero ou protômero.

Ø Estrutura quaternária: O arranjo de monômeros de proteínas em complexos tridimensionais em uma proteína com várias subunidades é chamado de estrutura quaternária.

Ø Para que uma proteína tenha estrutura quaternária, ela deve cumprir duas condições:

§ Deve ter mais de uma subunidade polipeptídica

§ Não deve haver interação permanente (covalente) entre as subunidades (como ligação dissulfeto).

Ø A insulina não tem estrutura quaternária, mesmo que contenha duas subunidades.

Ø Os dois polipeptídeos da insulina estão covalentemente conectados com duas ligações dissulfeto.

Ø Assim, a insulina pode ter até estrutura terciária (não estrutura quaternária).

Ø Ligações que estabilizam a estrutura quaternária: ligações de hidrogênio, interações hidrofílicas, interações hidrofóbicas, interações de van der Waals.

Nelson, D.L., Lehninger, A.L. e Cox, M.M., 2008. Lehninger & # 8217s Principles of Biochemistry. Macmillan.

Estude offline (sem Internet)

Agora você pode Download a PDF desta postagem Absolutamente grátis !

Por favor clique no Link para Download / Botão abaixo para Salvar a postagem como um único arquivo PDF. O arquivo PDF será aberto em uma nova janela do próprio navegador. Clique com o botão direito no PDF e selecione & # 8216Salvar como& # 8216 opção para salvar o arquivo em seu computador.

Por favor Compartilhe o PDF com seus amigos, parentes, alunos e colegas & # 8230

Você tem alguma dúvida?
Por favor, deixe-me na seção de comentários abaixo.
Terei o maior prazer em ler seus comentários e responder.


Tipos de ácidos graxos

Ácidos graxos insaturados (poliinsaturados e monoinsaturados)

Os ácidos graxos monoinsaturados contêm uma ligação dupla carbono-carbono, que pode ser encontrada em diferentes posições ao longo da cadeia do ácido graxo. A maioria dos ácidos graxos monoinsaturados tem entre 16 e 22 carbonos de comprimento e contém uma ligação dupla cis, o que significa que os átomos de hidrogênio são orientados na mesma direção, introduzindo uma curvatura na molécula. Além disso, a configuração cis está associada à instabilidade termodinâmica e, portanto, a um ponto de fusão mais baixo em comparação aos ácidos graxos trans e saturados.

Os ácidos graxos poliinsaturados contêm mais de uma ligação dupla. Quando a primeira ligação dupla está situada entre o terceiro e o quarto ou o sexto e o sétimo átomos de carbono da ligação carbono-oxigênio, eles são chamados de ácidos graxos ω-3 e ω-6, respectivamente. Os ácidos graxos poliinsaturados são produzidos apenas por plantas e fitoplâncton e são essenciais para todos os organismos superiores.

Saturado

Os ácidos graxos saturados são saturados com hidrogênio e a maioria são cadeias lineares de hidrocarbonetos com um número par de átomos de carbono. Os ácidos graxos mais comuns contêm de 12 a 22 átomos de carbono.

Corrente longa

Os ácidos graxos de cadeia longa (C16 e superior) podem ser saturados ou mono / poliinsaturados, dependendo da presença de uma ou mais ligações duplas na cadeia de carbono. O oleato é o ácido graxo monoinsaturado de cadeia longa mais abundante, com um comprimento de cadeia de 18 carbonos e uma ligação dupla localizada entre C9 e C10 a partir da extremidade metil (C18: 1n-9). Além disso, os ácidos graxos de cadeia longa são insolúveis em água e circulam pelo plasma como um complexo esterificado, triacilgliceróis ou formas não esterificadas fracamente ligadas à albumina.

Cadeia curta

Os ácidos graxos de cadeia curta são os produtos finais primários do metabolismo bacteriano no intestino grosso humano. Além disso, enquanto os ácidos graxos de cadeia curta são formados a partir de vários precursores por microrganismos anaeróbios, os carboidratos são os progenitores mais comuns dos ácidos graxos de cadeia curta.


Estruturas biomoleculares: previsão, identificação e análises

Colágeno Tripla Hélice

O colágeno é uma proteína fibrosa presente em abundância no corpo humano, sendo um dos principais constituintes da pele, dos ossos e de vários tecidos conjuntivos. Ajuda na formação de um andaime para fornecer resistência e estrutura. Os colágenos têm uma sequência única de repetição tripeptídica com glicina em cada terceira posição e os iminoácidos Prolina e Hidroxiprolina freqüentemente presentes nas outras duas posições (Bowes e Kenten, 1948 Eastoe, 1955). A primeira estrutura helicoidal tripla do colágeno tinha duas ligações H entre cadeias para cada três resíduos (Ramachandran e Kartha, 1954, 1955). Isso foi ligeiramente modificado para uma estrutura ligada por hidrogênio (Rich e Crick, 1955). No entanto, uma segunda ligação de hidrogênio mediada por água também é encontrada para estabilizar a hélice tripla (Ramachandran e Sasisekharan, 1961). Cada hélice no colágeno tem sentido de parafuso para a mão esquerda e a hélice principal formada por três dessas hélices é para a direita. Cada hélice tem 10 resíduos em 3 voltas, resultando em um passo de 85,8 Å. A torção entre duas hélices vizinhas foi encontrada em -108,8 ° e aumento de

2.86 Å (Bhattacharjee e Bansal, 2005 Ramachandran e Kartha, 1955 Ramachandran e Sasisekharan, 1961). Defeitos moleculares na biossíntese de colágeno podem levar a muitas doenças genéticas raras envolvendo tecidos conjuntivos como a síndrome de Ehlers-Danlos (De Paepe, 1998 Gaisl et al., 2017 Miyake et al., 2017 Prockop et al., 1979). Foi demonstrado que o colágeno tem ampla gama de aplicações no campo médico e cosmético, pois é biodegradável, biocompatível, facilmente disponível e antigênico fraco (Cheng et al., 2017 Chvapil, 1977 Chvapil et al., 1973 Lee et al., 2001 Sheikh et al., 2017). No campo da engenharia de tecidos, biomateriais à base de colágeno são usados ​​para melhorar as funções dos tecidos (Parenteau-Bareil et al., 2010 ).


Diferenças de comprimento entre proteínas que interagem fisicamente - Biologia

Figura 1: Galeria de proteínas. Exemplos representativos do tamanho da proteína são mostrados com exemplos desenhados para ilustrar alguns dos principais papéis funcionais que desempenham. Todas as proteínas na figura são mostradas na mesma escala para dar uma impressão de seus tamanhos relativos. Os pequenos objetos vermelhos mostrados em algumas das moléculas são os substratos para a proteína de interesse. Por exemplo, na hexoquinase, o substrato é a glicose. O identificador na ATP sintase é conhecido por existir, mas a estrutura exata não estava disponível e, portanto, apenas esquematicamente desenhada. Os nomes entre parênteses são os IDs das entradas das estruturas do banco de dados PDB. (Figura cortesia de David Goodsell).

As proteínas são freqüentemente chamadas de burros de carga da célula. Uma impressão dos tamanhos relativos dessas diferentes máquinas moleculares pode ser obtida na galeria mostrada na Figura 1. Um exemplo favorito é fornecido pela proteína Rubisco mostrada na figura que é responsável pela fixação atmosférica de carbono, literalmente construindo a biosfera de finos ar. Essa molécula, uma das proteínas mais abundantes da Terra, é responsável por extrair cerca de cem gigatoneladas de carbono da atmosfera a cada ano. Isso é ≈10 vezes mais do que todas as emissões de dióxido de carbono feitas pela humanidade a partir de escapamentos de carros, motores a jato, usinas de energia e todas as nossas outras tecnologias movidas a combustíveis fósseis. No entanto, os níveis de carbono continuam aumentando globalmente a taxas alarmantes porque esse carbono fixo é subsequentemente reemitido em processos como a respiração, etc. Essa fixação química é realizada por essas moléculas de Rubisco com uma massa monomérica de 55 kDa fixando CO2 um de cada vez, com cada CO2 com uma massa de 0,044 kDa (apenas outra forma de escrever 44 Da que esclarece a relação 1000: 1 em massa). Para outro jogador dominante em nossa biosfera, considere a ATP sintase (MW≈500-600 kDa, BNID 106276), também mostrada na Figura 1, que decora nossas membranas mitocondriais e é responsável por sintetizar as moléculas de ATP (MW = 507 Da) que alimentam muito da química da célula. Essas fábricas moleculares produzem tantas moléculas de ATP que todos os ATPs produzidos pelas mitocôndrias em um corpo humano em um dia teriam quase tanta massa quanto o próprio corpo. Como discutimos na vinheta sobre "Qual é o tempo de rotação dos metabólitos?" a rápida rotatividade torna isso menos improvável do que pode parecer.

Figura 2: Uma galeria de homooligômeros mostrando a bela simetria desses complexos de proteínas comuns. Destacadas em rosa estão as subunidades monoméricas que constituem cada oligômero. Figura de David Goodsell.

O tamanho de proteínas como Rubisco e ATP sintase e muitas outras podem ser medidos geometricamente em termos de quanto espaço ocupam e em termos de tamanho de sequência, conforme determinado pelo número de aminoácidos que são unidos para formar a proteína . Dado que o aminoácido médio tem uma massa molecular de 100 Da, podemos facilmente interconverter entre a massa e o comprimento da sequência. Por exemplo, o monômero Rubisco de 55 kDa tem cerca de 500 aminoácidos que compõem sua cadeia polipeptídica. A extensão espacial das proteínas solúveis e seu tamanho de sequência frequentemente exibem uma propriedade de escala aproximada onde o volume escala linearmente com o tamanho da sequência e, portanto, os raios ou diâmetros tendem a escala como o tamanho da sequência para 1/3 da potência. Uma regra simples para pensar sobre proteínas solúveis típicas como o monômero Rubisco é que elas têm 3-6 nm de diâmetro, conforme ilustrado na Figura 1, que mostra não apenas Rubisco, mas muitas outras proteínas importantes que fazem as células funcionarem. Em quase metade dos casos, verifica-se que as proteínas funcionam quando várias cópias idênticas estão simetricamente ligadas umas às outras, como mostrado na Figura 2. Eles são chamados de homo-oligômeros para diferenciá-los dos casos em que diferentes subunidades de proteínas são unidas formando o chamados hetero-oligômeros. Os estados mais comuns são o dímero e o tetrâmero (e os monômeros não oligoméricos). Os homo-oligômeros são cerca de duas vezes mais comuns que os hetero-oligômeros (BNID 109185).

Há uma diferença de tamanho freqüentemente surpreendente entre uma enzima e os substratos nos quais ela atua. Por exemplo, nas vias metabólicas, os substratos são metabólitos que geralmente têm uma massa inferior a 500 Da, enquanto as enzimas correspondentes são geralmente cerca de 100 vezes mais pesadas. Na via da glicólise, pequenas moléculas de açúcar são processadas para extrair energia e blocos de construção para uma biossíntese posterior. Esta via é caracterizada por uma série de máquinas de proteína, todas muito maiores do que seus substratos de açúcar, com exemplos mostrados no canto inferior direito da Figura 1, onde vemos o tamanho relativo dos substratos indicados em vermelho ao interagir com suas enzimas .

Figura 3: Distribuição de comprimentos de proteína em E. coli, levedura de brotamento e células HeLa humanas. (A) O comprimento da proteína é calculado em aminoácidos (AA), com base nas sequências de codificação no genoma. (B) As distribuições são desenhadas após pesar cada gene com o número de cópias da proteína inferido a partir de estudos proteômicos de espectrometria de massa (M. Heinemann no prelo, M9 + glicose LMF de Godoy et al. Nature 455: 1251, 2008, meio definido T. Geiger et al., Mol. Cell Proteomics 11: M111.014050, 2012). Linhas contínuas são estimativas de densidade de kernel gaussiana para as distribuições que servem como um guia para o olho.

Tabela 1: Comprimento médio das sequências de codificação de proteínas com base em genomas de diferentes espécies. As entradas nesta tabela são baseadas em uma análise bioinformática por L. Brocchieri e S. Karlin, Nuc. Ácidos. Res., 33: 3390, 2005, BNID 106444. Conforme discutido no texto, propomos uma métrica alternativa que pondera proteínas por sua abundância, conforme revelado em recentes censos de amplo espectro de espectrometria de massa. Os resultados não são muito diferentes das entradas nesta tabela, com os eucariotos tendo cerca de 400 aa em média e as bactérias com cerca de 300 aa.

Valores concretos para o comprimento médio do gene podem ser calculados a partir de sequências do genoma como um exercício de bioinformática. A Tabela 1 relata esses valores para vários organismos, mostrando uma tendência para sequências codificadoras de proteínas mais longas ao passar de organismos unicelulares para organismos multicelulares. Na Figura 3, vamos além dos tamanhos médios de proteínas para caracterizar a distribuição completa de comprimentos de sequência de codificação no genoma, relatando valores para três organismos modelo. Se nosso objetivo era aprender sobre o espectro de tamanhos de proteínas, esta definição baseada no comprimento genômico pode ser suficiente. Mas quando queremos entender o investimento em recursos celulares que vai para a síntese de proteínas, ou prever o comprimento médio de uma proteína escolhida aleatoriamente da célula, defendemos uma definição alternativa, que se tornou possível graças aos recentes censos em todo o proteoma. Para esses tipos de questões, as proteínas mais abundantes devem receber um peso estatístico maior no cálculo do comprimento esperado da proteína. Assim, calculamos a distribuição ponderada dos comprimentos das proteínas mostradas na Figura 3, dando a cada proteína um peso proporcional ao seu número de cópias. Esta distribuição representa o comprimento esperado de uma proteína pescada aleatoriamente para fora da célula, em vez de extraída aleatoriamente do genoma. As distribuições que emergem dessa abordagem centrada no proteoma dependem das condições específicas de crescimento da célula. Neste livro, optamos por usar como uma regra simples para o comprimento da proteína “típica” em procariotos ≈300 aa e em eucariotos ≈400 aa. As distribuições na Figura 3 mostram que esta é uma estimativa razoável, embora possa ser uma superestimativa em alguns casos.

Um dos encantos da biologia é que a evolução necessita de elementos funcionais muito diversos criando outliers em quase todas as propriedades (que também é a razão pela qual discutimos medianas e não médias acima). Quando se trata do tamanho da proteína, a titina é uma grande exceção. A titina é uma proteína multifuncional que se comporta como uma mola não linear nos músculos humanos, com seus muitos domínios se desdobrando e redobrando na presença de forças e dando aos músculos sua elasticidade. A titina é cerca de 100 vezes mais longa do que a proteína média com sua cadeia polipeptídica de 33.423 aa (BNID 101653). Identificar as menores proteínas do genoma ainda é controverso, mas proteínas ribossômicas curtas de cerca de 100 aa são comuns.

É muito comum usar a marcação GFP de proteínas para estudar tudo, desde sua localização até suas interações. Munidos do conhecimento do tamanho característico de uma proteína, estamos agora preparados para revisitar o ato aparentemente inócuo de rotular uma proteína. A GFP tem 238 aa de comprimento, composta por um barril beta dentro do qual os aminoácidos-chave formam o cromóforo fluorescente, conforme discutido na vinheta em “Qual é o tempo de maturação para proteínas fluorescentes?”. Como resultado, para muitas proteínas, o ato de rotular deve realmente ser pensado como a criação de um complexo de proteínas que agora é duas vezes maior que a proteína não perturbada original.


Assista o vídeo: Comprimento ou Cumprimento - Qual é o Certo, Qual a Diferença? (Janeiro 2022).