Em formação

Qual proporção de proteínas requer dobramento assistido por chaperone?


Sou novo no campo da bioquímica (na verdade, sou químico).

Há muito tempo que conheço o processo de dobramento como o processo que leva à conformação de energia mínima de uma proteína.

Agora, sou apresentado aos acompanhantes, que eu não conhecia antes.

O que estou me perguntando é: minha visão anterior da dobragem, como um processo de "automontagem" (a proteína se dobra sem ajuda externa quando é montada pelo ribossomo) é real, ou qualquer processo de dobramento é auxiliado por acompanhantes?

Se ambos os processos existem, qual é a freqüência da dobra "assistida", em comparação com o processo espontâneo?


Lembro-me de uma adorável revisão na Trends in Biochemical Sciences que discute as proteínas chaperonas independentes, parcialmente dependentes e totalmente dependentes em procariotos. A conclusão foi que polipeptídeos menores são menos propensos a exigir assistência de um acompanhante. Esta é a figura deles:

Esse princípio ainda é válido até certo ponto (em procariontes), mas a assistência de dobramento é agora mais amplamente entendida para incluir muito mais do que apenas proteínas específicas identificadas como chaperonas moleculares. O postulado de Anfinsen (que a estrutura terciária final de uma proteína depende apenas de sua estrutura primária) ainda pode valer para pequenas proteínas globulares, mas o dobramento in vivo é quase certo sempre assistido. Já que você está vindo da perspectiva de um químico, não pense nisso como uma reação entre duas moléculas em solução. É uma reação em um gel repleto de açúcares complexos, lipídios, proteínas e ácidos nucléicos.

Se você não acredita na perspectiva de um citoplasma aglomerado, leia a revisão que vinculei. É um aspecto importante, mas muitas vezes subestimado da bioquímica in vivo. Há Muito de mais para ler sobre isso. Você pode tentar pesquisar Allen Minton (AP Minton) e aglomeração macromolecular em seu banco de dados favorito.


Enrolamento de proteínas assistido por acompanhantes: o caminho para a descoberta de uma perspectiva pessoal

O dobramento de proteínas é o processo pelo qual as cadeias polipeptídicas recentemente sintetizadas adquirem as estruturas tridimensionais necessárias para a função biológica. Por muitos anos, acreditou-se que o enovelamento de proteínas ocorria espontaneamente, com base nos experimentos pioneiros de Christian Anfinsen, que mostrou no final da década de 1950 que proteínas purificadas podem se dobrar por conta própria após a remoção do desnaturante 1. Anfinsen descobriu o princípio fundamental de que a sequência linear de aminoácidos contém todas as informações necessárias para especificar a estrutura tridimensional de uma proteína. Mas logo ficou claro que os experimentos de dobramento de tubos de ensaio funcionam principalmente para proteínas pequenas e de domínio único, muitas vezes apenas em condições muito distantes daquelas encontradas em uma célula. As proteínas grandes freqüentemente falham em atingir o estado nativo sob essas condições experimentais, formando agregados não funcionais. Apesar desses problemas, o dobramento de proteínas era de pouco interesse para os biólogos celulares até meados e final da década de 1980, quando a história da acompanhante começou a se desenrolar. Como resultado, agora sabemos que, nas células, muitas (talvez a maioria) das proteínas requerem chaperonas moleculares e energia metabólica para se dobrarem com eficiência e a uma taxa biologicamente relevante. Descrevo aqui, de uma perspectiva pessoal, os desenvolvimentos que levaram a essa nova visão.


Simples por comparação

A engenharia reversa de um hiperdrive parece simples em comparação. Em 1994, um professor iniciou um concurso para especialistas em IA chamado CASP: Avaliação crítica da previsão da estrutura [proteína]. A cada dois anos, os competidores tentam prever a dobra de uma proteína apenas a partir de sua sequência de aminoácidos, sem saber a dobra com antecedência. Até agora, as pontuações alcançaram 20 a 40 no Teste de Distância Global (GDT), uma medida da distância entre as posições de aminoácidos previstas contra posições biológicas reais. DeepMind alcançou uma pontuação média de 60 com AlphaFold em 2018. Eles aumentaram enormemente este ano para 92,4. A entrada do blog retrata a proximidade da dobra prevista com a dobra real em dois casos. Eles parecem se sobrepor muito.

Este trabalho computacional representa um avanço impressionante sobre o problema do dobramento de proteínas, um grande desafio da biologia há 50 anos. Tem ocorreu décadas antes que muitas pessoas no campo tivessem previsto. Será emocionante ver as muitas maneiras pelas quais isso mudará fundamentalmente a pesquisa biológica.

Alcançar esse sucesso inspirou-se na biologia, física e aprendizado de máquina, junto com os principais especialistas em estrutura de proteínas. A equipe construiu uma rede neural para abordar o desafio, resolvendo pequenos grupos de aminoácidos e usando métodos de aprendizado profundo para explorar como eles podem se unir. Mesmo assim, o concurso CASP usa proteínas relativamente simples chamadas domínios. AlphaFold tem mais dificuldade em descobrir proteínas que interagem. Nature News diz,

A rede também luta para modelar estruturas individuais em complexos de proteínas, ou grupos, em que interações com outras proteínas distorcem suas formas.

No entanto, o sucesso representa “um salto gigantesco” que “mudará tudo”, escreve Ewen Callaway. De que maneiras? John Moult, um professor da Universidade de Maryland que cofundou o CASP, explica em O cientista,

Isso mudará a medicina. Isso mudará a pesquisa. Isso mudará a bioengenharia. Vai mudar tudo, ”Andrei Lupas, um biólogo evolucionário do Instituto Max Planck de Biologia do Desenvolvimento na Alemanha que ajudou a julgar o concurso, disse Natureza, acrescentando que AlphaFold levou apenas 30 minutos para produzir a estrutura de uma proteína que seu laboratório vinha tentando descobrir por 10 anos.

Escrevendo em Ciência Magazine, Robert F. Service acrescenta,

Conhecer essas formas ajuda os pesquisadores inventar drogas que pode se alojar em proteínas e fendas. E ser capaz de sintetizar proteínas com uma estrutura desejada poderia acelerar o desenvolvimento de enzimas para fazer biocombustíveis e degradar resíduos de plástico.


Introdução

Os psicrófilos (literalmente, organismos que amam o frio) são principalmente microorganismos que prosperam em ambientes permanentemente frios e até mesmo em temperaturas abaixo de zero em água líquida super-resfriada. Essas condições extremamente frias são encontradas, por exemplo, em criopegs salgados a −10 ° C no permafrost (Gilichinsky et al., 2005) ou nos veios de salmoura entre os cristais de gelo marinho polar a −20 ° C (Deming, 2002). Microbiótopos incomuns também foram descritos, como rochas porosas nos vales secos da Antártica hospedando comunidades microbianas que sobrevivem a -60 ° C (Friedmann, 1982 Cary et al., 2010). Esses organismos não apenas sobrevivem ou suportam essas condições extremamente inóspitas, mas são irreversivelmente adaptados a esses ambientes, pois a maioria dos psicrófilos é incapaz de crescer em temperaturas amenas (ou mesofílicas). É freqüentemente esquecido que a maioria (& gt 80%) da biosfera da Terra é fria e permanentemente exposta a temperaturas abaixo de 5 ° C (Rodrigues e Tiedje, 2008). Essa baixa temperatura média decorre principalmente do fato de ∼70% da superfície da Terra ser coberta por oceanos que têm uma temperatura constante de 4 ° C abaixo de 1000 m de profundidade, independentemente da latitude. As regiões polares respondem por outros 15%, aos quais se somam as regiões glaciar e alpinas, além do permafrost que representa mais de 20% dos solos terrestres (Cowan et al., 2007 Margesin et al., 2008). Todos esses biótopos de baixa temperatura foram colonizados com sucesso por organismos adaptados ao frio, que incluem uma grande variedade de representantes de todos os três domínios: Bactérias, Archaea e Eukarya. Como resultado, os psicrófilos são os extremófilos mais abundantes em termos de biomassa, diversidade e distribuição.

A vida em ambientes frios requer uma vasta gama de recursos adaptativos em quase todos os níveis da arquitetura e função da célula. Na verdade, o frio exerce restrições físico-químicas severas sobre os organismos vivos, incluindo aumento da viscosidade da água, diminuição das taxas de difusão molecular, redução das taxas de reação bioquímica, perturbação de interações fracas que conduzem ao reconhecimento e interação molecular, fortalecimento de ligações de hidrogênio que, por exemplo, estabilizam estruturas de ácido nucleico inibitórias, aumento da solubilidade dos gases e estabilidade dos metabólitos tóxicos, bem como redução da fluidez das membranas celulares (D'Amico et al., 2006 Gerday e Glansdorff, 2007 Margesin et al., 2008 Rodrigues e Tiedje, 2008). Estudos anteriores de psicrófilos em nível molecular focaram principalmente em enzimas ativas a frio e na manutenção da fluidez da membrana, porque ambos os processos eram considerados pré-requisitos para a adaptação ambiental. Foi demonstrado que o alto nível de atividade específica em baixas temperaturas de enzimas adaptadas ao frio é uma adaptação chave para compensar a diminuição exponencial nas taxas de reação química à medida que a temperatura é reduzida. Essa alta atividade biocatalítica surge do desaparecimento de várias interações estabilizadoras não covalentes, resultando em uma melhor flexibilidade da conformação da enzima (Feller e Gerday, 2003 Siddiqui e Cavicchioli, 2006 Feller, 2010). Deve-se notar que esta característica adaptativa é geneticamente codificada dentro da sequência da proteína e resulta de uma adaptação de longo prazo. Considerando que as estruturas da membrana são enrijecidas em condições de frio, uma fluidez adequada é necessária para preservar a integridade de suas funções fisiológicas. Esta homeoviscosidade é alcançada por obstáculos estéricos introduzidos na bicamada lipídica por meio da incorporação de cis-insaturados e lipídios de cadeia ramificada, uma diminuição no comprimento médio da cadeia e um aumento na ramificação de metila e na proporção de anteiso- para iso-branching (Russell, 2007). Essa adaptação envolve a regulação de vias biossintéticas pré-existentes. Mais recentemente, vários genomas de bactérias psicrofílicas e Archaea foram sequenciados (Casanueva et al., 2010), mas apenas alguns deles foram analisados ​​no que diz respeito à adaptação ao frio (Saunders et al., 2003 Rabus et al., 2004 Medigue et al., 2005 Methe et al., 2005 Duchaud et al., 2007 Riley et al., 2008 Rodrigues et al., 2008 Allen et al., 2009 Ayala-del-Rio et al., 2010). Estudos proteômicos e transcriptômicos de microrganismos adaptados ao frio também têm sido usados ​​para pesquisar funções celulares que são estimuladas para o crescimento no frio (Goodchild et al., 2004 2005 Qiu et al., Bakermans 2006 et al., Kawamoto 2007 et al., 2007 Zheng et al., 2007 Bergholz et al., 2009 Campanaro et al., 2011 Ting et al., 2010 Williams et al., 2010 ).

Por muitos anos, a síntese de proteínas e o enovelamento de proteínas foram considerados processos celulares sensíveis à temperatura que restringem severamente o crescimento microbiano em baixa temperatura na ausência de adaptações específicas. Apesar dessa limitação bem conhecida, o desafio da síntese e do enovelamento de proteínas em psicrófilos foi abordado apenas recentemente, principalmente por meio de genômica e proteômica. As várias tecnologias 'ômicas' (Casanueva et al., 2010) produziram uma grande quantidade de dados. Isso, no entanto, impediu uma análise precisa do problema de dobramento de proteínas, que é fundamental para a adaptação ao frio microbiano. Esperamos fornecer aqui um levantamento abrangente e integrado deste tópico (ou seja, os fatos), a fim de destacar algumas questões atuais e sugerir caminhos futuros para estudo na área.


Materiais e métodos SI

Detalhes adicionais para previsão de termostabilidade de proteínas.

As expressões de Dill e Oobatake para previsão de termoestabilidade de proteínas são detalhadas abaixo.

A expressão de Dill (21) é formulada com base em evidências experimentais abundantes e estudos teóricos que mostram quantidades térmicas como entalpia Δ H, entropia Δ S e Δ C p, todas dependem principalmente do número de aminoácidos na proteína. Essas dependências lineares são bem ajustadas para as 59 proteínas mesófilas pelas expressões de ref. 21 Δ G (N, T) = Δ H (T h, N) + Δ C p (N) (T - T h) - T Δ S (T s, N) - T Δ C p (N) ln ( T / T s) [S1] Δ H (T = T h, N) = (4,0 N + 143) k J / mol Δ S (T = T s, N) = (13,27 N + 448) J / (mol ⋅ K) Δ C p (N) = (0,048 N + 0,85) k J / (mol ⋅ K), [S2] onde as duas temperaturas de referência são tomadas como sendo T h = 373,5 K e T s = 385 K.

O método de Oobatake (46) avalia a energia livre de desdobramento empiricamente contra valores experimentais com base nas suposições de que (eu) os dados termodinâmicos de cada grupo funcional são proporcionais à área de superfície acessível ao solvente do próprio grupo químico e (ii) a energia livre de desdobramento de uma proteína é a soma das contribuições de todos os grupos individuais. Depois de ajustar as contribuições termodinâmicas de cada tipo de aminoácido usando informações de estrutura disponíveis do banco de dados PDB, a energia livre de desdobramento de uma proteína pode ser prevista a partir da soma ponderada das contribuições de sua sequência de aminoácidos diretamente na temperatura de referência (T0 = 25 ° C). Para todas as outras temperaturas, Δ G (T) = Δ H (T 0) + Δ C p (T - T 0) - T Δ S (T 0) - T Δ C pln (T / T 0), assumindo Δ C p é independente da temperatura.

Detalhes adicionais para reconstrução do modelo.

O FoldME é reconstruído com três vias básicas: a via de dobra espontânea, a via de dobra assistida por DnaK e a via de dobra mediada por GroEL / ES. Todas as três vias são ativadas para cada proteína elegível no modelo, levando a um grande aumento no número de reações do modelo. Ao mesmo tempo, essa redundância da rede oferece grande flexibilidade nas respostas do proteoma e crescimento robusto da célula em ambientes variáveis. As reações elementares para cada via são representadas na Fig. 1UMA, e detalhes adicionais para as reações de dobramento assistido por chaperone são explicados abaixo.

O fluxo da via de dobramento espontâneo é, por definição, escrito como V f o l d i n g = k f (T) [U] e q, onde [U] e q é a abundância celular de equilíbrio da proteína não dobrada. A diluição do peptídeo não dobrado devido ao crescimento é definida por V d i l u t i o n = μ [U] e q, onde μ é a taxa de crescimento. Como [U] eq depende da estabilidade da proteína de acordo com a lei de Boltzmann, [U] eq [P] total = K eq (T) 1 + K eq (T), capturamos a mudança dependente da temperatura na fração desdobrada individual proteínas usando a restrição de acoplamento V diluição V dobramento ≥ μ kf (T) + K eq (T). [S3] Dobramento assistido por DnaK foi estudado extensivamente devido à sua variedade de funções e papel central na manutenção da proteostase celular (18, 28). No E. coli, DnaK se liga e libera o peptídeo substrato ao alternar entre o estado ligado a ATP de baixa afinidade e o estado ligado a ADP de alta afinidade, que é controlado por sua cochaperona DnaJ e o fator de troca de nucleotídeos GrpE. Denotamos o ciclo de reação com três etapas básicas (Fig. 1UMA): (eu) Substrato mediado por DnaJ ligando-se a DnaK (V K 1), (ii) Hidrólise de ATP estimulada por DnaJ e mudança conformacional do estado ligado a ATP para ADP do complexo de peptídeo DnaK ⋅ (V K 2), e (iii) Troca de nucleotídeos induzida por GrpE e subsequente liberação de substrato. As taxas de reação aparentes medidas a partir da cinética em tempo real (29) são usadas para restringir V K 1 (0,04 s - 1) e V K 2 (1,0 s - 1), respectivamente.

A terceira etapa é então duplicada em duas reações equivalentes, representando um evento de dobramento bem-sucedido assistido por DnaK (V K 3) e um ciclo de interação DnaK infrutífero que libera o peptídeo desdobrado (V K 3 ′). Este par de reações de dobramento duplicado é projetado para refletir o fato de que um único ciclo de ligação da chaperona geralmente não é suficiente para reparar totalmente a proteína doente. Tanto para HSP70 (31) quanto para o sistema chaperonina (32), ciclos repetidos de liberação completa e religação do peptídeo mostraram ser necessários para que o substrato atinja seu estado ativo. A ideia de um par de reações de dobramento duplicado foi aplicada anteriormente para construir um modelo cinético de HSP70 (11). O modelo mostrou que a HSP70 dobra a luciferase do vaga-lume com um fator de probabilidade de 2,68% em qualquer ciclo, ou seja, uma média de 38 ciclos para redobramento bem-sucedido. O autor sugeriu que esta probabilidade de redobramento deve ser um “parâmetro característico dependendo da natureza do substrato, sua sequência, dobra e paisagem de energia para dobrar” (ref. 11, p. 502). Tentamos capturar essa característica específica da proteína com algumas suposições intuitivas: (eu) Para proteínas estáveis, cada ciclo de ligação da chaperona pode fixar uma sequência propensa à agregação no peptídeo desdobrado, de modo que o número máximo de ciclos de ligação da chaperona para dobrar um peptídeo seja igual ao seu agg (ii) para peptídeos instáveis, cada agg O ciclo do ciclo de ligação da chaperona pode dobrar o peptídeo com uma probabilidade igual à sua fração de proteína nativa no equilíbrio P N = 1 / (1 + K e q). Tomados em conjunto, o número total de ciclos de ligação da chaperona necessários para dobrar uma proteína média é agg ⋅ (1 + K e ⁢ q) , resultando nas seguintes restrições de acoplamento entre os fluxos deste par de reações: V K 3 ⋅ a g g ⋅ (1 + K e q (T)) ≤ V K 3 ′. [S4] Considerando que a maioria das proteínas são marginalmente estáveis ​​(0 & lt K e q & lt 1) e seus aggs variam entre 0 e 28, o número de ciclos de ligação da chaperona necessários deve ser comparável ao estimado para a luciferase do pirilampo na ref. 11 e para clientes GroEL classe I – III na ref. 33. Portanto, consideramos que nossa formulação reflete amplamente a quantidade fisiológica de acompanhantes necessária no dobramento in vivo.

A dobra mediada por GroEL / ES é descrita com três etapas básicas (12): (eu) ligação do peptídeo não dobrado e ATPs e, em seguida, GroES para encapsular o anel GroEL (ii) Hidrólise de ATP que induz mais mudanças conformacionais e permite que o peptídeo se dobre dentro da gaiola e (iii) liberação de GroES, moléculas de ADP e o peptídeo contido em seu interior. Ao contrário do dobramento assistido por DnaK, onde a liberação de substrato é a etapa limitadora da taxa, a hidrólise de ATP é medida para ser de uma a três ordens de magnitude mais lenta do que as outras reações elementares no ciclo de dobramento mediado por GroEL / ES (30). Nós restringimos o fluxo através do ciclo de reação de dobramento mediado por GroEL / ES, usando a taxa de hidrólise de ATP medida experimentalmente de 0,12 s - 1. Da mesma forma, a terceira etapa é duplicada para produzir o peptídeo não dobrado ou a enzima nativa.

A cavidade GroEL / ES fechada fornece um ambiente hidrofóbico isolado com superfície carregada negativamente que pode mudar o cenário de energia da proteína e, assim, aumentar a taxa de dobramento. Proteínas com peso molecular ≤ 60 kDa podem ser totalmente encapsuladas e podem se dobrar livremente dentro da gaiola até que todos os sete ATPs sejam hidrolisados ​​e a tampa GroES seja liberada. Este processo deve facilitar o dobramento com muito mais eficiência do que o acompanhante DnaK. No entanto, sem informações adequadas para comparar os dois sistemas chaperones, agora usamos um único fator de escala (propensão _ escala) para acoplar as reações duplicadas VG 3 e VG 3 ′: VG 3 ⋅ agg ⋅ propensão _ escala ⋅ (1 + K eq (T)) ≤ VG 3 ′. [S5] p rop e n s i t y _ s c a l i n g é definido como 0,45 em FoldME, de modo que os processos de dobra assistidos por DnaK e mediados por GroEL / ES consumam a mesma quantidade de ATPs para cada evento de dobra bem-sucedido. Este parâmetro foi variado de 0,1 a 1 em uma série de simulações, não dando nenhuma mudança óbvia da previsão fenotípica.

Comparação entre Predição de Modelo com e Sem Chaperones Moleculares.

A rede de acompanhantes mantém o nível celular da fração desdobrada total do proteoma. Sem acompanhantes no modelo, as simulações não mostram nenhum crescimento da célula. Portanto, nós amostramos independentemente a taxa de dobramento cinético e termoestabilidade para cada proteína nas simulações. Como resultado, observamos uma anticorrelação entre as taxas de crescimento simuladas e a fração desdobrada total do proteoma (Fig. S1B) Com os acompanhantes funcionando na rede projetada, a fração desdobrada total é mantida em um nível baixo entre 0,1% e 1%, independentemente de como a taxa de crescimento muda com a temperatura.

Consumo de energia das reações de dobramento assistidas por acompanhantes.

A necessidade de energia do dobramento assistido por chaperone é explicitamente explicada na forma de reações de hidrólise de ATP (Fig. 1UMA) O dobramento assistido por DnaK consome uma molécula de ATP por ciclo, e o dobramento assistido por GroEL / ES consome sete. O número de ciclos de ligação da chaperona necessários para dobrar uma proteína está relacionado às propriedades termodinâmicas da proteína em questão. Portanto, o custo de energia do dobramento assistido por um acompanhante aumenta à medida que a propensão de agregação da proteína aumenta e / ou sua estabilidade diminui.

Para ter uma ideia aproximada do custo total de energia do dobramento assistido por chaperone em uma célula em crescimento, comparamos o consumo total de ATP no dobramento assistido por DnaK e GroEL / ES com o consumo de GTP na translação (Fig. S1C) Considerando que a hidrólise de GTP e ATP é aproximadamente energeticamente equivalente, estimamos que o dobramento assistido por chaperonas consuma cerca de 1,6% da energia consumida pela translação na temperatura fisiológica de 37 ° C. Este número aumenta dramaticamente para ∼ 38% a 45 ° C. Argumentamos que o custo de energia da atividade da chaperona modula o crescimento celular em dois aspectos: (eu) O custo relativo da energia entre os diferentes sistemas de chaperones adiciona outra complicação à partição da carga de dobramento do proteoma e (ii) a energia total envolvida no dobramento da proteína é uma quantidade significativa de recurso celular a ser otimizado para adaptação a altas temperaturas. No entanto, não encontramos uma medida experimental direta para validar esta estimativa.

Comparação de Expressão Gênica Diferencial Sob Temperatura e Perturbações Genéticas.

Em taxas de crescimento semelhantes, o desdobramento de tensões induzidas por mutações genéticas e por um choque de calor, ambos exibem uma expressão tendenciosa para as proteínas mais abundantes, enquanto o choque de calor causa maiores variações gerais. Muitas vias de biossíntese de cofator que são identificadas como termossensíveis em Chang et al. (26) (por exemplo, flavina, heme) são regulados negativamente de forma consistente. No entanto, o esquema de alocação de proteoma a ser adotado para qualquer condição particular pode ser difícil de prever sem essa simulação de rede multinível. Por exemplo, a composição do proteoma do mutante DHFR compartilha algumas características com a célula evoluída para crescer a 30 ° C, onde o estresse de desdobramento é baixo. Entre muitos outros, os transportadores de íons e o complexo de clivagem de glicina são regulados negativamente em ambas as condições e a via de biossíntese de desoxirribonucleotídeo da pirimidina é regulada positivamente em ambas as condições. Em outro exemplo, grupos semelhantes de genes são regulados negativamente em resposta a tensões de desdobramento induzidas por alta temperatura (46 ° C) e a mutação DHFR desestabilizadora (I91L + W133V). No entanto, os genes responsáveis ​​pela biossíntese de heme e tetrapirrol são regulados positivamente a 46 ° C, mas regulados negativamente na última situação. A comparação apresentada aqui destaca a complexidade da resposta celular aos estresses de desdobramento genético e ambiental, indicando que uma investigação em nível de sistema é necessária para compreender o sistema de controle de qualidade da proteína e a rede de proteostase.

Efeito da Taxa de Rotatividade da Enzima na Predição do Modelo Vivo.

A taxa de renovação efetiva da enzima (k e f f) é fundamental para a nossa compreensão dos processos biológicos e fenômenos celulares. A versão atual do modelo FoldME herdou k e f f de ref. 24, onde assumimos que k e f f é proporcional à área de superfície acessível ao solvente da enzima (SASA). O k e f f escalado é centrado em uma eficiência enzimática mediana de 65 s - 1, consistente com os resultados relatados na ref. 54. Esta é, obviamente, uma primeira aproximação para estender a atribuição de eficiência enzimática in vivo na escala do genoma. Existem potencialmente duas maneiras de melhorar a atribuição de k e f f em tal modelo em escala de genoma. Em primeiro lugar, estudos em andamento sugerem que as taxas catalíticas máximas in vitro e in vivo geralmente coincidem (55), de modo que poderíamos usar taxas medidas experimentalmente sempre que necessário e possível. No FoldME, restringimos o dobramento assistido por chaperone com medições de cinética em tempo real, que diferem do k e f f em escala SASA por duas a três ordens de magnitude. Após esta correção, fomos capazes de reproduzir as concentrações fisiológicas corretas dos chaperones.

Em segundo lugar, a amostragem no espaço k e f f (56) é mostrada para melhorar as previsões do modelo por ajuste em grande escala para atingir distribuições de abundância de proteínas conhecidas. Infelizmente, a falta de dados proteômicos dependentes da temperatura e o tamanho do nosso modelo atualmente impedem uma amostragem eficiente sobre o grande número de valores. Além disso, o k e f f in vivo calculado a partir de simulações de amostragem representa o resultado de certa regulação (supostamente incluindo a regulação de dobramento), sem abordar o mecanismo subjacente dela. Por essas razões, ficamos com a primeira estimativa de princípio de k e f f conforme descrito acima, mas devemos estar cientes da incerteza envolvida nesta escolha. Na Fig. S7UMA, mostramos uma comparação entre as frações de massa de todas as proteínas com expressão prevista em meio mínimo M9 suplementado com glicose a 37 ° C. Para cerca de 70% dessas proteínas (dentro do círculo vermelho), a abundância se correlaciona bem com o valor experimental. A abundância dos 30% restantes de proteínas é predominantemente subestimada devido à superestimação do k e f f correspondente. Considerando que as proteínas do cliente chaperone são geralmente altamente expressas (Fig. S7B), o erro na abundância de proteínas provavelmente leva a uma subestimação da porção correspondente da necessidade de acompanhantes para dobrar.

Análise de sensibilidade da taxa de dobramento cinético.

Para garantir que as taxas cinéticas de dobramento calculadas são fisiologicamente relevantes no nível do proteoma, comparamos a distribuição da taxa de dobramento estimada usando o método Gromiha e dois outros algoritmos, o método Dill (21) e o método Ouyang (58). As distribuições da taxa de dobra cinética calculada a partir desses três métodos são mostradas na Fig. S8UMA. O método Gromiha fornece a maior taxa média de dobramento de proteínas (∼ 7,7 s - 1), enquanto os outros dois métodos predizem valores médios muito mais baixos (Dill ∼ 0,000466 s - 1 e Ouyang ∼ 0,188 s - 1). Também consideramos mais dois critérios para julgar a qualidade geral da previsão: (eu) Nenhuma proteína deve dobrar mais rápido do que 4 ns (linhas verdes tracejadas na Fig. S8UMA) conforme estimado pelo método de Ouyang e (ii) a maioria do proteoma deve dobrar dentro de um ciclo celular de crescimento lento E. coli (por exemplo, 1 h, linhas tracejadas vermelhas na Fig. S8UMA) Consequentemente, o método Gromiha prevê mais de 80% das dobras do proteoma dentro da escala de tempo "normal".

Em seguida, simulamos o crescimento celular com k f calculado usando os três métodos, respectivamente. A taxa de crescimento ao longo da temperatura segue a mesma tendência com cada uma das três formulações (Fig. S8B) O valor absoluto da taxa de crescimento difere em apenas ∼ 5% entre os métodos Dill e Gromiha, cujas taxas médias de dobramento estão separadas por cinco ordens de magnitude. Portanto, concluímos que a previsão da taxa de dobra cinética não afetará a previsão de crescimento significativamente. Em seguida, optamos por usar o método Gromiha, que fornece a distribuição da taxa de dobra mais significativa fisiologicamente.

Termostabilidade In Vivo vs. In Vitro.

A relação entre a termoestabilidade das proteínas e o crescimento celular é extremamente interligada. Por um lado, a resposta da célula à temperatura é dependente da distribuição de estabilidade de seu proteoma. Por outro lado, a estabilidade da proteína também é fortemente influenciada pelo complexo ambiente celular, incluindo e não se limitando a dobramento cotranslacional, interações de chaperonas, aglomeração molecular e interações intermoleculares. A complexidade envolvida aqui levantou uma questão prática sobre qual parâmetro termodinâmico, a estabilidade da proteína in vitro ou in vivo, é o mais apropriado para o nosso propósito de modelagem.

Os parâmetros de dobramento in vitro são empiricamente ajustados a partir de caracterizações bioquímicas da termodinâmica de proteínas em equilíbrio em uma solução diluída ideal. Essas quantidades foram estudadas para um grande número de proteínas em detalhes e são facilmente acessíveis. Portanto, construímos o modelo FoldME com base em previsões teóricas da termoestabilidade de proteínas in vitro. A caracterização in vivo da termodinâmica de proteínas tem sido extremamente difícil no nível do proteoma. Recentemente, Leuenberger et al. (57) desenvolveram uma estratégia proteômica estrutural de alto rendimento para medir a termoestabilidade da proteína em uma escala ampla do proteoma, permitindo uma primeira comparação entre a termoestabilidade da proteína in vitro e in vivo no nível do sistema. Como discutido acima, uma correlação um-para-um entre as temperaturas de fusão (Tm) da previsão teórica e o ensaio de termoestabilidade in vivo é obscurecida pelas diferenças nas condições experimentais para obter essas medições. No entanto, as distribuições de T m (Fig. S9UMA) mostram uma característica de dois picos muito semelhante (um em torno de 46-48 ° C e outro em torno de 56-58 ° C) para as 350 proteínas cuja termoestabilidade é determinada pelo método Oobatake em FoldME. Os valores médios de T m também estão próximos, 50,0 ° C e 53,1 ° C para predição teórica e ensaio in vivo, respectivamente. A principal discrepância reside na distribuição mais ampla de proteínas instáveis ​​das previsões teóricas. Isso provavelmente se deve ao fato de que, no ambiente celular, fatores como aglomeração e acompanhantes aumentam a estabilidade efetiva das proteínas menos estáveis, mas têm um efeito menor nas proteínas que já são estáveis ​​in vitro.

Explicamos ainda como as diferenças entre a termoestabilidade in vitro e in vivo podem afetar a reconstrução do modelo FoldME, usando as proteínas ribossomais como exemplo. As proteínas ribossomais são altamente carregadas positivamente e instáveis ​​em solução, a menos que estejam ligadas ao rRNA. Consequentemente, pode-se esperar que eles precisem de um acompanhante para dobrar, pelo menos antes de chegar ao ribossomo para a montagem. Consistentemente, 32 das 55 proteínas ribossômicas são observadas para interagir com DnaK no experimento (18). Por outro lado, em um ambiente celular, o ribossomo é extremamente estável como um complexo intacto, uma vez montado. Portanto, também é intuitivo ver as proteínas ribossomais aparecendo constantemente como as proteínas mais estáveis ​​no ensaio de termoestabilidade em toda a célula. Este exemplo mostra que a previsão teórica tende a superestimar a exigência de chaperone, ignorando a estabilização de complexos de proteínas, enquanto o ensaio in vivo a subestima ao ignorar vários aspectos dinâmicos durante o dobramento. Limitada pelo nosso conhecimento atual de dobramento de proteínas in vivo e disponibilidade de caracterizações experimentais quantitativas, a decisão de escolher a termoestabilidade in vitro ou in vivo para modelagem é obscura pela complexidade do ambiente celular e pode ser avaliada apenas em um caso a caso para um pequeno número de proteínas.

Sem perda de generalidade, continuamos usando previsões teóricas com base na termodinâmica de proteínas in vitro para avaliar a função do dobramento assistido por chaperonas no ambiente celular. We also list here a couple of practical limitations that prevent us from using the in vivo thermostability assay reported in Leuenberger et al. (57): (eu) The assay could not cover the full proteome currently. Para o E. coli cell, the assay is able to provide quantitative measurements for 2,416 peptides, mapped onto 729 unique proteins. Our model currently contains 1,554 protein-coding genes in total, among which only 485 have high-quality T m data from the experiment. (ii) Leuenberger et al. (57) reported only the T m and T 90 % values. It is not clear whether the Δ G ( T ) measurement is of equal high quality and can be extended to a larger temperature range. (iii) As discussed above, this in vivo thermostability assay is likely condition specific. Leuenberger et al. (57) has not provided information on whether or how much the thermo-profile of the proteome will change under different nutrient conditions. As experimental technique improves and our understanding of in vivo protein folding advances, additional descriptions of the thermodynamic parameters are expected to be incorporated to elaborate on model prediction.

Sampling Simulations and Sensitivity Analysis of Protein Thermostability.

Thermostability of the entire proteome was shown to affect cell growth significantly, especially at high temperatures. We investigated whether an (and which) individual protein’s stability may dominate phenotypic predictions by sampling the K e q value for each protein from the predicted (WT) distribution at 37 °C (Fig. S9B, green dashed line). The result of 400 such sampling simulations showed a broad distribution of growth rate centered on 0.305 h −1 , and none outcompeted the WT (Fig. S9C) As temperature increases, the distribution shifts to the right, showing that larger fractions of the proteome become unstable. None of the 100 samples drawn from the 45 °C distribution were calculated to be viable, although the stability distribution shift is moderate. Stability of individual proteins only weakly correlated with cellular growth, with a maximum absolute Pearson correlation lower than 0.2. We used stepwise multiple linear regressions (MLR) to narrow down 92 proteins whose stability fluctuations explain 71.5% of the variations in the simulated growth rate (Fig. S9D) With the chaperone network buffering a wide range of unfolding stresses, we no longer see single proteins or pathways limiting cell growth (26). Instead, the cell was able to survive under severe perturbations, unless a large number of proteins involved in growth-related essential functions such as RNA modification, ribosomal biogenesis, nucleotide biosynthesis, and tRNA charging failed to fold properly at the same time (Fig. S9E).

Simulated Growth Media.

The 21 nutrient conditions simulated using FoldME are listed below: 11 single-carbon source media [glucose, fumarate, hexanoate, L-serine, 2-(alpha-D-mannosyl)-D-glycerate, sn-glycero-3-phosphocholine, trehalose, xanthine, dAMP, IMP, UMP] 5 phosphorus source media (3′-AMP, dCMP, dIMP, N-acetyl-D-glucosamine 1-phosphate, glycerophosphoserine) 3 nitrogen source media (nitrate, putrescine, UMP) and 2 defined rich media both with supplementation of 20 aa and one of them with additional nucleotide including adenine, guanine, thymine, uracil, cytosine, adenosine, guanosine, thymidine, uridine, cytidine, AMP, GMP, IMP, UMP, and CMP.

Bacterial Strains and Growth Media.

E. coli K-12 MG1655 (ATCC 700926) was grown in minimal M9 medium supplemented with four nutrient mixtures: (eu) 0.2% (wt/vol) glucose (ii) 0.2% (wt/vol) thymidine (iii) 0.2% (wt/vol) glucose, with 50 mg/L of the 20 basic amino acids and (4) 0.2% glucose, plus the nutrient mixtures including 20 basic amino acids, adenine, guanine, cytosine, and thymine (50 mg/L each). Water bath circulation and heating were performed for selected temperatures from 25 °C to 45 °C. Two additional strains were used for comparison of cell growth using glucose or thymidine as a carbon source: strain 7 from a 37 °C adaptive laboratory evolution (ALE) experiment (59) and strain 8 from a 42 °C ALE experiment (5).

RT-PCR Measurements of Chaperone Expression Level.

Cells were grown in 250-mL flasks until reaching midlog phase (OD600 = 0.5) and then transferred in triplicate into fresh media and harvested at 42 °C and 37 °C. Samples were RNA stabilized with the RNAProtect Bacterial Reagent, and total RNA was isolated with the RNeasy mini kit (Qiagen). cDNA was prepared from the total RNA, cleaned up with QIAquick PCR purification kits (Qiagen), and then quantified for subsequent RT-PCR assays. To determine the primer efficiencies, we generated a standard curve using different amounts of genomic DNA instead of cDNA with fixed primer concentrations.


Prions of Yeast and Fungi

Chaperones and Prions

Chaperones of the Hsp40, Hsp70, and Hsp104 groups, as well as Hsp90 co-chaperones, have been found to be clearly involved in prion propagation. Millimolar concentrations of guanidine are known to cure each of the amyloid-based prions, and the mechanism of action of guanidine curing has been shown to be specific inhibition of Hsp104. It is believed that at least one function of these chaperones is to break large amyloid filaments into smaller ones which can then be distributed at cell division to both daughter cells and insure the inheritance of the prion. Overexpression of some chaperones cure yeast prions, perhaps by solubilizing the filaments or perhaps by binding to the ends of filaments and preventing their elongation with new monomers. There is considerable specificity in which chaperone is needed for which prion and which chaperone can cure which prion by overexpression. The detailed mechanisms of chaperone action on prions (and amyloids in general) remain to be elucidated, but it is clear that they play an important role in these phenomena ( Figure 4 ).

Figura 4. Chaperones and prions. Possible roles of chaperones in prion propagation are diagrammed.


The REFOLD database: a tool for the optimization of protein expression and refolding

A large proportion of proteins expressed in Escherichia coli form inclusion bodies and thus require renaturation to attain a functional conformation for analysis. In this process, identifying and optimizing the refolding conditions and methodology is often rate limiting. In order to address this problem, we have developed REFOLD, a web-accessible relational database containing the published methods employed in the refolding of recombinant proteins. Currently, REFOLD contains >300 entries, which are heavily annotated such that the database can be searched via multiple parameters. We anticipate that REFOLD will continue to grow and eventually become a powerful tool for the optimization of protein renaturation. REFOLD is freely available at http://refold.med.monash.edu.au.

Bonecos

Web-based query interface in REFOLD.…

Web-based query interface in REFOLD. ( UMA ) Both simple and advanced querying…

( UMA ) Typical results of a search. Data can be sorted on…

Data deposition form, split into…

Data deposition form, split into logical sections of protein (top), expression (middle) and…


Acknowledgements

We thank Marco Sessa for designing the graphics shown in Fig. 8, Ina Vorberg (DZNE, Bonn, Germany) for mouse L929 fibroblasts, Didier Villette (INRA, Toulouse, France) for RK13 cells, Roberto Chiesa (Mario Negri Institute in Milan, Italy) for RML brain homogenates and Dennis Burton (The Scripps Research Institute, La Jolla, CA) for D18-expressing CHO cells. The authors are grateful to the staff of the XRD1 beamline at Elettra (Trieste, Italy) for on-site assistance, and acknowledge a CINECA award under the ISCRA initiative, for the availability of high-performance computing resources and support. L.To. is supported by Fondazione Caritro (Bando Post Doc 2017) and Kennedy’s Disease Association (Research Grant 2018). Research of HCA was supported by the CJD Foundation, Inc. and the Alzheimer Forschung Initiative e.V. (AFI). J.R.R. was funded by a grant (BFU2017-86692-P) from the Spanish Ministry of Economy and Competitiveness, partially funded by FEDER funds. The work was also supported by grants from Fondazione Telethon and Provincia Autonoma di Trento to S.B. (TCP13007), from Fondazione Telethon to E.B. (TCP14009), and by a fellowship from Fondazione Telethon to G.S. S.B. and E.B. are Assistant Telethon Scientists at the Dulbecco Telethon Institute.


Resultados

Lon protease can be used to assess the translation-coupled folding status

To monitor the folding status in the translation-coupled folding assay, we chose Lon protease 16 from E. coli for the experiment after an initial screening. We first translated MetF, an extremely aggregation-prone protein, 6, 12 using the PURE system under chaperone-free conditions in the presence of Lon [Fig. 1(a)]. When Lon was added after the translation (post-translational addition), the total amount of MetF, which was mostly aggregated, was not significantly decreased under the tested conditions, indicating that Lon cannot degrade the protein aggregates after they are formed. In contrast, when Lon was included during the translation (co-translational inclusion), we observed a dose-dependent decrease in the total amount of MetF. These results show that the Lon-mediated degradation of MetF competes with the aggregate formation.

We translated two other proteins, dihydrofolate reductase (DHFR), with over 50% spontaneous folding, and MetK, a moderately aggregation-prone protein [Fig. 1(b)]. The band intensity of DHFR did not significantly change even with the co-translational inclusion of Lon, suggesting that the rapid folding of DHFR allows it to resist Lon. This result confirmed that Lon cannot degrade a folded protein. In contrast, the total amount of MetK was drastically reduced in the presence of Lon, indicating again that the Lon effect competes with the aggregate formation of MetK. After the centrifugation of the Lon-resistant MetK, approximately half of the MetK was soluble. The centrifugation assay revealed that the undegraded MetK was composed of two subfractions: the soluble folded protein (soluble and undegradative: Sol-Undeg) and the protein aggregate (aggregation-prone and undegradative: Agg-Undeg).

Based on the above results, the co-translational inclusion of Lon monitors the folding status of synthesized proteins. We can calculate the fraction of soluble and degradative proteins (Sol-Deg) by subtracting the Sol-Undeg fraction from the soluble fraction. Likewise, we defined the aggregation-prone and degradative fraction (Agg-Deg) o Sol-Deg fraction would be partially folded states that are sensitive to Lon. Since the proteins in the Agg-Undeg fraction quickly form protein aggregates and thus escape from Lon, the proteins in the Agg-Deg fraction would be digested during the transition to the aggregate, reflecting the slower rate of aggregate formation. Taken together, the translation-coupled folding assay in the presence of Lon [Fig. 1(c)] reveals the subcategories of synthesized proteins in terms of the folding status.

Large-scale analysis of translation-coupled folding using the Lon-based assay under chaperone-free conditions

Next, we analyzed 89 randomly chosen proteins, using the chaperone-free PURE system in the presence of Lon during the translation. Among them, 76 proteins were evaluated for their folding efficiency and relative rate of the aggregate formation (Fig. 2). Most of the soluble fractions were resistant to the degradation by Lon (Sol-Undeg) [Figs. 2 and 3(a), S1(A)], although there were some exceptions such as MetK [Fig. 1(b)]. These results suggest that the proteins in the soluble fraction obtained under the chaperone-free conditions are mainly folded, or nearly folded, into the stable structure [Fig. 3(a)]. In contrast, the proportion of the Agg-Undeg fraction to the all aggregation-prone fraction was distributed widely, suggesting that the aggregate formation rates broadly differ among the proteins tested [Fig. 3(a)].

Statistical analyses were performed to investigate which properties of the proteins determine the rate of aggregate formation. The molecular weight and the deduced isoelectric point did not correlate with the proportion of the Agg-Undeg formation [Fig. S1(B)]. However, several differences were observed in the compositions of the amino acid residues [Fig. 3(b)]. The aromatic residue content (Phe, Tyr, and Trp) showed a negative correlation [Fig. 3(b)]. In contrast, the contents of residues with positive charges (Lys, Arg, and His) and hydrophobic residues (Val, Leu, and Ile) correlated positively with this proportion, although the correlations of these two properties were neither strong nor significant [Fig. 3(b)]. These results suggest that the amino acid composition influences the rate of aggregate formation to a certain degree.

Lon-based assay reveals differences in chaperone effects

Two E. coli chaperone sets, GroEL/GroES (GroEL/ES) 3, 17 and DnaK/DnaJ/GrpE (DnaKJE), 3, 18, 19 globally increase the solubility of aggregation-prone proteins in the PURE system-based folding assay. 8 The increased supernatant fraction does not always mean that the protein has adopted the native state. Indeed, we previously observed that DnaKJE drastically improved the solubility of MetK, but did not increase the enzymatic activity, 12 suggesting that the protein in supernatant fraction solubilized by DnaKJE exist in a nonnative state. We applied the assay system using Lon to monitor the folding status of proteins translated by the PURE system. We translated DHFR and MetK in the presence of either GroEL/ES or DnaKJE, with or without Lon [Fig. 4(a)]. The soluble fraction of DHFR was slightly increased in the presence of both GroEL/ES and DnaKJE [Fig. 4(b)]. In the DnaKJE assistance, we found only a slight increase of the Sol-Deg fraction for DHFR [Fig. 4(b)], suggesting that some of the soluble fraction is in a nonnative state. The subfraction in the soluble fraction, revealed by Lon, was strikingly different in the folding of MetK. GroEL/ES contributed to the folding of MetK by increasing the Sol-Undeg fraction, while DnaKJE prevented the aggregate formation of MetK by drastically increasing the Sol-Deg fraction [Fig. 4(b)]. For MetK, the soluble fraction in the DnaKJE assistance would not adopt the native state. Instead, an unstructured form of MetK would be in the soluble fraction. These results with MetK are in good agreement with our previous observations that DnaKJE improved the solubility of MetK but could not recover its enzymatic activity, while GroEL/ES can both prevent the aggregate formation and restore its activity. 12

Chaperone effects on the translation-coupled folding of a variety of proteins

We next evaluated the translation-coupled chaperone-assisted protein folding for several dozens of proteins (Figs. 5 and S2). As expected, most proteins were solubilized by each chaperone in the absence of Lon [Fig. S3(A)]. In addition, the distribution of the proportion of the Sol-Undeg fraction in the presence of GroEL/ES was biased higher, whereas the proportion in the presence of DnaKJE was distributed widely [Figs. S2 and 6(a)]. These results suggest that GroEL/ES tends to protect against the degradation by Lon while facilitating substrates folding, while DnaKJE tends to assist the folding, exposing the substrates to the risk of degradation. Another plausible explanation is that the folding assistance by DnaKJE is simply slower than that by GroEL/ES.

To investigate the relationship between the chaperone effects and the various properties of proteins, we defined the proportion of the Sol-Undeg fraction as the effect of the chaperones and performed statistical analyses between them. The comparison of protein sizes, defined as molecular weights showed that the effect of DnaKJE tended to become weaker as the protein sizes increased [Fig. 6(b)]. In addition to the fact that DnaKJE tends to prefer larger proteins, as investigated in our previous report, 8 our observations suggest that DnaKJE can solubilize larger proteins but tends to have a weaker effect on the folding completion, although this might be a consequence of the simple property that larger proteins are generally more difficult to fold. Similarly, deduced isoelectric point showed a negative correlation with the effect of GroEL/ES [Fig. 6(b)], suggesting the biased preference of GroEL/ES, as mentioned in our previous report. 8 In addition, the hydrophobic residue content (Val, Leu, and Ile) correlated weakly but positively with both chaperone effects (although the correlation with the effect of GroEL/ES was not significant), suggesting that the hydrophobicity is one of the key factors for the chaperone-assisted folding by these two chaperones [Fig. 6(b)]. The higher hydrophobicity may lead to a stronger interaction with the chaperones, or facilitate the formation of the hydrophobic core for faster protein folding. The contents of other amino acids did not show such a significant correlation [Fig. S3(B)].


Resumo

Whereas the lipid bilayer determines the basic structure of biological membranes, proteins are responsible for most membrane functions, serving as specific receptors, enzymes, transport proteins, and so on. Many membrane proteins extend across the lipid bilayer. In some of these transmembrane proteins, the polypeptide chain crosses the bilayer as a single α helix (single-pass proteins). In others, including those responsible for the transmembrane transport of ions and other small water-soluble molecules, the polypeptide chain crosses the bilayer multiple times𠅎ither as a series of α helices or as a β sheet in the form of a closed barrel (multipass proteins). Other membrane-associated proteins do not span the bilayer but instead are attached to either side of the membrane. Many of these are bound by noncovalent interactions with transmembrane proteins, but others are bound via covalently attached lipid groups. Like the lipid molecules in the bilayer, many membrane proteins are able to diffuse rapidly in the plane of the membrane. However, cells have ways of immobilizing specific membrane proteins and of confining both membrane protein and lipid molecules to particular domains in a continuous lipid bilayer.

In the plasma membrane of all eucaryotic cells, most of the proteins exposed on the cell surface and some of the lipid molecules in the outer lipid monolayer have oligosaccharide chains covalently attached to them. Plasma membranes also contain integral proteoglycan molecules with surface-exposed polysaccharide chains. The resulting sugar coating is thought to protect the cell surface from mechanical and chemical damage. In addition, some of the oligosaccharide chains are recognized by cell-surface carbohydrate-binding proteins (lectins) that help mediate cell-cell adhesion events.


Assista o vídeo: Warszawa wykład Jan Białek O robotach, kontroli informacji, przyszłości (Janeiro 2022).