Em formação

Como determinar o fluxo real no modelo metabólico humano de uma linha celular?


O problema a ser resolvido é determinar quais são os valores de fluxo para as diferentes reações no modelo metabólico humano.

Pelo que eu entendi, uma boa maneira de fazer isso seria usar dados de expressão gênica para calcular um fluxo, mas não tenho certeza se isso é uma boa ideia ou se é mesmo possível. Não tenho muita certeza de qual é o processo correto para fazer isso.

Agradeço por qualquer ajuda ou sugestões!


Não sou especialista na área, mas quantificar a expressão gênica não é um problema simples, embora seja uma possibilidade.

Uma solução que sei que devo usar é o uso de marcadores radioativos. Veja, por exemplo, esta revisão e, particularmente, a seção "O ônibus espacial célula-célula do lactato", que pode fornecer alguns insights.

Isso pode incluir traçadores radioativos (como [14C] lactato), traçadores não radioativos (com [13C] ou [2H]), "medições de troca líquida" (eu realmente não sei o que isso significa aqui, talvez o tipo de cálculos de troca que eles apresentam aqui), e biópsias musculares (é então possível medir a concentração de metabólitos por reação enzimática ou espectrofotometria, por exemplo).


Resumo: Experimente uma das extensões do FBA que leve em consideração a regulação do gene, mas esteja ciente das limitações. Veja abaixo as referências.

Resposta longa:

Existem duas abordagens para estimar fluxos metabólicos internos: o (principalmente) experimental e o (principalmente) computacional. Digo principalmente porque, mesmo para a abordagem experimental, uma grande quantidade de computação precisa ser feita, e para a abordagem computacional, estudos experimentais devem ser consultados a fim de definir parâmetros de modelo realistas.

A determinação experimental de fluxos metabólicos internos foi centrada em torno da análise de fluxo metabólico 13C (13C-MFA) realizada através de experimentos de marcação de carbono, como mencionado acima. O 13C-MFA é complicado e caro, então há uma relativa falta de dados experimentais, e a maioria dos experimentos cobre apenas alguns fluxos quando comparados ao número de reações possíveis, normalmente vários milhares em modelos metabólicos em escala de genoma. No 13C-MFA, a maioria dos experimentos estima os fluxos em um modelo muito menor (por exemplo, o metabolismo central do carbono), evitando ou ignorando outras reações possíveis, e o conjunto de fluxos estimados varia entre os experimentos.

Modelos que são usados ​​em abordagens computacionais para análise de fluxo são normalmente maiores do que os modelos usados ​​em experimentos 13C-MFA e, portanto, geralmente não é possível determinar todos os fluxos apenas a partir de dados experimentais. Assim, uma abordagem chamada modelagem baseada em restrições (COBRA) é usada principalmente. A suposição básica da maioria dos métodos de análise de fluxo atuais, tanto experimentais quanto computacionais, é que as concentrações de metabólitos estão em estado estacionário. Matematicamente, isso pode ser descrito pela equação

$ S overrightarrow v = 0 $

onde $ S $ é um matriz estequiométrica relacionando os metabólitos e todas as reações possíveis (basicamente uma descrição compacta do modelo metabólico), e $ overrightarrow v $ é o vetor de fluxo contendo todos os valores de fluxo. Além do requisito de estado estacionário, as restrições são normalmente aplicadas às taxas de absorção e excreção de vários metabólitos, limitando-os a valores biologicamente realistas. Outros requisitos, como requisitos para consumo de manutenção de ATP também podem ser aplicados.

Como normalmente existem muitos padrões de fluxo possíveis que obedecem às restrições acima, um princípio é necessário para selecionar uma solução biologicamente realista do espaço de solução de padrões de fluxo viáveis. Supondo que as células otimizem seus padrões metabólicos de alguma forma, de forma diferente funções objetivas são usados ​​para tentar capturar o comportamento metabólico das células. Uma vez que uma função objetivo é escolhida, o conjunto de soluções possíveis pode ser pesquisado para o padrão de fluxo que fornece o valor objetivo mais alto como uma função do vetor de fluxo. Dado que o objetivo é linear (simplesmente uma soma ponderada de fluxos), uma solução ótima pode ser encontrada rapidamente. Em geral, muitas soluções ótimas diferentes podem existir para uma determinada função objetivo. O método de aplicação de uma função objetivo a um modelo metabólico restrito em estado estacionário é chamado de Análise de Equilíbrio de Fluxo (FBA).

O objetivo mais básico e popular é a maximização da produção de biomassa. Embora seja útil para determinar as taxas máximas de crescimento, é improvável que esse objetivo seja realista quando aplicado a células humanas. FBA e métodos relacionados são geralmente adequados para determinar limites de desempenho para pontos finais únicos, como taxa de crescimento ou produção de um único metabólito, mas não é capaz de determinar com precisão todos os fluxos metabólicos internos. O ponto de que muitas soluções ótimas podem existir para uma única função objetivo é importante a este respeito.

Como 13C-MFA e FBA são baseados no mesmo conceito de balanceamento de metabólitos, eles podem ser vistos como extremidades diferentes do mesmo espectro, de puramente experimental a puramente computacional, com FBA restrito de 13C-MFA (onde os resultados de 13C-MFA são usados ​​para restringir os fluxos possíveis em um modelo antes de otimizar uma função objetivo, ou minimizar a diferença entre os fluxos experimentais e a solução FBA, sujeito a restrições adicionais) no meio.

Para uma introdução à Análise de Equilíbrio de Fluxo, consulte Orth, Thiele & Palsson: "O que é análise de equilíbrio de fluxo?" Nature Biotechnology 28 245-48 2010.

Para realizar a análise de equilíbrio de fluxo, vários pacotes de software estão disponíveis. Um dos mais usados ​​é o COBRA Toolbox for Matlab. Uma versão para Python chamada CobraPy também está em desenvolvimento. Ambos estão disponíveis em http://opencobra.sourceforge.net/openCOBRA/Welcome.html

Observe que a maioria dos dados de expressão gênica mostra apenas mudanças relativas na expressão entre duas condições. A maioria dos métodos é, portanto, baseada na comparação de duas condições diferentes. Mais recentemente, o sequenciamento de RNA (RNAseq) também pode ser usado para obter medidas mais diretas dos níveis de expressão gênica. Muitas extensões e variações do FBA foram publicadas, levando em consideração a expressão gênica. Alguns deles são FBA regulamentares (rFBA, Covert & Palsson: Journal of Biological Chemistry, 2002 277, 28058-28064), Ajuste metabólico por expressão diferencial (MADE, Jensen & Papin: Bioinformática. 15 de fevereiro de 2011; 27 (4): 541-7 ) e iMAT (Schlomi et al: Bioinformática (2010) 26 (24): 3140-3142.). Para um método mais recente, gx-FBA (expressão gênica-FBA), consulte * Navid & Almaas, BMC Systems Biology 2012, 6: 150).

Você também pode querer ler este artigo que lida com modelos metabólicos específicos de tecido de construção: Reconstrução computacional de modelos metabólicos específicos de tecido: aplicação ao metabolismo hepático humano. Mol Syst Biol. 7 de setembro de 2010; 6: 401. doi: 10.1038 / msb.2010.56.

O problema com o uso de FBA e métodos relacionados para estimar fluxos internos é que a validação dos resultados é difícil devido à mencionada falta de dados experimentais. Escrevi um relatório de projeto sobre o tema durante o último ano do meu mestrado, que inclui uma descrição básica do 13C-MFA. Ele pode ser lido em http://www.slideshare.net/jarlemag/rapport-31295058


Você não pode usar a expressão gênica para estimar fluxos. As razões são as seguintes. A expressão do gene determina os níveis de mRNA que, por sua vez, determinam os níveis de enzimas. No entanto, a relação entre a expressão do gene e o nível da enzima não é linear. Seu maior problema, entretanto, é que os fluxos são propriedades dependentes do sistema e não dependem de nenhuma enzima. Um fluxo é, em princípio, uma função de todas as propriedades cinéticas de cada enzima na via. A única maneira de obter os fluxos é por medição direta ou usando FBA ou modelos cinéticos.


Inibidores da succinato desidrogenase: em sílico análise de fluxo e na Vivo as investigações metabolômicas não mostram consequências metabólicas graves para ratos e humanos

a modelagem metabólica mostra robustez do metabolismo dos mamíferos em relação à inibição de SDH.

metabolômica plasmática in vivo realizada com fungicidas SDHI boscalid & amp fluxapyroxad.

em sílico a comparação não mostrou diferenças para rato e humano em relação à inibição de SDH.

Exposição SDHI: sem acúmulo de succinato / lactato em ratos, não esperado em humanos.


Inferindo o fluxo metabólico na pesquisa do câncer

O metabolismo celular é um sistema dinâmico no qual os nutrientes metabólicos são constantemente consumidos e catabolizados para gerar energia (Fig. 1a). As células cancerosas em proliferação ativam ainda mais as vias anabólicas para produzir precursores metabólicos para a síntese de macromoléculas, incluindo DNA, RNA, proteínas e lipídios [1, 2]. Isso é facilitado por meio de uma rede metabólica complexa que consiste em milhares de reações bioquímicas [3, 4]. A dinâmica do metabolismo pode ser descrita em termos da taxa de reações metabólicas, normalmente referida como fluxo metabólico (denotando a taxa de transformação de um substrato em metabólitos de produto em unidades de moles por unidade de tempo por célula). Um dos principais objetivos da pesquisa metabólica do câncer é entender como o fluxo metabólico é reconectado por tumores para dar suporte às demandas energéticas e biossintéticas [5, 6]. Compreender as alterações específicas do tumor no fluxo metabólico facilita a identificação da dependência induzida de enzimas específicas, cuja inibição farmacológica visa seletivamente as células cancerosas [7].

O fluxo metabólico descreve a dinâmica do metabolismo celular. uma Os nutrientes metabólicos são constantemente consumidos e metabolizados para gerar energia e sintetizar biomassa para apoiar a replicação celular. b Fluxos metabólicos fornecem uma visão direta do fenótipo metabólico celular que não é facilmente evidente por tecnologias "ômicas" amplamente acessíveis

Uma das principais complicações na pesquisa metabólica do câncer é que, ao contrário da concentração de mRNA, proteínas e metabólitos, o fluxo metabólico, que reflete o fenótipo metabólico celular, não é uma quantidade mensurável diretamente (Fig. 1b). No entanto, pode ser inferido por meio de uma combinação de técnicas experimentais e computacionais.

A abordagem mais direta para interrogar o fluxo metabólico intracelular em células cancerosas é o rastreamento de isótopos [8,9,10]. Isso funciona alimentando células cancerosas com nutrientes marcados isotopicamente e medindo o padrão de marcação isotópica de metabólitos por meio de espectrometria de massa ou ressonância magnética nuclear (NMR). Discutimos aqui a aplicação comum desta abordagem em células cancerosas cultivadas em cultura, embora também seja utilizada para estudos in vivo [11, 12]. O padrão de marcação isotópica de metabólitos é indicativo da contribuição relativa de diferentes vias para sua biossíntese. Enquanto uma inspeção manual das distribuições de isótopos metabólicos medidos facilita a avaliação qualitativa das atividades metabólicas, a interpretação computacional via 13C-Metabolic Flux Analysis (13C-MFA) permite ainda a inferência quantitativa de fluxos.

Outra abordagem de inferência de fluxo comumente usada é COnstraint-Based Reconstruction and Analysis (COBRA), permitindo a avaliação de fluxo por meio de redes metabólicas em escala de genoma. COBRA tem sido tradicionalmente utilizado para modelar o metabolismo microbiano para fins biotecnológicos e de bioengenharia [13,14,15]. As reconstruções mais recentes de modelos de rede metabólica humana em escala de genoma permitiram a aplicação dessa abordagem para modelagem em larga escala de tecidos normais e várias doenças humanas, incluindo câncer [3, 16,17,18,19]. O COBRA prevê fluxos em estado estacionário metabólico levando em consideração considerações físico-químicas, especificamente balanço de massa estequiométrico, exigindo que a produção total de metabólitos e as taxas de consumo sejam iguais em condições de estado estacionário. Uma característica importante do COBRA é sua capacidade de prever fluxo e religação metabólica, incorporando vários conjuntos de dados "ômicos", como transcriptômica, proteômica e metabolômica. Isso permite a previsão de fluxo para grandes coleções de linhas celulares e tumores por meio de conjuntos de dados genômicos e metabolômicos funcionais existentes, incluindo TCGA [20], NCI60 [21], CCLE [22,23,24] e Mapa de conectividade [25].

Aqui, fornecemos uma breve visão geral de como o COBRA e o 13C-MFA funcionam (os leitores são encaminhados a análises abrangentes sobre o COBRA [26] e o 13C-MFA [27] para obter mais informações técnicas), o uso recente dessas abordagens em estudos de pesquisa do câncer, e as limitações e desafios abertos com cada abordagem de inferência de fluxo.


Métodos

A estrutura matemática necessária para mapear a quantidade de droga para a resposta de crescimento coletivo do M. tuberculosis a bactéria exigia que conectássemos a cinética de inibição enzimática, a modelagem da rede metabólica e os modelos de crescimento da população bacteriana. Se esses componentes pudessem ser modelados e verificados por dados experimentais, poderíamos criar um sistema computacional para prever quantitativamente como os inibidores metabólicos afetam o crescimento bacteriano. Aqui, apresentamos a estrutura que nos permitiu gerar e reproduzir as curvas de dose-resposta de dois inibidores metabólicos gerados a partir de dois estudos experimentais independentes.

A estrutura matemática fornece a conexão entre a) como um inibidor específico afeta o (s) fluxo (s) de uma ou mais reações metabólicas [Modelo de Inibição] (as reações afetadas são referidas como reações alvo), b) como a mudança no fluxo de metabólitos ou o fluxo das reações alvo diminui a taxa de crescimento do organismo [Rede Metabólica] e, finalmente, c) como a taxa de crescimento reduzida resulta em uma concentração de células bacterianas mais baixa eficaz [Modelo de Crescimento Populacional]. A Figura 1 mostra esquematicamente esses três componentes e como eles se conectam e dependem um do outro. Com os modelos especificados e conectados conforme descrito na Figura 1, o procedimento computacional depende apenas da concentração do inibidor e do substrato inicial e das concentrações de células no meio sob o qual o organismo foi cultivado para calcular a concentração de células bacterianas subsequentes. Os detalhes que especificam o funcionamento interno de cada modelo são fornecidos abaixo.

Uma visão esquemática da estrutura para simular o efeito de um inibidor no crescimento bacteriano. Dada a concentração do inibidor [eu], o Modelo de Inibição descreve como o inibidor afeta o fluxo de reação da reação sendo inibida (ou seja, a reação alvo). Esses efeitos são modelados por meio de restrições explícitas no fluxo da reação alvo. Usando essas restrições e as restrições na taxa de absorção de substrato, analisamos a Rede Metabólica para inferir a taxa de crescimento de biomassa µ e taxa de absorção de substrato v C. Usando o Modelo de Crescimento Populacional, relacionamos a taxa de crescimento de biomassa µ e taxa de absorção de substrato v Cpara a concentração de células [X] Acoplamos dinamicamente a taxa de crescimento de biomassa e a concentração diminuída de substrato para desenvolver um modelo dependente do tempo que infere dinamicamente a concentração de células após a introdução de um inibidor. Uma vez que esses componentes do modelo foram especificados, junto com o substrato inicial [C0] e celular [X0] concentrações no meio de crescimento, os cálculos realizados dentro desta estrutura exigiram apenas entrada na forma de uma concentração de inibidor específica [eu] para prever o crescimento celular.

Modelo de inibição

o modelo de inibição é definido pela cinética de inibição da enzima que rege os reagentes e produtos de uma reação metabólica particular (isto é, a reação alvo) e relaciona a maneira pela qual a concentração do inibidor [eu] modifica ou adiciona restrição ao fluxo da reação alvo. A forma matemática do modelo de inibição depende da cinética enzimática particular associada ao inibidor específico e da reação metabólica afetada pelo inibidor. Matematicamente, o modelo de inibição relaciona uma concentração de inibidor [eu] para a razão de fluxo de metabólito resultante na presença e ausência do inibidor. Os inibidores que afetam mais de uma reação também podem ser considerados.

Rede metabólica

o rede metabólica é usado para calcular de forma autoconsistente a taxa geral de crescimento de biomassa µ, taxas de absorção de substrato v C, e os fluxos de todas as reações metabólicas. É acoplado ao modelo de inibição e a modelo de crescimento populacional. o modelo de inibição coloca restrições no fluxo das reações alvo na rede metabólica que afeta a taxa de crescimento de biomassa total, e o modelo de crescimento populacional adiciona restrições à taxa de captação de substrato da rede do meio. O efeito das deleções enzimáticas (mutantes de exclusão) no crescimento pode ser incorporado no modelo da rede metabólica pela remoção das reações específicas catalisadas pelas enzimas especificadas [22, 54].

A rede metabólica desenvolvida por Jamshidi e Palsson [42] para M. tuberculosis, iNJ 661, é capaz de reproduzir quantitativamente as taxas de crescimento observadas em várias condições diferentes. Utilizamos esta rede, com algumas modificações, como base para nosso trabalho (ver Arquivo Adicional 1: Seção S1) e verificamos que as modificações não afetaram a taxa de crescimento de M. tuberculosis, conforme relatado originalmente [42].

A taxa de crescimento da biomassa, as taxas de absorção do substrato e os fluxos de reação foram obtidos diretamente da rede metabólica pela aplicação do FBA [26]. Ao usar um método de programação linear, o FBA pode maximizar a taxa de crescimento de biomassa sujeita ao equilíbrio de massa em estado estacionário de todos os metabólitos intracelulares e as restrições estequiométricas definidas pelas reações. A maximização da taxa de crescimento da biomassa é baseada na suposição de que as bactérias maximizam seu crescimento durante o estágio exponencial e nas condições do estágio inicial estacionário. Esta suposição foi demonstrada por estudos anteriores para gerar resultados compatíveis com o experimento sob tais condições [25, 30]. Restrições adicionais que podem ser modeladas no FBA incluem a especificação de reações reversíveis e irreversíveis, bem como limites colocados na absorção de substrato e taxas de reação alvo. Aqui, o FBA foi executado com o COBRA Toolbox [55]. Também usamos o COBRA Toolbox para minimizar os fluxos de reação enquanto mantemos a taxa máxima de crescimento de biomassa calculada. Este procedimento nos permitiu obter um conjunto único de fluxos mínimos correspondentes ao fluxo mais parcimonioso de metabólitos através da rede [56-58]. Esses fluxos foram então usados ​​para restringir as taxas de reação alvo.

Modelo de crescimento populacional

Dada a taxa de crescimento da biomassa µ e as taxas de absorção de substrato v Cdefinido pela rede metabólica, o modelo de crescimento populacional fornece um mecanismo para calcular a célula [X] e substrato [C] concentrações no meio especificado. Este modelo considera mudanças nas concentrações de substrato ao longo do tempo, o que poderia ser usado para monitorar como diferentes fontes de carbono são preferencialmente utilizadas no processo metabólico [30].

Matematicamente, o modelo de crescimento populacional vincula a taxa de crescimento de biomassa µ para a concentração real de células [X] da bactéria em função do tempo t. Este processo deve considerar o esgotamento temporal do substrato limitante C no meio à medida que as células crescem, o que é dependente da taxa de absorção do substrato v Cpelas células. Como quanto mais células crescem, mais elas consomem o substrato limitante, representamos esse acoplamento por meio dos dois ODEs a seguir:

onde os colchetes [.] indicam a concentração de "." e [C] representa a concentração do substrato limitante C no meio. O fator 24 simplesmente converte o tempo t de horas a dias, uma vez que as unidades de µ e v Csão expressos, respectivamente, em h -1 e mmol / (h · gDW), ou seja, mmol por hora por grama de peso seco de M. tuberculosis. A Equação 1 não incluiu uma taxa de morte celular porque simulamos o crescimento bacteriano durante o estágio exponencial e condições do estágio inicial estacionário, onde o crescimento celular desempenha um papel mais dominante do que a morte celular. Estudos anteriores em condições de crescimento semelhantes, que também não incluíram explicitamente um termo de taxa de mortalidade, obtiveram resultados de simulação que eram consistentes com dados experimentais [25, 30].

A taxa de crescimento da biomassa µ e a taxa de absorção do substrato limitante v Csão determinados, para um determinado ponto de tempo, realizando um FBA da rede metabólica para uma determinada concentração de inibidor [eu] e uma restrição de limite superior na taxa de absorção de substrato limitante. Introduzimos formalmente uma notação para indicar a taxa de crescimento µ e a taxa de aceitação v Csaídas de um FBA de uma rede metabólica para um determinado conjunto de condições de entrada [eu] e como:

Empregamos o modelo cinético Michaelis-Menten [25] para estimar o limite superior da taxa de absorção do substrato:

Onde V mdenota a taxa inicial máxima de absorção de substrato e K mrepresenta a constante de taxa de Michaelis-Menten. Além disso, associamos a leitura experimental, neste caso a densidade óptica (OD) sob luz de comprimento de onda de 600 nm [46, 53], para a concentração de células [X] por:

onde K denota uma constante de proporcionalidade. Outras leituras experimentais podem ser consideradas de forma semelhante.

Análise de sensibilidade dos valores dos parâmetros

A presença de uma série de parâmetros em nossa estrutura matemática garantiu uma análise de sensibilidade de como os valores dos parâmetros atribuídos afetaram os resultados computacionais finais. Usamos duas métricas diferentes para verificar a sensibilidade do parâmetro. Na primeira análise, medimos a variação dos resultados configurando separadamente cada um dos valores dos parâmetros para limites inferior e superior razoáveis ​​[10], neste caso, ± 50% dos valores dos parâmetros escolhidos. Na segunda análise, calculamos o coeficiente de sensibilidade para cada um dos parâmetros. Este coeficiente fornece uma medida da dependência entre os resultados calculados e o parâmetro correspondente. Se OD representa a concentração de células expressa como densidade óptica sob luz de comprimento de onda de 600 nm e p representa o parâmetro analisado quanto à sensibilidade, o coeficiente de sensibilidade é definido como segue [59, 60]:

Outros observáveis, diferentes de OD, pode ser substituído na Eq. 6. Para calcular numericamente o coeficiente de sensibilidade para um parâmetro p, começamos de ∂p = +0.5p e repetiu o processo reduzindo ∂p e calcular o coeficiente de sensibilidade até convergir, ou seja, até valores sucessivos de ∂p rendeu o mesmo. Em seguida, repetimos o processo a partir de ∂p = -0.5p até a convergência. No cálculo aqui realizado, os dois processos convergiram para o mesmo valor numérico.

Para abordar os diferentes tipos de parâmetros em nossa estrutura, classificamos os parâmetros modelados em quatro grupos: grupo eu parâmetros incluídos obtidos na literatura, grupo II incluiu aqueles determinados por correspondência de dados experimentais, grupo III incluiu aqueles assumidos como derivados de outros parâmetros, e grupo IV incluídos aqueles que, por definição, foram determinados diretamente uma vez que os outros parâmetros foram definidos. Durante a análise de sensibilidade dos parâmetros em grupos eu, II, e III, calculamos as curvas de dose-resposta enquanto aumentamos e diminuímos cada parâmetro em 50% (exceto para aqueles cujos valores não podem exceder um) e coeficientes de sensibilidade abrangendo três ordens de magnitude na concentração do inibidor. Embora os parâmetros em grupo III foram assumidos como derivados dos parâmetros em grupos eu e II, durante a análise de sensibilidade para os primeiros dois grupos, mantivemos os valores dos parâmetros em grupo III fixo. Além disso, porque os parâmetros em grupo IV eram dependentes de outros parâmetros e seus valores mudaram à medida que realizamos a análise de sensibilidade sobre esses parâmetros independentes, não realizamos análise para este grupo.


Especificação do ambiente

Para usar um GEM para a previsão de fenótipos esperados, ou para a simulação de processos dinâmicos, deve-se definir a composição química do ambiente (Tabela 2). Estabelecer a lista de moléculas ambientalmente disponíveis é simples em experimentos laboratoriais simples, nos quais meios definidos com composição química conhecida são usados. Nesse contexto, bancos de dados como Media DB [62] ou KOMODO [63] catalogaram um grande número de meios definidos, facilitando muito a modelagem metabólica. Muitos experimentos de laboratório, no entanto, são realizados em meios indefinidos contendo ingredientes como “extrato de levedura” que não podem ser facilmente listados e quantificados. Na natureza, os micróbios freqüentemente existem em ambientes altamente complexos, onde as entradas químicas para o sistema são indefinidas, variam com o tempo e são alteradas por outros micróbios no ambiente. Além disso, não é suficiente conhecer a lista de compostos presentes no meio de cultivo, mas é preciso também saber a que taxas os compostos podem ser consumidos pelo organismo para definir adequadamente os limites das reações de absorção do modelo metabólico. Em princípio, a composição do ambiente pode ser determinada por meio de técnicas experimentais, como a exo-metabolômica, onde as medições de metabólitos no ambiente extracelular são usadas para inferir as taxas de absorção e secreção celular [64,65,66,67,68]. Esta abordagem pode fornecer informações valiosas para reduzir a incerteza na especificação do ambiente. No entanto, esses dados vêm com sua própria incerteza que deve ser tratada com cuidado [69]. Todos esses fatores levam a uma ampla gama de incertezas que surgem na especificação do ambiente para a análise de rede metabólica [70].

GEMs fornecem uma oportunidade para lidar com a incerteza associada a ambientes complexos. Os algoritmos de análise GEM, como FBA, são computacionalmente eficientes e podem, portanto, ser executados em um grande conjunto de ambientes para quantificar a sensibilidade dos fluxos simulados à composição de nutrientes. Vários estudos quantificaram essa sensibilidade identificando aspectos das previsões de GEM que são fortemente afetados ou robustos à variação na composição ambiental [71,72,73,74,75,76,77]. Descrever essa sensibilidade, ou robustez, fornece uma imagem mais clara de como a incerteza na especificação do ambiente pode, ou não, se propagar para previsões específicas de GEM. No início, a análise do plano de fase do fenótipo foi desenvolvida para mostrar o impacto na taxa de crescimento ideal de variação dos fluxos de dois recursos limitantes [71, 72]. Indo além dos pares de recursos, grandes conjuntos de nutrientes podem ser amostrados aleatoriamente para avaliar a variabilidade de todos os fluxos intracelulares. Por exemplo, Almaas et al. mostrado, usando uma curadoria bem feita Escherichia coli GEM, que a distribuição geral dos fluxos metabólicos é robusta à composição ambiental, no entanto, os fluxos específicos variam, com a maioria das variações discretas ocorrendo em um "backbone de alto fluxo" conectado de reações [73]. Trabalhos subsequentes destacaram a importância evolutiva de um núcleo ativo de reações que carregam fluxo em todos os ambientes [74]. Reed e Palsson demonstraram ainda que as reações com fluxos correlacionados entre ambientes são indicativas de estrutura reguladora da transcrição [75]. Esses estudos apontam para a natureza não trivial da sensibilidade das previsões GEM às especificações do ambiente. Além do contexto de organismos individuais, a análise GEM foi usada para demonstrar que variar o ambiente pode alterar a natureza das interações metabólicas entre organismos microbianos [78] e que certas variáveis ​​ambientais, como a presença de oxigênio, podem ter um impacto significativo sobre os tipos de interação que surgem [79]. Ambientes variáveis ​​podem impactar o metabolismo celular de fluxos de reação individuais até o nível de interações microbianas. Assim, em aplicações onde o ambiente é incerto, abordagens de conjunto ou probabilísticas são necessárias para capturar completamente os fenótipos potenciais.

Uma abordagem mais recente, inspirada no conceito de física estatística de percolação de rede, utiliza amostragem aleatória de composições de nutrientes para quantificar quais metabólitos podem ser produzidos de forma consistente por uma determinada rede metabólica em muitos ambientes [80]. Esta abordagem introduziu uma estrutura probabilística para representar os metabólitos de entrada de uma rede metabólica, o que poderia facilitar ainda mais a amostragem aleatória de conjuntos ambientais em métodos futuros. Embora a implementação atual desta estrutura faça uma amostra de todos os metabólitos ambientais com igual probabilidade, pode-se imaginar abordagens futuras que representem as incertezas ambientais com mais precisão, usando distribuições tendenciosas que incorporam qualquer conhecimento disponível. Essa abordagem preencheria a lacuna existente entre assumir um único ambiente conhecido e ambientes de amostragem aleatória de maneira uniforme. Além disso, a amostragem do ambiente pode ser usada para variar o fluxo (em FBA) ou as concentrações (em FBA dinâmico) de diferentes componentes ambientais, além de sua presença e ausência, para avaliar o impacto dessas quantidades nas propriedades da rede metabólica.

A especificação do ambiente para a análise GEM poderia ser melhorada usando métodos de "ecologia reversa" que visam inferir o ambiente nativo da estrutura da rede metabólica, seja por meio da otimização baseada em restrições [81,82,83] ou pela definição de metabólitos de "semente" que são necessários como entradas para uma rede metabólica e, portanto, são mais prováveis ​​de serem encontrados no ambiente natural do organismo [84, 85]. Uma vez que esses métodos utilizam a estrutura da rede metabólica para informar a especificação do ambiente, eles devem ser aplicados com cuidado, pois a incerteza na rede pode se propagar para a especificação do ambiente.


Discussão

Metabolismo em AGE1.HN

O metabolismo e as mudanças metabólicas da nova linha celular humana AGE1.HN foram analisados ​​quantitativamente neste estudo usando análise de fluxo metabólico resolvido no tempo e análise de fluxo metabólico estacionário em diferentes fases durante o cultivo em lote. Nossos resultados indicam que a captação de piruvato durante a fase 1 em combinação com altos níveis de outros substratos resultou em um fenótipo metabólico ineficiente caracterizado por metabolismo de transbordamento levando à formação de produtos residuais. Na fase 2, o metabolismo estava mudando para um estado mais eficiente caracterizado por baixas taxas de absorção de substrato e nenhuma formação de lactato. Os dados indicam que uma diminuição nos níveis de substrato ocorrendo durante o cultivo resultou em uma desaceleração da glicólise durante a fase 1. Experimentos adicionais usando diferentes concentrações de piruvato no meio sustentam a conclusão de que há uma forte ligação entre o piruvato no meio e a produção de lactato em AGE1.HN (os dados serão apresentados em outro lugar). Outra possibilidade seria que as células pudessem secretar lactato apenas até que uma determinada concentração fosse atingida e, então, interromperiam a produção. No entanto, em outros experimentos que foram realizados usando altas concentrações iniciais de lactato (cerca de 8 mM), foi observado que as células estavam produzindo quase a mesma quantidade de lactato que em experimentos onde a concentração inicial de lactato foi 0. Isso indica que a depleção de piruvato parece ser um fator importante para a cessação da produção de lactato. Este fenótipo particular até agora não foi observado em outras células de mamíferos [22, 23, 26, 41].

Durante o crescimento exponencial de células de mamíferos sob níveis de substrato não limitantes, a utilização de substrato ineficiente foi relatada para várias outras linhas de células de mamíferos [22, 23, 28, 42]. Normalmente, apenas uma pequena quantidade de piruvato intracelular está entrando no ciclo do TCA sob essas condições, o que é considerado muito desfavorável. Increasing flux through pyruvate dehydrogenase represents an optimization target for the cultivation of many mammalian cells, but the mechanisms and molecular reasons are still poorly understood [43, 44]. In a recent study on HEK-293, cells pyruvate dehydrogenase activity was reported to be around 22% of glycolytic activity [42]. Very low or even no activity of the pyruvate dehydrogenase complex was reported in other studies on different mammalian cells [23, 45]. In AGE1.HN cells, this was observed only during the first phase. During phases 2 and 3, pyruvate dehydrogenase activity was high. In MDCK cells it was found that an addition of pyruvate in a glutamine depleted medium resulted even in an increase in the flux from pyruvate into the TCA cycle [23]. In AGE1.HN, it seems that available pyruvate has an opposite effect triggering the conversion of pyruvate to lactate. High uptake rates of glucose and pyruvate as observed in phase 1 might lead to an increase of the intracellular pyruvate pool triggering overflow metabolism into lactate/alanine eventually resulting in an increased secretion of these waste metabolites. This might be changed by increasing reactions connecting TCA cycle and glycolysis, e.g., by stimulating pyruvate dehydrogenase and pyruvate carboxylase fluxes [46, 47]. However, the success of this strategy can not be predicted a priori. Increase of fluxes into the TCA cycle must be accompanied by an increase in oxidative phosphorylation activity which might not always be possible. Another strategy that is working in the opposite direction would be decreasing the substrate uptake rates, e.g., by knock down of transporters [48] or decreasing the lactate production, e.g., by knock down of lactate dehydrogenase [40].

Comparison of selected metabolic fluxes in AGE1.HN with those in other cells

Selected metabolic fluxes in AGE1.HN that were calculated by the stationary method for different phases are compared to fluxes published for other mammalian cells (Table 2). Glucose uptake and lactate production rates were generally lower in AGE1.HN than in other cells. Pyruvate represents an extracellular metabolite that was often neglected in other studies [26, 28]. However, as shown in this study and in MDCK cells [23, 49] or CHO cells [50], it is a very interesting metabolite that can induce huge changes in the metabolism. In AGE1.HN cells pyruvate uptake rate was by far lower than in MDCK cells that were grown in high pyruvate medium (Table 2, M2). However, the ratio of pyruvate uptake per glucose uptake was similar. The second phase in AGE1.HN showed a very efficient metabolism concerning substrate usage as already discussed before. The cells were proliferating without lactate production. Pyruvate dehydrogenase (PDH) activity was high. In all other cell lines, high lactate production was observed during the phases that were analyzed by MFA except for CHO cells in presence of galactose after glucose depletion. In order to reach higher cell densities in cultivations of AGE.HN, the second phase could be prolonged by feeding of glutamine. PDH activity in AGE1.HN was low in phase 1 and high in phases 2 and 3. A similar situation was observed in CHO cells [26] which exhibited low PDH activity and overflow metabolism during growth on glucose. After glucose depletion, these cells were consuming lactate in the presence of galactose having high PDH activity. No PDH activity was reported for MDCK cells in glutamine containing medium. In medium without glutamine and high pyruvate concentration low PDH activity was found in these cells. The absolute flux through PDH was highest in continuously cultured hybridoma cells [28], but the metabolism was by far not as efficient as in phase 2 of AGE1.HN since there was high glucose consumption and waste product formation. Absolute glutamate dehydrogenase (GDH) activity of AGE1.HN during phases 1 and 2 was lower than in other cell lines, but the relative activity compared to the glucose uptake rate was quite similar in MDCK and CHO cultures. Upper and lower TCA cycle activity in phases 2 and 3 was similar to the activity in CHO cells with glucose medium (S1 in Table 2) and in MDCK cells (M2 in Table 2) cultured without glutamine. For hybridoma cells, higher TCA cycle activity was reported.

The main differences between the metabolic phases of AGE1.HN are summarized in Fig. 7. The results indicate further targets for improving the metabolic phenotype of these cells to reach higher cell densities as well as to obtain a more efficient utilization of the nutrients. The high overflow metabolism in the beginning of the cultivation with channeling of pyruvate to lactate could be decreased. This could be accomplished by genetic engineering, e.g., deletion of lactate dehydrogenase [51] or introduction of pyruvate carboxylase [46], further medium optimization, e.g., reduced concentrations of pyruvate, or application of new feeding strategies [50]. The observed metabolism in phase 2 indicates the potential of this cell line to grow very efficiently having minimum formation of waste products and minimum energy spilling [52]. Therefore, it seems promising to change environmental conditions, i.e., media, substrate feeding as well as enzyme expression such as to approach the efficient metabolic state of phase 2 during a process. Studies on enzyme expression and detailed labelling experiments in combination with 13 C metabolic flux analysis would provide additional hints for the best way to further improve the cell line.

Summary of metabolic shifts during batch cultivation of AGE1.HN

Time resolved versus stationary flux analysis

The applied dynamic method is well suited to analyze and monitor metabolic shifts during the cultivation. Cell growth, cell size, extracellular as well as intracellular fluxes of mammalian cells in a cell culture process are highly dynamic which is caused by environmental changes. Therefore, the presented method that is considering the dynamics of all included metabolites and biomass is best suited to understand and finally model the process. Stationary metabolic flux analysis that was applied extensively in the past [23, 53] is only suited to describe the mean metabolism during a certain phase which is a significant disadvantage since changes during the phase considered are neglected [54]. However, if the pseudo steady state assumption during a phase is justified, it can give a useful overview of its average metabolism [55]. The information obtained by flux balance analysis can be validated [56] or further enriched by specific labelling information [57] to resolve reversible, cyclic or parallel fluxes as for example pentose phosphate pathway split [58, 59].


Informações de Apoio

S1 Fig

A) The electron micrographs of SARS-CoV-2 (Credit: NIAID-RML) B) Number of spike proteins calculated from intensity measurements of the micrograph along the circumference of the virus.

S2 Fig

The processed final model is used for differential flux analysis.

S3 Fig

The uptake rates were varied and a point optimization program was used to calculate the specific growth rate. The fitness change is reported as the ratio of specific growth rate under perturbation to the specific growth rate under normal uptake rate. All the uptake rates were negative.

S4 Fig

The coefficients of biomass precursors were varied by 널% taken one at a time and the specific growth rate was calculated by FBA.

S1 Dataset

The sheets in the dataset comprises of stepwise calculation of SARS-CoV-2 amino acid composition, nucleotide composition, carbohydrate and lipid composition. The last sheet comprises of the final viral biomass equation.

S2 Dataset

The description of each dataset within S2 Dataset are given in the first sheet.

S1 Text


1. INTRODUÇÃO

From its inception, classical biology has relied on reductionist principles. However, the actual nature of the cell, in which all components interact, demanded switching the previous paradigm to a holistic molecular approach, extending the scope of the analysis. These are the foundations that motivated the development of systems biology in the second half of the twentieth century. In particular, systems biology aims at studying the biological processes in terms of the cellular components and their interactions from a holistic molecular perspective ( Kitano, 2002 ).

Some of these components interact in the cellular metabolism, which comprises those biochemical reactions consuming and producing the smallest compounds of the cell, typically named metabolites. These reactions are close to be in thermodynamic equilibrium, requiring the presence of catalytic agents so as to achieve the appropriate rate of activity to sustain life. In most metabolic reactions, a set of proteins named enzymes act as catalysts. The conversion rate of the metabolic reactions is termed metabolic fluxes.

Metabolic reactions are organized into distinct functional modules, forming the so-called metabolic pathways. Some of these pathways have been experimentally reported and manually included in different databases ( Kanehisa et al. , 2012 Keseler et al. , 2011 ), as well as in biochemistry books ( Nelson and Cox, 2000 ), e.g. glycolysis, TCA cycle. However, metabolic pathways are not independent entities for example, the same enzyme or metabolite may appear in different pathways. For this reason, a most general analysis of metabolism requires the simultaneous consideration of different metabolic pathways. In the most extreme scenario, when all the known metabolic pathways are considered, the resulting set of enzymes and metabolites is referred to as genome-scale metabolic networks (GSMNs). The outbreak of different high-throughput experimental techniques has allowed us to increase the accuracy and size of GSMNs, in terms of metabolites, reactions and gene regulation. Currently, GSMNs for several organisms are publicly available through different online repositories ( Schellenberger et al. , 2010 ).

The inherent complexity of GSMNs does not make it possible to perform a manual analysis per se. Different computational strategies have been developed ( Planes and Beasley, 2008 ). Among them, a number of theoretical frameworks have been proposed to extend the concept of metabolic pathways from a network-oriented perspective ( de Figueiredo et al. , 2009 Pey et al. , 2011 , 2013 ). One of the most important pathway concepts is that of Elementary Flux Mode (EFM) ( Schuster et al. , 2000). EFMs are a minimum set of enzymes necessary to accomplish mass-balance and thermodynamic (irreversibility) conditions ( Schuster et al. , 2000). Although the mass-balance and thermodynamic constraints are directly imposed by means of two linear constraints, the condition that guarantees that only a minimum number of reactions is active, referred to as the non-decomposability condition (NDC), is more difficult and demands further mathematical considerations.

Efficient algebraic frameworks can be found in the literature for calculating the whole set of EFMs of a given metabolic network. These methods are based on an iterative process that has to be completed so as to guarantee that the obtained solutions are EFMs. However, the number of EFMs increases exponentially with the number of reactions constituting the network ( Acuña et al. , 2010). Consequently, applying these methodologies to GSMNs goes beyond their scope. Because it is not possible to calculate all the EFMs in GSMNs, different mathematical frameworks were later developed to provide a particular subset of them ( de Figueiredo et al. , 2009 Machado et al. , 2012 Rezola et al. , 2013 ), most of them based on Mixed Integer Linear Programming (MILP).

These optimization methods typically enumerate EFMs in an increasing number of reactions and have been proved effective for a number of applications ( Rezola et al. , 2013 , 2014 ). However, they allow us to add only one biological constraint in the search procedure, e.g. computing the 100 shortest EFMs producing L-lysine, as stated by de Figueiredo et al. (2009). This limitation is due to NDC. In other words, currently in the literature, there is no general methodology for taking into account more than one biological constraint in the EFM computation without violating NDC.

In this work, we present a novel approach based on MILP that is able to calculate a subset of EFMs fulfilling additional constraints. The framework is illustrated with a toy example and validated with two networks ( Rezola et al. , 2011 Schuster et al. , 2000 ), where all EFMs can be obtained. Subsequently, the scalability of our approach is confirmed by calculating a subset of EFMs in the genome-scale metabolic network of Saccharomyces cerevisiae ( Heavner et al. , 2012). Here, we investigated EFMs simultaneously consuming glucose and producing ethanol, guaranteeing that a minimum yield is achieved. We also validated the performance of this new approach when more than two constraints are imposed, particularly by calculating 100 EFMs activating a random set of five reactions.


The study of metabolic pathways

There are two main reasons for studying a metabolic pathway: (1) to describe, in quantitative terms, the chemical changes catalyzed by the component enzymes of the route and (2) to describe the various intracellular controls that govern the rate at which the pathway functions.

Studies with whole organisms or organs can provide information that one substance is converted to another and that this process is localized in a certain tissue for example, experiments can show that urea, the chief nitrogen-containing end product of protein metabolism in mammals, is formed exclusively in the liver. They cannot reveal, however, the details of the enzymatic steps involved. Clues to the identity of the products involved, and to the possible chemical changes effected by component enzymes, can be provided in any of four ways involving studies with either whole organisms or tissues.

First, under stress or the imbalances associated with diseases, certain metabolites may accumulate to a greater extent than normal. Thus, during the stress of intense exercise, lactic acid appears in the blood, while glycogen, the form in which carbohydrate is stored in muscle, disappears. Such observations do not, however, prove that lactic acid is a normal intermediate of glycogen catabolism rather, they show only that compounds capable of yielding lactic acid are likely to be normal intermediates. Indeed, in the example, lactic acid is formed in response to abnormal circumstances and is not directly formed in the pathways of carbohydrate catabolism.

Second, the administration of metabolic poisons may lead to the accumulation of specific metabolites. If fluoroacetic acid or fluorocitric acid is ingested by animals, for example, citric acid accumulates in the liver. This correctly suggests that fluorocitric acid administered as such, or formed from fluoroacetic acid via the tricarboxylic acid (TCA) cycle, inhibits an enzyme of citrate oxidation.

Third, the fate of any nutrient—indeed, often the fate of a particular chemical group or atom in a nutrient—can be followed with relative ease by administering the nutrient labeled with an isotope. Isotopes are forms of an element that are chemically indistinguishable from each other but differ in physical properties.

The use of a nonradioactive isotope of nitrogen in the 1930s first revealed the dynamic state of body constituents. It had previously been believed that the proteins of tissues are stable once formed, disappearing only with the death of the cell. By feeding amino acids labeled with isotopic nitrogen to rats, it was discovered that the isotope was incorporated into many of the amino acids found in proteins of the liver and the gut, even though the total protein content of these tissues did not change. This suggested that the proteins of these tissues exist in a dynamic steady state, in which relatively high rates of synthesis are counterbalanced by equal rates of degradation. Thus, although the average liver cell has a life-span of several months, half of its proteins are synthesized and degraded every five to six days. On the other hand, the proteins of the muscle or the brain, tissues that (unlike the gut or liver) need not adjust to changes in the chemical composition of their milieu, do not turn over as rapidly. The high rates of turnover observed in liver and gut tissues indicate that the coarse controls, exerted through the onset and cessation of synthesis of pacemaker enzymes, do occur in animal cells.

Finally, genetically altered organisms ( mutants) fail to synthesize certain enzymes in an active form. Such defects, if not lethal, result in the accumulation and excretion of the substrate of the defective enzyme in normal organisms, the substrate would not accumulate, because it would be acted upon by the enzyme. The significance of this observation was first realized in the early 20th century when the phrase “inborn errors of metabolism” was used to describe hereditary conditions in which a variety of amino acids and other metabolites are excreted in the urine. In microorganisms, in which it is relatively easy to cause genetic mutations and to select specific mutants, this technique has been very useful. In addition to their utility in the unraveling of metabolic pathways, the use of mutants in the early 1940s led to the postulation of the one gene-one enzyme hypothesis by the Nobel Prize winners George W. Beadle and Edward L. Tatum their discoveries opened the field of biochemical genetics and first revealed the nature of the fine controls of metabolism.

Because detailed information about the mechanisms of component enzymatic steps in any metabolic pathway cannot be obtained from studies with whole organisms or tissues, various techniques have been developed for studying these processes—e.g., sliced tissues, and homogenates and cell-free extracts, which are produced by physical disruption of the cells and the removal of cell walls and other debris. The sliced-tissue technique was successfully used by the Nobel Prize winner Sir Hans Krebs in his pioneer studies in the early 1930s on the mechanism of urea formation in the liver. Measurements were made of the stimulating effects of small quantities of amino acids on both the rate of oxygen uptake and the amount of oxygen taken up the amino acids were added to liver slices bathed in a nutrient medium. Such measurements revealed the cyclic nature of the process specific amino acids acted as catalysts, stimulating respiration to an extent greater than expected from the quantities added. This was because the added material had been re-formed in the course of the cycle (Veja abaixo Disposal of nitrogen).

Homogenates of tissue are useful in studying metabolic processes because permeability barriers that may prevent ready access of external materials to cell components are destroyed. The tissue is usually minced, blended, or otherwise disrupted in a medium that is suitably buffered to maintain the normal acid–base balance of the tissue, and contains the ions required for many life processes, chiefly sodium, potassium, and magnesium. The tissue is either used directly—as was done by Krebs in elucidating, in 1937, the TCA cycle from studies of the respiration of minced pigeon breast muscle—or fractionated (i.e., broken down) further. If the latter procedure is followed, homogenization is often carried out in a medium containing a high concentration of the sugar sucrose, which provides a milieu favourable for maintaining the integrity of cellular components. The components are recovered by careful spinning in a centrifuge, at a series of increasing speeds. It is thus possible to obtain fractions containing predominantly one type of organelle: nuclei (and some unbroken cells) mitochondria, lysosomes, and microbodies microsomes (i.e., ribosomes and endoplasmic reticulum fragments) and—after prolonged centrifugation at forces in excess of 100,000 times gravity—a clear liquid that represents the soluble fraction of the cytoplasm. The fractions thus obtained can be further purified and tested for their capacity to carry out a given metabolic step or steps. This procedure was used to show that isolated mitochondria catalyze the oxidation reactions of the TCA cycle and that these organelles also contain the enzymes of fatty acid oxidation. Similarly, isolated ribosomes are used to study the pathway and mechanism of protein synthesis.

The final step in elucidating a reaction in a metabolic pathway includes isolation of the enzyme involved. The rate of the reaction and the factors that control the activity of the enzyme are then measured.

It should be emphasized that biochemists realize that studies on isolated and highly purified systems, such as those briefly described above, can do no more than approximate biological reality. The identification of the fine and coarse controls of a metabolic pathway, and (when appropriate) other influences on that pathway, must ultimately involve the study of the pathway in the whole cell or organism. Although some techniques have proved adequate for relating findings in the test tube to the situation in living organisms, study of the more complex metabolic processes, such as those involved in differentiation and development, may require the elaboration of new experimental approaches.


Informação sobre o autor

Afiliações

Bio-X Institutes, Key laboratory for the Genetics of Developmental and Neuropsychiatric Disorders (Ministry of Education), Shanghai Jiao Tong University, Shanghai, 200030, People’s Republic of China

Fangzhou Shen, Hang Zhang & Zhuo Wang

Key Laboratory of Synthetic Biology, CAS Center for Excellence in Molecular Plant Sciences, Institute of Plant Physiology and Ecology, Shanghai Institutes for Biological Sciences, Chinese Academy of Sciences, Shanghai, 200032, People’s Republic of China

School of Life Sciences and Biotechnology, Shanghai Jiao Tong University, Shanghai, 200240, People’s Republic of China

Luoxi Shi, Hang Zhang, Yangmin Chen & Zhuo Wang

Division of Biostatistics, School of Public Health, University of Minnesota, Minneapolis, 55455, USA

The Key Laboratory of Plant Molecular Physiology, Institute of Botany, Chinese Academy of Sciences, Beijing, 100093, People’s Republic of China