Em formação

As distâncias da enzima DAM se movem ao longo do genoma


Estou fundindo uma proteína com a enzima Dam (http://en.wikipedia.org/wiki/Dam_(methylase)). A ideia é que, quando a proteína se liga ao DNA, a enzima Dam começa a metilar os sítios GATC próximos, ajudando assim a identificar a região de ligação da proteína (usando DpnI mais tarde, e a tecnologia de microarranjos). No entanto, não tenho ideia, em teoria, de quantos (bps) a enzima atravessará o genoma a partir de sua localização inicial. Isto é, a que distância (em termos de pb) de sua localização inicial a enzima metilará os locais GATC.

Existem métodos para encontrar regiões de ligação de proteínas ao longo do genoma que usam essa tecnologia, como exemplo aqui: http://www.nature.com/nbt/journal/v18/n4/abs/nbt0400_424.html


Dam metiltransferase metila grandes moléculas de DNA de uma maneira processiva, com uma faixa efetiva de até 7 kb em cada lado de uma reação de metilação inicial.

Minha resposta foi tirada deste papel:

Urig, S. et al. (2002) o Escherichia coli Dam DNA Metiltransferase Modifica DNA em uma Reação Altamente Processiva J Mol Biol 319 1085-1096

Os autores relatam uma análise cinética de E. coli dam metilase. Para quem usa este sistema conforme descrito pelo OP, este documento é uma leitura essencial. A conclusão deles é que o processo de metilação é altamente processivo, o que significa que uma única interação dam-DNA leva a várias metilações antes que a enzima se dissocie do DNA.

Vou me limitar a descrever apenas dois de seus experimentos:

Figura 5 Neste experimento, eles analisaram o curso de tempo de metilação de um 879-mer marcado na extremidade com 4 sítios GATC, usando digestão DpnI para detectar metilação. Neste experimento, todo o DNA foi encontrado como totalmente metilado ou não metilado - nenhuma evidência da presença de moléculas de DNA parcialmente metiladas foi detectada.

Figura 6 Neste experimento, eles analisaram a metilação de λ DNA (48,5 kb) e foram capazes de detectar moléculas parcialmente metiladas. Uma análise cinética dos resultados de dados nas seguintes conclusões (MTase; metiltransferase):

A partir dessas simulações, nós [determinamos] uma processividade de nav= 3000. Isso significa que depois de se ligar ao λ-DNA e iniciar o processo de difusão unidimensional, uma MTase em média encontra 3.000 barragens antes de se dissociar do DNA. Uma vez que a enzima realiza uma caminhada aleatória, ela atingirá muitos locais mais frequentemente do que apenas uma vez e a faixa efetiva de processabilidade corresponde à raiz quadrada de nav. Portanto, a dam MTase é capaz de metilar aproximadamente 55 sítios GATC no λ-DNA em uma reação processiva in vitro. Nesta simulação, 4,6 associações de uma molécula de MTase para a mesma molécula de λ-DNA são necessárias para obter DNA totalmente metilado.

Em uma sequência aleatória de DNA, o GATC deve ocorrer em média a cada 44 = 256 resíduos. Isso sugere uma faixa aproximada de (55/2) * 256 = 7 kb em cada lado de uma reação de metilação inicial.


Depois de reler sua pergunta, suspeito que você está combinando metilação de DNA e digestão de restrição. Para uma visão geral mais detalhada de como esses dois se relacionam, leia a página de resumo no site da New England Biolab.

As estruturas cristalinas das enzimas de restrição comuns não sugerem que elas façam a varredura ao longo do DNA de fita dupla em busca de um local de reconhecimento. A cinética de sua reação pode ser considerada uma interação mais aleatória, quando a enzima entra em contato com um local de reconhecimento, então cliva o DNA e fica livre para flutuar até a próxima reação.

A metilação do DNA vem em três sabores comuns: Dam (metilação da adenina do DNA), Dcm (metilação da citosina do DNA) e metilação CpG. A adição de qualquer uma dessas alterações nos grupos metil pode interferir no reconhecimento enzimático do local. Muitas enzimas são parcial ou completamente bloqueadas por pelo menos um tipo de metilação, enquanto outras são completamente desinibidas. Isso se deve ao formato da enzima e do DNA.

Agora, aqui é onde eu acho que você está combinando os dois. REbase (banco de dados de enzimas de restrição) é de fato a lista oficial de enzimas de restrição. Você mencionou cortes de barragens no GATC. A sequência GATC é a adenina canônica metilação (Dam) site. Como você apontou, nenhuma enzima de restrição conhecida contém Dam. Se, em vez disso, procurarmos o local de reconhecimento, GATC corresponderá a DpnI, uma enzima de restrição que produz extremidades cegas. Eu acho que é DpnI que você está falando, que preferencialmente cliva o DNA metilado Dam (daí porque o local de reconhecimento GATC também corresponde às mitiltransferases Dam). Se houver ausência de DNA metilado (ou se o DNA não metilado for mais abundante), o DpnI também será digerido nos sítios GATC.


Ferramentas genômicas para desvendar a arquitetura cromossômica

A organização espacial dos cromossomos dentro do núcleo da célula ainda é pouco compreendida. Essa organização é guiada por contatos intra e intercromossômicos e por interações de loci cromossômicos específicos com "marcos" nucleares relativamente fixos, como o envelope nuclear e o nucléolo. Os pesquisadores começaram a usar novas técnicas de mapeamento do genoma molecular para descobrir os dois tipos de interações moleculares, fornecendo informações sobre os princípios fundamentais do dobramento de cromossomos em interfase.


Resumo

Para salvar os ecossistemas marinhos da sobreexploração da pesca, a aquicultura sustentável e eficiente deve ser enfatizada. O conhecimento obtido a partir da sequência do genoma disponível de organismos marinhos acelerou a aquicultura marinha em muitos casos. O camarão tigre preto (Penaeus Monodon) é um dos camarões peneídeos de cultura mais proeminentes (Crustáceos), com uma produção global média anual de meio milhão de toneladas na última década. No entanto, seus conjuntos de genoma atualmente disponíveis carecem da contiguidade e integridade necessárias para a anotação precisa do genoma devido à natureza altamente repetitiva do genoma e à dificuldade técnica em extrair DNA de alta qualidade e alto peso molecular. Aqui, relatamos a primeira montagem do genoma total em nível de cromossomo de P. monodon. A combinação das tecnologias de longa leitura Pacific Biosciences (PacBio) e Chicago e Hi-C de longo alcance possibilitou uma montagem bem-sucedida desta primeira sequência de genoma de alta qualidade. A montagem final cobriu 2,39 Gb (92,3% do tamanho estimado do genoma) e continha 44 pseudomoléculas, correspondendo ao número de cromossomos haplóides. Os elementos repetitivos ocuparam uma parte substancial da assembleia (62,5%), o maior dos números relatados entre as espécies de crustáceos. A disponibilidade desse conjunto de genoma de alta qualidade permitiu a identificação de genes associados ao rápido crescimento no camarão tigre preto por meio da comparação do transcriptoma do hepatopâncreas de camarões de crescimento lento e rápido. Os resultados destacaram vários genes associados ao crescimento. Nosso conjunto de genoma de alta qualidade fornece um recurso inestimável para o melhoramento genético e criação de camarões peneídeos na aquicultura. A disponibilidade de P. monodon O genoma permite análises de impacto ecológico, adaptação e evolução do ambiente, bem como o papel do genoma em proteger os recursos ecológicos, promovendo a carcinicultura sustentável.


MATERIAIS E MÉTODOS

Bancos de dados

BENZ está atualmente atualizado com UniProt / SwissProt versão 2021_01. Uma versão anterior do BENZ, baseada no UniProt / SwissProt release 2019_11, foi usada para gerar um sistema para validações do tipo CAFA. Os links para os bancos de dados Pfam (11) e KEGG (17) são derivados dos lançamentos UniProt. Fragmentos e sequências menores que 50 resíduos não são considerados. As anotações de sítios de ligação de ligantes metálicos ativos (quando disponíveis) também são derivadas do UniProt e mapeadas na arquitetura Pfam das proteínas enzimáticas.

Criação de gráficos, clusterização e geração de HMM de cluster

O procedimento se destaca de um workflow previamente implementado, que adotamos para gerar e atualizar nosso BAR 3.0 (Bologna Annotation Resource, https://bar.biocomp.unibo.it/bar3/), um recurso de anotação estrutural e funcional de proteínas (18 ) Resumidamente, todas as sequências UniProt de uma liberação específica (neste caso, UniProtKB 2019_01) são comparadas com BLAST (https://www.ncbi.nlm.nih.gov/) e, em seguida, agrupadas por restrição de identidade de sequência (SI) e cobertura de alinhamento (COV, a proporção entre o número de posições sobrepostas e o comprimento do alinhamento). Um gráfico é construído conectando pares de sequência que atendem às restrições de identidade e cobertura. Aqui, adotamos (SI) ≥50% em uma cobertura de alinhamento (COV) ≥90%. Os clusters são obtidos isolando os componentes conectados do gráfico. Para atualização, utilizamos clusters UniRef90 (https://www.uniprot.org/help/uniref) que são mapeados para clusters BAR, seguindo o procedimento descrito anteriormente (18). Isso permite a inclusão das sequências TrEMBL restantes, e o algoritmo AlignBucket (20) acelera o procedimento de alinhamento, explorando a restrição em COV. Cada sequência no cluster retém a anotação presente no arquivo UniProt (PDB com a maior cobertura e resolução quando disponível, Pfam / s, links KEGG e códigos EC de quatro níveis, quando presentes). Nosso sistema permite a atualização (18), adicionando novas sequências e remodelando os clusters de acordo, com a inclusão de novas anotações do UniProt.

A partir dessa arquitetura de fundo, retemos apenas clusters contendo sequências associadas a códigos EC de quatro níveis, particularmente clusters contendo sequências SwissProt curadas manualmente e sequências TrEMBL com um arquivo PDB associado. Para cada cluster, treinamos então um cluster HMM, com HMMER 3.3.2 (http://hmmer.org/, (20)), no alinhamento de sequência múltipla específico do cluster, calculado com Clustal Omega (21). A presente versão do BENZ WS, por razões técnicas, inclui Cluster HMMs com comprimentos médios variando de 50 a 5000 resíduos, e isso define o limite da sequência de consulta para cerca de 5000 resíduos.

Seleção de sequência de referência e esquema de coloração HMM de cluster

Para cada cluster HMM, selecionamos a (s) melhor (is) sequência (s) anotada (s) para ser sequência de referência para a associação de número / s de cluster HMM-EC com as seguintes restrições: para sequências SwissProt, cadeias com a pontuação de anotação mais alta para sequências TrEMBL, apenas aquelas com um número EC de quatro níveis e uma associação PDB. Cada sequência de referência é então associada à sua arquitetura Pfam específica e, eventualmente, locais relevantes (incluindo locais ativos, ligantes e de ligação de metal) são mapeados nos Pfam / s correspondentes. O cluster HMM é então agrupado em duas categorias. Os HMMs do cluster GOLD estão univocamente associados a uma sequência de referência e os HMMs do cluster BLUE estão associados a mais de uma sequência de referência.

Implementação BENZ

BENZ inclui HMMs de cluster e modelos Pfam (Pfam versão 33.1). Quando uma sequência de destino entra no servidor, ela é filtrada por dois conjuntos diferentes de modelos. Dentro dos HMMs do cluster, quando retidos (o limite para inclusão é E-valor ≤ 10 −5), a sequência encontra um modelo de referência dentro dos modelos Pfam, quando retida (o limite para inclusão é E-valor ≤ 10 −4), ela ganha uma arquitetura. Os valores E de inclusão foram escolhidos após um teste de autoconsistência (a previsão de todo o conjunto de sequências de referência).

Essa arquitetura é então comparada com a de referência e o alvo é dotado com o número de referência de quatro níveis EC apenas quando sua arquitetura é pelo menos igual à do modelo. Caso contrário, o número EC de quatro níveis é atribuído com base em um Pfam comum, contendo locais relevantes (ativo, ligação de metal, locais de ligação de ligante). O esquema geral do sistema de anotação BENZ é ilustrado na Figura 1. Quando o cluster de retenção HMM é plurivocamente associado a mais de uma sequência de referência, um dendrograma é gerado após o alinhamento de sequência múltipla com Clustal Omega (21), incluindo a sequência de consulta, que é associado (s) ao (s) código (s) CE das mais semelhantes entre as referências.

Fluxo de trabalho do BENZ WS. Para uma sequência de consulta, no formato FASTA, o procedimento de anotação começa com a filtragem HMM. Se o HMM retentor estiver plurivocamente associado a diferentes sequências de referências (estrela azul), um dendrograma é gerado para encontrar entre as sequências de referência a mais semelhante ao alvo. Caso contrário (estrela amarela), o alvo é associado à única referência. A associação de sequência de número-consulta de EC é então feita após avaliar se a arquitetura da proteína de referência (Ref Seq Arch) está contida (⊆) na arquitetura Pfam alvo prevista (Query Pred Arch), com foco em Pfams que transportam locais relevantes. Os Pfams em nosso sistema são anotados, quando possível, com as posições do sítio ativo, sítio de ligação do ligante e sítio de ligação do metal (sítios relevantes). Um visualizador de características de sequência permite ao usuário verificar se a sequência de consulta conserva os resíduos relevantes para a catálise da proteína para validar a transferência de anotação da sequência de referência. Links para o arquivo de sequência de referência UniProt / SwissProt, arquivo de estrutura PDB e entradas Pfam, junto com identificadores KEGG e caminhos também estão presentes na saída (consulte HELP, https://benzdb.biocomp.unibo.it/help).

Fluxo de trabalho do BENZ WS. Para uma sequência de consulta, no formato FASTA, o procedimento de anotação começa com a filtragem HMM. Se o HMM retentor estiver plurivocamente associado a diferentes sequências de referências (estrela azul), um dendrograma é gerado para encontrar entre as sequências de referência a mais semelhante ao alvo. Caso contrário (estrela amarela), o alvo é associado à única referência. A associação de sequência de número-consulta de EC é então feita após avaliar se a arquitetura da proteína de referência (Ref Seq Arch) está contida (⊆) na arquitetura Pfam alvo prevista (Query Pred Arch), com foco em Pfams que transportam locais relevantes. Os Pfams em nosso sistema são anotados, quando possível, com as posições do sítio ativo, sítio de ligação do ligante e sítio de ligação do metal (sítios relevantes). Um visualizador de características de sequência permite ao usuário verificar se a sequência de consulta conserva os resíduos relevantes para a catálise da proteína para validar a transferência de anotação da sequência de referência. Links para o arquivo de sequência de referência UniProt / SwissProt, arquivo de estrutura PDB e entradas Pfam, junto com identificadores KEGG e caminhos também estão presentes na saída (consulte HELP, https://benzdb.biocomp.unibo.it/help).

Servidor web

A interface do servidor da web BENZ é otimizada para funcionar com navegadores da web comuns, incluindo Chrome 88.0, Firefox 83.0, Edge 88.0 e Safari 14.0. Após o envio, os trabalhos são processados ​​de forma assíncrona, adotando um serviço de enfileiramento interno baseado no Sun Grid Engine. As sequências enviadas são alinhadas com os HMMs do cluster e bibliotecas Pfam com HMMer 3.3.2 (20). O usuário recebe um link para uma página da web estática que exibirá os resultados após a conclusão do trabalho. A página é atualizada a cada 30 s. Os resultados são retornados rotineiramente dentro de 1 minuto desde o envio. Tempos mais longos podem ser necessários para sequências com mais de 3000 resíduos.

Quando os critérios descritos na Figura 1 são atendidos, a página de resultados retorna a anotação EC como derivada da sequência de referência com melhor correspondência. A seção "Melhor correspondência" também relata a estrutura PDB da referência (quando disponível), as arquiteturas Pfam de ambas as sequências de consulta e referência e o tipo de associação de referência HMM, unívoca (estrela GOLD) ou plurívoca (estrela AZUL). Mais detalhes são fornecidos na seção "Dados", incluindo a lista de HMMs de cluster com pontuação E-valor ≤10 −5, as sequências de referência associadas e os links para IntEnz (https://www.ebi.ac.uk/intenz/), UniProt, PDB, Pfam e KEGG. Os dados tabulares são representados com DataTables (https://datatables.net/), permitindo ordenar as linhas em relação a qualquer chave de coluna e procurar ocorrências de texto na tabela. Os links são resolvidos com o serviço Identifiers.org (22) para melhorar a interoperabilidade.

Para os clusters plurívocos, o dendrograma, em formato Newick, representando as distâncias entre a consulta e as sequências de referência é calculado com Clustal Omega (21) e visualizado com o módulo Bio.Phylo do Biopython (23). Os domínios Pfam mapeados na sequência de consulta são listados na tabela 'Predicted Target Architecture' e graficamente representados com faixas exibidas por meio da biblioteca Pviz.js (24). A visualização gráfica também permite investigar a conservação de sítios ativos, de ligação de metal e de ligação de ligante entre a consulta e as sequências de referência. O servidor da web pode ser acessado gratuitamente sem registro em https://benzdb.biocomp.unibo.it.


A descoberta do 'salto' da enzima bacteriana dá uma visão sobre a expressão do gene

A descoberta dos pesquisadores da Universidade da Califórnia em Santa Bárbara de uma variação da capacidade de uma enzima de "pular" à medida que se move ao longo do DNA, modificando o material genético de uma bactéria - e sua capacidade física e comportamento - é muito promissora para aplicações biomédicas e científicas.

o E. coli O mecanismo adaptativo da bactéria permite que ela mude seu fenótipo - suas características observáveis ​​- de acordo com seu ambiente. Por exemplo, se sentir a necessidade de encontrar comida, de aderir aos tecidos de seu organismo hospedeiro ou de se reproduzir, a bactéria formará pili, ou estruturas semelhantes a cabelos, em sua superfície, para permitir que se mova, grude ou passe material genético.

"Estamos tentando descobrir o que há na célula que está causando essas mudanças", disse Adam Pollak, primeiro autor do artigo.

A formação desses pelos é impulsionada por um mecanismo epigenético - um "tagging" feito pela enzima DNA adenina metiltransferase (Dam), que atua sobre uma sequência específica de DNA, denominada sítios GATC (Guanina-Adenina-Timina-Citosina). A marcação sinaliza a formação desses apêndices - um mecanismo semelhante ao dos humanos, onde a marcação direciona a formação de tecidos para diferentes órgãos do mesmo DNA. Essa marcação faz parte de um campo mais amplo, denominado epigenética, onde as modificações feitas no genoma são hereditárias e regulam a expressão dos genes.

Onde a crença predominante era que a enzima Dam deslizou para baixo apenas um lado do DNA de dupla hélice da bactéria procurando por esses locais GATC, de acordo com os pesquisadores, Dam pode realmente "pular" para um ou mais desses locais em ambos os lados do a dupla hélice.

"Ele se move, encontra um local e metila, mas se vira, se reorienta e metila o outro lado", disse Norbert Reich, professor de química e bioquímica da UCSB.

Usando várias fitas de DNA geneticamente modificado de vários comprimentos e distâncias diferentes entre os locais de metilação, os pesquisadores descobriram que o salto de Dam pode ocorrer com mais frequência, dependendo do agrupamento de locais, por exemplo, é mais provável que ocorra quando dois locais são dentro de 10 a 200 pares de bases um do outro. Sítios GATC agrupados estão fortemente associados à regulação gênica, enquanto um sítio GATC isolado na dupla hélice está associado à cópia de DNA. De acordo com as descobertas dos autores, quanto mais tempo a enzima fica sem localizar a sequência de moléculas GATC, menos provável que ela passe por essa nova variação de salto, mas a introdução de uma sequência GATC estimulará o mecanismo mais uma vez.

De acordo com o artigo, o salto pode explicar a eficiência pela qual as enzimas modificadoras de DNA podem encontrar seus locais de reconhecimento, apesar da presença de uma quantidade esmagadora de DNA não específico, bem como como as enzimas podem modificar mais de um local, apesar das orientações opostas das fitas .

A pesquisa capitaliza décadas de observação de E. colio comportamento de, e os fatores que contribuem para sua virulência, ou sua capacidade de persistir e se multiplicar. Estudar os mecanismos que ligam e desligam essas habilidades contribuiria para como os humanos podem lidar com essas bactérias, que existem em criaturas de sangue quente, mas, em certos casos, podem causar doenças.

“Se tivéssemos inibidores que pudessem prevenir a troca, não teríamos infecções do trato urinário, por exemplo”, disse Pollak.

O mesmo grupo de pesquisa relatou recentemente um mecanismo semelhante em humanos, que é interrompido em certas formas de leucemia.


Uma nova abordagem para identificar interações de RNA-cromatina específicas do tipo de célula

RNAs não codificantes longos (lncRNAs) são transcritos com mais de 200 pb que podem ter papéis na regulação da transcrição. Muitos interagem com fatores de transcrição e fatores de remodelação da cromatina para influenciar a expressão gênica em loci genômicos específicos (Marchese et al., 2017). lncRNAs são expressos em padrões restritos espacial e temporalmente na Vivo. Os pulldowns de RNA da cromatina reticulada permitem a identificação dos locais de ligação de lncRNAs em cultura de células, mas devido à necessidade de dezenas de milhões de células, sua aplicação na Vivo foi limitado (Chu et al., 2015). RNA-DamID é uma nova abordagem para identificar a ocupação genômica de lncRNAs na Vivo de uma forma específica para o tipo de célula (Cheetham e Brand, 2018). O RNA-DamID envolve a marcação genética do lncRNA de interesse com MS2, um grampo de cabelo estável que é derivado do bacteriófago MS2. Dam é então fundido à MS2 Coat Protein (MCP), que se liga à tag MS2 RNA com eficiência nanomolar. O lncRNA marcado e a fusão Dam-MCP podem ser expressos em um tipo de célula de interesse, em que Dam-MCP é recrutado para locais de interação lncRNA-cromatina e metila motivos GATC próximos, identificando assim locais de ligação de lncRNA específicos para o tipo de célula na Vivo (Fig. 2D). O RNA-DamID é muito mais sensível do que as abordagens alternativas baseadas em pulldown para mapear as interações lncRNA-cromatina, como ChART (Simon et al., 2011), RAP (Engreitz et al., 2013) e ChIRP (Chu et al., 2011) , e foi usado em apenas 30.000 células-tronco neurais. É importante ressaltar que o RNA-DamID também parece ter menos falsos positivos do que o ChIRP. O RNA-DamID pode identificar os locais de ligação de ectopicamente expressos (roX2) e marcado endogenamente (roX1) lncRNAs, mas ainda não foi aplicado a outros lncRNAs. Embora o RNA-DamID requeira a transgênese, como fazem todas as abordagens DamID, é atualmente o único método que pode resolver perfis de ligação de RNA de populações de células restritas na Vivo. Assim, o RNA-DamID será uma ferramenta valiosa para identificar os mecanismos pelos quais os lncRNAs controlam a expressão gênica e a estrutura da cromatina.


As distâncias da enzima DAM se movem ao longo do genoma - Biologia

A lâmina nuclear (NL) interage com centenas de grandes regiões genômicas denominadas domínios associados à lâmina (LADs). A dinâmica dessas interações e a relação com as modificações epigenéticas são mal compreendidas. Visualizamos o destino dos LADs em células individuais usando uma abordagem de “memória de contato molecular”. Em cada núcleo, apenas ∼30% dos LADs estão posicionados na periferia; esses LADs estão em contato molecular intermitente com o NL, mas permanecem restritos à periferia. Após a mitose, o posicionamento LAD não é herdado de forma detectável, mas, em vez disso, é reorganizado estocasticamente. O contato de LADs individuais com o NL está ligado à repressão transcricional e à dimetilação de H3K9 em células individuais. Além disso, identificamos a metiltransferase G9a H3K9 como um regulador de contatos NL. Coletivamente, esses resultados destacam os princípios da arquitetura espacial dinâmica dos cromossomos em relação à regulação gênica.

Resumo Gráfico

Destaques

► Um novo método para rastrear e manipular LADs em células individuais ► LADs são restringidos durante a interfase, mas estocasticamente remodelados na mitose ► Modificações de histonas de LADs individuais estão vinculadas ao posicionamento estocástico ► A metiltransferase G9a H3K9 promove contatos LAD-NL


4. Métodos para quantificação de ChIP e DamID

4.1. qPCR

ChIP ou DamID seguido por qPCR é uma opção viável quando se sabe ou tem uma boa estimativa de onde a proteína se liga. A PCR em tempo real é usada para quantificar a quantidade relativa de DNA do chip em comparação com o DNA de entrada nos loci de teste e controle. A seleção da região de teste para qPCR depende do destino. Por exemplo, no caso de um fator de transcrição de ligação ao DNA, pode-se escolher iniciadores que abrangem uma região do promotor com um motivo de sequência de DNA putativo. Os dados ChIP de todo o genoma estão disponíveis para vários fatores de transcrição (http://www.modencode.org/). O locus de controle negativo deve estar em uma região sem ligação esperada. Recomendamos expressar o enriquecimento do chip como porcentagem da entrada. Alguns pesquisadores usam o enriquecimento em dobras em comparação com o controle de IgG, ou loci de controle negativo. Nesse caso, é preciso ter certeza de que o sinal de fundo não varia muito de experimento para experimento.

4.2. Microarrays de DNA

Para identificação e quantificação de fragmentos de DNA por tecnologia de matriz, as amostras da cepa de fusão Dam e da cepa de controle & # 8220Dam only & # 8221 são processadas em paralelo e marcadas por fluorescência com diferentes corantes, seguido por co-hibridização em matrizes de alta densidade. Da mesma forma, para o chip ChIP, o ChIP e o DNA de entrada são amplificados e marcados por dois corantes fluorescentes diferentes (Cy3 e Cy5) e co-hibridizados para microarrays que abrangem todo o genoma (Buck e Lieb, 2004 Ercan et al., 2007). Para evitar viés potencial introduzido pelos dois corantes, um experimento de troca de corante deve ser realizado com pelo menos uma das réplicas biológicas. A análise dos dados de hibridização, incluindo normalização e suavização, pode ser realizada com vários algoritmos. Resumidamente, a razão do sinal de fluorescência de ChIP para entrada ou fusão & # 8220Dam & # 8221 para & # 8220Dam apenas & # 8221 é uma medida de enriquecimento ChIP ou DamID por sonda e, devido à normalização, o enriquecimento em cada locus é relativo ao resto do genoma. O processamento posterior de dados dependerá normalmente da classe de associação de cromatina sendo investigada. Whole-Genome Tiling Arrays da Roche NimbleGen contendo 2,1 milhões de sondas de 50 nt foram usados ​​em experimentos de chip e DamID, mas não são mais produzidos. Matrizes equivalentes de outros fabricantes não foram testadas em C. elegans DamID, mas têm sido empregados em experimentos DamID em outros organismos, bem como em C. elegans Estudos ChIP.

4.3. Sequenciamento de alto rendimento

DamID e ChIP DNA podem ser sequenciados diretamente por sequenciamento de alto rendimento. O ChIP-seq fornece resolução mais alta e maior faixa dinâmica em comparação com o chip ChIP, e atualmente é mais barato, pois o sequenciamento pode ser multiplexado e os microarranjos comerciais estão sendo eliminados (Park, 2009 Landt et al., 2012). A multiplexação é feita incluindo um índice de identificação exclusivo para cada biblioteca de sequenciamento e agrupamento de bibliotecas para sequenciamento, por exemplo, em uma pista de uma célula de fluxo Illumina & reg. Para ChIP-seq, ter um número maior de leituras curtas é mais importante do que leituras longas. Portanto, o sequenciamento de extremidade única de 36-50 bp pela Illumina é um método popular de escolha. Fatores de transcrição com ligação mais focada e menos sítios de ligação normalmente requerem menos leituras, enquanto alvos com padrões amplos, como modificações de histonas, requerem mais leituras. Em nossa experiência, 10-20 milhões de leituras mapeadas de 50 bp são geralmente suficientes para uma grande variedade de alvos em C. elegans (Kranz et al. 2013). Normalmente, 80-90% das leituras do chip são mapeadas para o genoma. Uma pista do Illumina HiSeq2500 normalmente fornece & # 8764150 milhões de leituras mapeadas, portanto, pode-se multiplexar & # 87648 amostras em uma pista. A pontuação de enriquecimento ChIP-seq é calculada para cada par de bases em todo o genoma como cobertura de leitura de ChIP em comparação com a entrada e, portanto, reflete a ligação relativa em relação a todo o genoma. Para determinar com precisão os locais de ligação de proteínas por pico de chamada, é importante sequenciar o DNA de entrada correspondente, de preferência com cobertura igual ou superior (Chen et al., 2012).

Embora a maioria dos experimentos DamID publicados tenham usado microarranjos de DNA, estudos recentes mapearam os locais de metilação de Dam com sequenciamento Illumina (Sha et al., 2010 Luo et al., 2011). Esses dois estudos diferem em vários detalhes, mas ambos incluíram um corte enzimático dos fragmentos metilados para fornecer marcadores de sequência DamID de 20-27 bp que foram identificados por sequenciamento massivo. Aproximadamente 38% das leituras de sequência bruta podem ser mapeadas para sites GATC únicos no C. elegans genoma (Sha et al., 2010), o que implica que 10-20 milhões de leituras serão apropriadas para cada amostra, portanto semelhante à situação em ChIP-seq.

4,4. Análise de dados

Como a análise de dados dependerá muito de vários parâmetros, como o tipo de proteína que está sendo analisada (fator de transcrição, histona, proteína do envelope nuclear e etc.), métodos para geração de dados (matriz ou sequenciamento) e extensão da assistência de bioinformática disponível, não é realista fornecer aqui protocolos detalhados sobre este aspecto. Consulte os estudos publicados ou entre em contato conosco para uma discussão mais aprofundada.


AGRADECIMENTOS

Esta pesquisa foi financiada pelo Grupo Consultivo para o Programa Internacional de Pesquisa Agrícola em sistemas agroalimentares de arroz (CRP-RICE, 2017–2022). Ngan Thi Phan foi apoiado por uma bolsa de doutorado da Embaixada da França no Vietnã. Guillaume Besnard é membro do laboratório EDB apoiado pelos projetos de excelência Labex CEBA (ANR-10-LABX-25-01) e Labex TULIP (ANR-10-LABX-0041), administrados pela ANR francesa. Os autores desejam agradecer a Jamel Aribi (IRD-IPME, França), Alain Roulet (Genopole, Toulouse, França) e Michel Lebrun e Thi Hue Nguyen (Laboratório Conjunto Internacional de “Genômica Funcional de Arroz e Biologia Vegetal”, Hanói, Vietnã) por seu suporte técnico em nematologia ou genômica. Também queremos agradecer a Ndomassi Tando e à plataforma de bioinformática “Plantes Santé” do IRD itrop por fornecer recursos de HPC e suporte para nosso projeto de pesquisa, e a três revisores anônimos por seus comentários construtivos.


Conclusões

Nosso estudo mostra uma interação geral entre a transposição e a replicação mediada pela pinça deslizante & # x003b2, que é revelada de forma diferente nos vários Filos como consequência da dinâmica de replicação cromossômica distinta. Em Firmicutes, a interação de transposases com replicação pode criar um viés de orientação em muitas famílias IS como consequência da assimetria na distribuição de & # x003b2 na bifurcação de replicação. Gostaríamos de propor que os ISs poderiam derivar um benefício duplo de sua associação mediada por & # x003b2 com a replicação: primeiro, integração com a replicação cromossômica do hospedeiro, possivelmente necessária para sua proliferação dentro do cromossomo, e, segundo, um universal altamente conservado, plataforma de dispersão entre espécies. A interação com & # x003b2 poderia, portanto, fornecer a chave para a natureza onipresente de elementos de inserção em genomas bacterianos, destacando um exemplo notável de adaptabilidade molecular extrema.


Assista o vídeo: Montagem de Genomas (Janeiro 2022).