Em formação

Qual é o número de cópias de um determinado gene em GRCh37?


desculpe pela pergunta ingênua, mas como faço para determinar qual é o número de cópia em GRCh37 para um gene com vários CNVs? (por exemplo, DRD4).


Uma abordagem muito ingênua seria simplesmente perguntar quantas cópias da sequência em questão estão na sequência hg38, em algum nível de homologia. Você poderia fazer isso usando uma ferramenta como BLASTN (que tem uma interface da web que você pode usar para pesquisar em um genoma humano) ou, se você tiver as sequências baixadas em algum lugar onde possa trabalhar com elas, usando uma ferramenta como minimapa2 ( que será mais rápido), desde que você se sinta confortável com o uso de ferramentas de linha de comando.

Se você decidir fazer isso, terá que se sentir confortável ao definir limites para o que conta como uma cópia do gene em questão.

Uma solução mais envolvente seria obter leituras de sequenciamento de DNA para a amostra em que você está interessado e usá-las para quantificar o número de cópias do gene com base no número que mapeia para uma determinada sequência de interesse. Uma abordagem mais antiga seria usar microarrays.

Eu estou supondo que, uma vez que você está interessado no genoma de referência, você não está interessado em ter esse tipo de problema.

Esta é uma questão de lição de casa? Nesse caso, você deve adicionar a tag "lição de casa".


GRCh38 e middot COSMIC v94

O histograma de visualização do gene é uma visualização gráfica das mutações no HTT. Essas mutações são exibidas no nível de aminoácidos em todo o comprimento do gene por padrão. Restrinja a visualização a uma região do gene arrastando pelo histograma para destacar a região de interesse ou usando os controles deslizantes no painel de filtros à esquerda. Mostre mais

Esta visualização de peptídeo padrão mostra um histograma de substituições de base única, codificadas por cor por resíduo de acordo com o esquema de cores usado no Ensembl. Abaixo dele é mostrada a sequência de aminoácidos e as estruturas da proteína Pfam, seguidas por complexas mutações e inserções e deleções. A visualização gráfica pode ser alternada para coordenadas de cDNA selecionando a partir das opções de "Sistema de coordenadas" no painel "Filtros" à esquerda.

Você pode usar o painel de filtros para selecionar os tipos de dados que são exibidos. Depois de ajustar um filtro, pressione Aplicar filtros ou pressione Redefinir filtros para reverter para a exibição original não filtrada.

Você pode ver mais informações nas páginas de ajuda.


GRCh38 e middot COSMIC v94

O histograma de visualização do gene é uma visualização gráfica das mutações no VIPR2. Essas mutações são exibidas no nível de aminoácidos em todo o comprimento do gene por padrão. Restrinja a visualização a uma região do gene arrastando pelo histograma para destacar a região de interesse ou usando os controles deslizantes no painel de filtros à esquerda. Mostre mais

Esta visualização de peptídeo padrão mostra um histograma de substituições de base única, codificadas por cor por resíduo de acordo com o esquema de cores usado no Ensembl. Abaixo dele é mostrada a sequência de aminoácidos e as estruturas da proteína Pfam, seguidas por complexas mutações e inserções e deleções. A visualização gráfica pode ser alternada para coordenadas de cDNA selecionando a partir das opções de "Sistema de coordenadas" no painel "Filtros" à esquerda.

Você pode usar o painel de filtros para selecionar os tipos de dados que são exibidos. Depois de ajustar um filtro, pressione Aplicar filtros ou pressione Redefinir filtros para reverter para a exibição original não filtrada.

Você pode ver mais informações nas páginas de ajuda.


1. Por que o número da cópia é importante?

Embora pareça óbvio, saber em qual categoria seu plasmídeo se encaixa é muito importante ao iniciar seu experimento. Se você sabe que está trabalhando com um plasmídeo de baixo número de cópias, não deve se surpreender com o baixo rendimento e, portanto, pode decidir configurar mais culturas. Por outro lado, se você obtiver um rendimento baixo de um plasmídeo com muitas cópias, então você sabe que tem que solucionar alguns problemas, supondo que sua inserção não seja muito grande para começar!

Uma vantagem do elevado número de cópias é a maior estabilidade do plasmídeo quando a partição aleatória (isto é, a partição de plasmídeos em células filhas) ocorre na divisão celular. No entanto, um grande número de plasmídeos também pode resultar em rendimentos mais baixos, como mencionado acima. Vejamos alguns casos em que você realmente precisa considerar o número de cópias em seus experimentos:


Etapas gerais de pipelines de detecção de CNA scDNAseq

Na ausência de aberrações e / ou variações no número de cópias, um genoma diplóide tem exatamente duas cópias de cada cromossomo. No entanto, quando ocorrem CNAs, o número de cópias varia ao longo do genoma. Nesse caso, segmentação é a tarefa de particionar o genoma em regiões contíguas de comprimento máximo, de modo que o número de cópias em cada local dentro de uma região seja o mesmo. Cada uma dessas regiões é chamada de segmento, e o número da cópia compartilhada por todos os sites dentro desse segmento é referido como o número absoluto da cópia. A detecção de CNA refere-se à tarefa de identificar os segmentos e números absolutos de cópias em um determinado genoma. No caso de um genoma diplóide sem CNAs, há um segmento, que é o genoma inteiro, e o número de cópias absoluto é 2. Em geral, um método para detecção de CNA a partir de dados de DNA de célula única segue alguns ou todos os sete passos, ilustrados na Fig. 1, cinco dos quais visam a transformação de dados e dois que visam as tarefas principais de detecção de CNA, nomeadamente segmentação e chamada de números absolutos de cópia.

As sete etapas na detecção de CNA no sequenciamento de uma única célula. uma Binning. O número de leituras em cada compartimento (parte inferior) é calculado a partir do empilhamento das leituras de acordo com onde elas se alinham (parte superior). b Correção de GC. Gráfico de dispersão da contagem de leitura por compartimento em relação ao conteúdo GC do compartimento. A curva vermelha representa a regressão correspondente. c Correção de mapeabilidade. Gráfico de dispersão da contagem de leitura por compartimento em relação à capacidade de mapeamento do compartimento. A curva vermelha representa a regressão correspondente. d Remoção de caixas atípicas. O gráfico de dispersão da contagem de leitura por compartimento em relação à posição genômica é mostrado. As caixas atípicas são mostradas em vermelho, em contraste com o resto do genoma, que está em verde. e Remoção de células outlier. Uma curva de Lorenz para a contagem de leitura em todas as caixas é mostrada. O coeficiente de Gini é o dobro da área destacada entre a curva de Lorenz e a linha diagonal. Quanto mais alto o coeficiente de Gini, maior a probabilidade de a célula ser um outlier. f Segmentação. O gráfico de dispersão da contagem de leitura por compartimento em relação à posição genômica é mostrado. As linhas verticais pontilhadas correspondem aos limites dos segmentos. g Chamando os números absolutos de cópia. O número da cópia - um número inteiro não negativo - para cada segmento é determinado

Organização de dados scDNAseq antes da detecção de CNA

A preparação de dados scDNAseq antes da detecção de CNA envolve, na maioria das vezes, as cinco etapas a seguir:

Binning. Particionar o genoma em compartimentos de tamanho fixo ou variável de modo que a resolução na qual o genoma é segmentado e os números de cópia são chamados seja definida por compartimentos em vez de por locais individuais.

Correção de GC. Correção de contagens de leitura de acordo com o conteúdo de GC na região genômica correspondente para remover o efeito do conteúdo de GC nas contagens de leitura.

Correção de mapeabilidade. Correção de contagens de leitura de acordo com o quão mapeável é uma região genômica. Quanto maior a repetitividade em uma região, menor sua capacidade de mapeamento e menor o número de leituras alinhadas exclusivamente.

Remoção de caixas atípicas. Identificar e excluir caixas que têm uma contagem de leitura extremamente alta, independentemente do número real de cópias em tais caixas. Essas caixas geralmente ocorrem perto do centrômero e telômero de cada cromossomo.

Remoção de células outlier. Identificar e excluir células cujos perfis de contagem de leitura são baixos na relação sinal-ruído (SNR). Essas células têm contagens de leitura com ruído ou são baixas na cobertura de sequência.

Descrevemos agora resumidamente cada uma das cinco etapas.

Binning

Bins são calculados de forma que as leituras dentro de um bin são agregadas para reduzir os efeitos da amplificação variável e amostragem de sequência [58]. A maioria dos métodos que emprega binning usa bins de tamanho fixo (todos os bins têm o mesmo tamanho). No entanto, o uso de bins de tamanho variável foi proposto [18] para evitar chamadas de exclusão falso-positivas (ou seja, chamadas falsas de pontos de interrupção) em regiões repetitivas, como resultado da remoção de leituras de baixa qualidade de mapeamento. Caixas de tamanhos variáveis ​​são determinadas como segue. Primeiro, o genoma de referência é sequenciado in silico para produzir um conjunto de leituras. As leituras são então alinhadas de volta à referência e aquelas que não podem ser alinhadas exclusivamente são removidas. O genoma é então dividido em caixas de tamanho variável, cada caixa contendo aproximadamente o mesmo número de leituras alinhadas de forma exclusiva. Para as regiões repetitivas, espera-se que seu tamanho de compartimento variável seja maior, uma vez que o número de leituras alinhadas exclusivamente é menor [18].

Embora o uso de compartimentos de tamanho variável reduza efetivamente as chamadas de exclusão de falsos positivos, ele é restrito em alguns aspectos. Primeiro, o tamanho do compartimento é em relação a um genoma de referência específico. Diferentes genomas de referência podem dar origem a diferentes resultados de binning. Em segundo lugar, o tamanho do compartimento é afetado pelo comprimento de leitura específico que está sendo simulado. De modo mais geral, determinar o tamanho de compartimento ideal (variável ou fixo) é difícil devido à cobertura de leitura variável em dados de célula única. Conforme mencionado em [57], é necessário que haja um certo número de leituras em cada compartimento para que as contagens de leituras resultantes sigam uma distribuição normal, de acordo com o teorema do limite central. Além disso, o uso de bins pode limitar a resolução da segmentação, pois os bins restringem os limites do segmento a ser um subconjunto dos limites do bin. Finalmente, o uso de bins pode gerar chamadas falso-negativas (ou seja, pontos de interrupção ausentes) para CNAs cujo tamanho é próximo ou menor do que o tamanho do bin, pois o número de bins nesse segmento é tão pequeno que o sinal muitas vezes é confundido com ruído e não será chamado de CNA. Para o scDNAseq, isso poderia levar a CNAs falso-negativos, que têm centenas de milhares de pares de bases de comprimento, já que o tamanho do compartimento costuma ser em torno de 200 kbp [27].

Correção GC

A correção de GC é uma etapa necessária devido à queda da cobertura de leitura nas regiões com conteúdos extremos de GC [59, 60], um fenômeno conhecido como viés de GC. Como o conteúdo de GC é a porcentagem dos nucleotídeos sendo G ou C frequentemente medidos dentro de uma determinada região genômica, uma etapa de binning é necessária para dividir todo o genoma em vários compartimentos. Assim, uma etapa de categorização sempre precede uma etapa de correção de GC para a maioria dos métodos. A correção de GC começa com a modelagem da mudança de contagem de leitura em relação ao conteúdo de GC e é específica para cada célula, pois diferentes bibliotecas de preparação de amostra podem produzir curvas diferentes de contagem de leitura em relação ao conteúdo de GC. A contagem de leitura em cada compartimento é então normalizada e corrigida. A maioria dos métodos corrige o viés de GC sob a suposição de que a maioria do genoma é diplóide e não abriga variações / alterações no número de cópias. Tal suposição, entretanto, não é necessariamente verdadeira. Especificamente, os genomas tumorais podem ser aneuploides e, portanto, conter amplificações cromossômicas [27]. Quando nenhum número de cópia domina o perfil de número de cópia de um genoma, deve-se considerar em qual número de cópia esse bin está ao modelar sua contagem de leitura pelo conteúdo GC [61]. Para fazer isso, uma pré-segmentação e estimativa do número absoluto de cópias são necessárias para a correção do GC. SCOPE [62] fornece uma correção de GC específica para célula e compartimento que aborda tal cenário. A estratégia de correção de GC em dados de célula única não difere muito daquela dos dados de sequenciamento em massa, embora o número da cópia verdadeira em dados de célula única seja um inteiro, ao passo que não precisa ser um inteiro em dados de sequenciamento em massa, pois é uma média de copie números de milhares de células.

Correção de mapeabilidade

A capacidade de mapeamento de uma região genômica é determinada pela porcentagem das posições mapeáveis ​​exclusivamente nesta região. Semelhante à correção de GC, uma etapa de binning é necessária para que todo o genoma possa ser dividido em vários bins para uma medida da capacidade de mapeamento de cada bin. Se um bin é composto principalmente de N nucleotídeos ou regiões repetitivas, sua capacidade de mapeamento é possivelmente baixa. O processo de determinação das posições exclusivamente mapeáveis ​​é descrito acima. A correção das contagens de leitura de acordo com a capacidade de mapeamento pode seguir o mesmo processo da correção de GC, ou seja, aprender a curva da contagem de leitura em relação à capacidade de mapeamento de cada compartimento e normalizar a contagem de leitura de acordo para remover o efeito da capacidade de mapeamento por LOWESS regressão ou uma função paramétrica. Conforme descrito acima, o uso de compartimentos de tamanho variável visa corrigir a capacidade de mapeamento desigual, resultando no mesmo número de leituras exclusivamente mapeáveis ​​em cada compartimento. No entanto, corrigir a capacidade de mapeamento com base em um arquivo de mapeamento pré-computado restringe a ferramenta de detecção de CNA a certas versões de referência do genoma humano.

Remoção de caixas atípicas

Bins que são identificados como outliers são removidos de análises adicionais por suas posições genômicas, conteúdo de GC ou suas contagens de leitura. Na maioria das vezes, as caixas no centrômero ou telômero de um cromossomo, com conteúdo GC extremo ou com contagens de leitura zero ou extremamente altas, são identificadas como outliers. Remover bins outlier pode reduzir chamadas de falso positivo. Mas como selecionar caixas atípicas faz diferença entre os métodos. O processo de seleção é mais flexível e adaptável aos dados se for orientado por dados, ou seja, o limite para determinar quais bins são outliers é uma função dos dados em vez de fornecido diretamente pelas ferramentas de detecção de CNA. Ginkgo [58], por exemplo, listas negras de "caixas ruins" usando 54 células normais existentes sem entrada dos dados em mãos, enquanto HMMcopy [16] e SCOPE [62] modelam a contagem de leitura em cada caixa como uma distribuição e detectam os outliers nos dados com base nesta distribuição.

Remoção de células outlier

As células são identificadas como outliers e removidas de análises adicionais se sua cobertura for menor do que o esperado [27, 57], ou seu coeficiente de Gini for maior do que o esperado [62]. Quanto mais alto o coeficiente de Gini, mais heterogeneidade / flutuação na profundidade de leitura e mais difícil inferir CNAs. Tanto a baixa cobertura quanto o grande coeficiente de Gini indicam uma potencial falha na preparação da biblioteca. Remover células discrepantes é importante para análises posteriores, como recuperar a árvore filogenética ou agrupar as células. Espera-se que as células com coeficiente de Gini extremamente alto tenham um grande número de chamadas CNA falso-positivas, pois as contagens de leitura tornam-se ruidosas e as ferramentas de detecção de CNA podem contá-las falsamente como sinais CNA. Portanto, tais células não devem ser consideradas na inferência do CNA.

Segmentação e chamada de número de cópia absoluta

As duas últimas etapas de um protocolo de detecção de CNA de 7 etapas são as seguintes:

Segmentação. Identificar os limites (localizações físicas) entre as regiões genômicas que possuem diferentes números absolutos de cópias.

Chamando os números absolutos de cópia. Inferindo o número absoluto real de cópias em cada segmento.

Segmentação

Existem três abordagens para segmentação (Fig. 2): uma abordagem de janela deslizante, uma abordagem baseada em função objetivo e uma abordagem baseada em HMM. A abordagem da janela deslizante segmenta o genoma por meio de testes estatísticos, procurando regiões cujas contagens de leitura diferem muito das demais regiões. Os métodos que usam a abordagem de janela deslizante não calculam o número absoluto de cópias simultaneamente com a segmentação. É necessária uma abordagem de pós-processamento, que geralmente envolve testar diferentes candidatos de ploidia e selecionar aquele cujo perfil de número de cópia resultante é o mais próximo possível de números inteiros. A abordagem baseada em função objetivo combina a aproximação dos dados e a limitação dos pontos de interrupção em uma fórmula. Essas abordagens modelam a contagem de leituras (normalizada) por uma função constante por partes, de modo que a função (i) esteja em fidelidade aos dados tanto quanto possível e (ii) tenha o mínimo de alterações possível. Como a abordagem de janela deslizante, os métodos baseados na abordagem da função objetivo não atribuem necessariamente simultaneamente um número de cópia absoluto a cada segmento. Finalmente, na abordagem baseada em HMM, os estados correspondem aos diferentes números absolutos de cópias possíveis e as transições entre os estados capturam a segmentação (ou seja, a transição para fora de um estado no bin eu denota que caixas eu-1 e eu pertencem a dois segmentos diferentes). Devido à sua capacidade de modelar centenas de células em uma função objetivo, a abordagem da função objetivo é mais adequada para a identificação simultânea de pontos de interrupção em células amostradas.

As três abordagens para segmentação. Em todos os três painéis, um gráfico de dispersão da contagem de leitura por compartimento em relação à posição genômica do compartimento é mostrado. uma A abordagem da janela deslizante. Uma janela é passada através do genoma e uma região genômica dentro de uma janela que é significativamente diferente em termos de contagem de leitura do resto do genoma (por exemplo, a janela definida pelas duas linhas verticais pontilhadas) é declarada como um segmento. b A abordagem baseada na função objetivo. Três funções constantes por partes são mostradas (duas em vermelho e uma em verde) e representam os candidatos à segmentação. Cada peça na função corresponde a um segmento, e o valor da peça corresponde ao número da cópia naquele segmento. A função em verde é a ideal com relação à fidelidade aos dados e à restrição do número de pontos de interrupção, enquanto as duas em vermelho são super-segmentadas (parte superior) ou sub-segmentadas (parte inferior). c A abordagem baseada em HMM. Os estados do HMM correspondem aos diferentes números de cópias, e uma transição entre dois estados diferentes indica uma mudança no segmento. No painel de contagem de leitura, as cores dos pontos representam o número de cópia absoluto das várias caixas genômicas (vermelho para 1, amarelo para 2 e verde para 4) conforme obtido pela análise dos dados em relação ao HMM (parte inferior). O caminho real das transições de estado é mostrado no meio e destacado com setas azuis no HMM também. As setas são numeradas para indicar a ordem das transições

Chamando os números absolutos de cópia

Exceto para métodos baseados em HMM, que identificam o número absoluto de cópias junto com a segmentação, todos os outros métodos requerem uma etapa de pós-processamento para identificar o número absoluto de cópias para cada segmento após a segmentação ter sido obtida. Quando as informações de ploidia de DNA estão disponíveis, por exemplo, por meio de dados de citometria de fluxo, o número absoluto de cópias de um segmento pode ser calculado multiplicando-se a ploidia de todo o genoma pela contagem de leitura nesse segmento, dividida pela contagem média de leitura em todo o genoma [27 , 58]. Quando as informações de ploidia de DNA não estão disponíveis, um multiplicador de número de cópias deve ser encontrado, o que melhor se aproxima das contagens de leitura normalizadas em cada compartimento para seu número inteiro mais próximo. Uma vez que os métodos baseados em HMM produzem uma segmentação e números de cópia absolutos ao mesmo tempo, a seleção da ploidia é essencial para determinar o perfil do número de cópias em todo o genoma. Observamos que o HMMcopy nem sempre seleciona a ploidia certa [54], levando à inferência errada do número de cópias para todo o genoma. A visualização dos perfis de CNA de um grupo de células geralmente é feita por mapas de calor, um exemplo do qual pode ser visto em [27].


Os números de cópias dos genes da topoisomerase-1 e -2A são elevados em cânceres colorretais proficientes em reparo de incompatibilidade

Introdução: Topoisomerase 1 (TOP1) e 2A (TOP2A) são potenciais biomarcadores preditivos para o tratamento com irinotecano e antraciclina, respectivamente, no câncer colorretal (CRC), e recentemente relatamos uma alta frequência de ganho de gene dos genes TOP1 e TOP2A no CRC. Além disso, os subtipos de Reparo Mismatch (MMR) de CRC foram associados ao benefício da quimioterapia adjuvante de CRC primário. Dado o envolvimento das enzimas topoisomerase na replicação e reparo do DNA, levantamos a hipótese de que pode existir uma associação entre o número de cópias do gene TOP e a proficiência / deficiência de MMR em CRC.

Material e métodos: Coorte de teste: a análise de FISH com uma mistura de sonda TOP1 / CEN20 interna e uma mistura de sonda TOP2A / CEN17 disponível comercialmente (Dako, Glostrup, Dinamarca) foi realizada em amostras de tecido de arquivo fixadas em formalina e embebidas em parafina (FFPE) de 18 pacientes com MMR proficiente (pMMR) CRC e 18 pacientes com MMR deficiente (dMMR) CRC. Os números de cópias dos genes TOP1 e TOP2A e suas proporções por núcleo foram correlacionados com o status MMR usando o teste de Mann-Whitney. Coorte de validação: as amostras de FFPE de 154 pacientes com CRC de estágio III primário (originalmente incluídas no estudo RANX05) foram classificadas de acordo com o status de MMR por análise imunohistoquímica usando anticorpos validados para MLH1, MLH2, MSH6 e PMS2, e informações sobre TOP1, CEN20, TOP2A e o status CEN17 foi publicado anteriormente para esta coorte.

Resultados: Os números de cópias do gene TOP1 observados na coorte de teste de 36 CRC foram significativamente maiores (p & lt 0,01) no subgrupo pMMR (média: 3,84, SD: 2,03) do que no subgrupo dMMR (média: 1,50, SD: 0,12). Da mesma forma, os números de cópias TOP2A foram significativamente maiores (p & lt 0,01) no subgrupo pMMR (média: 1,99, SD: 0,52) do que no subgrupo dMMR (média: 1,52, SD: 0,10). Essas descobertas foram confirmadas na coorte de validação, em que no subgrupo pMMR 51% tinham ≥2 cópias TOP1 extras por célula, enquanto todos os tumores classificados como dMMR tinham status diplóide TOP1 e os números médios de cópias TOP2A eram 2,30 (SD: 1,36) e 1,80 ( SD: 0,31) (p = 0,01) no subgrupo pMMR vs. subgrupo dMMR, respectivamente.

Discussão e conclusão: Nossos resultados mostram que o número de cópias dos genes TOP1 e TOP2A está aumentado no subgrupo pMMR. Propomos que esta preferência pode refletir uma pressão seletiva para ganhar e / ou manter as cópias extras ganhas de genes de topoisomerase cujos produtos são necessários para lidar com o alto estresse de replicação presente nos tumores pMMR, proporcionando assim uma vantagem de sobrevivência seletivamente em tumores pMMR. Estudos futuros devem testar este conceito e explorar as diferenças potenciais entre os tumores pMMR e dMMR em resposta aos inibidores Top1 e Top2.

Palavras-chave: Instabilidade cromossômica FISH Número da cópia do gene MMR Topoisomerase 1 Topoisomerase 2A.


Aplicação de PCR digital de gotículas para estimar estados do número de cópias do vetor na terapia gênica de células-tronco

A transferência estável de genes para populações de células-alvo por meio de vetores virais integrados é amplamente utilizada na terapia gênica com células-tronco (SCGT). A estimativa precisa do número de cópias vetoriais (VCN) tornou-se cada vez mais importante. No entanto, os métodos existentes de estimativa, como PCR quantitativo em tempo real, são mais restritos na praticidade, especialmente durante os ensaios clínicos, dada a disponibilidade limitada de materiais de amostra dos pacientes. Este estudo demonstra a aplicação de uma tecnologia emergente chamada droplet digital PCR (ddPCR) na estimativa de estados de VCN no contexto de SCGT. Células-tronco pluripotentes induzidas (iPSCs) derivadas de um paciente com doença granulomatosa crônica ligada ao X foram usadas como células alvo clonáveis ​​para transdução com vetores alfaretrovirais contendo cDNA de CYBB otimizado para códons. O projeto preciso da sonda-primer seguido por análise multiplex conferiu especificidade de ensaio. A estimativa precisa dos valores de VCN por célula foi possível sem depender de uma curva padrão de referência. A sensibilidade era alta e a faixa dinâmica de detecção era ampla. A confiabilidade do ensaio foi validada pela observação de padrões de agrupamento VCN consistentes, reproduzíveis e distintos para clones de iPSCs transduzidos com vários números de cópias do transgene. Tomados em conjunto, o uso de ddPCR parece oferecer uma abordagem prática e robusta para a estimativa de VCN com uma ampla gama de aplicações clínicas e de pesquisa.

Palavras-chave: células-tronco pluripotentes induzidas por PCR digital de gota de doença granulomatosa crônica que integram o número de cópias do vetor de vetores.

Declaração de conflito de interesse

Divulgação do autor Y.Y. e S.I. são atualmente empregados pela Bio-Rad Laboratories.

Bonecos

Projeto do primer e especificidade do alvo.…

Desenho do primer e especificidade do alvo. (uma) Setas bidirecionais indicam diferenças no design do primer ...

Estimativa de VCN em células PLB. ...

Estimativa de VCN em células PLB. Para estimar os valores médios de VCN, as concentrações (cópias / μl) ...

Sensibilidade do ensaio após diluição da amostra ...

Sensibilidade do ensaio após diluição da amostra com não otimizado para códons CYBB - contendo gDNA. (uma) Estimar…

Determinação da variabilidade do ensaio. Para…

Determinação da variabilidade do ensaio. Para determinar a variabilidade do ensaio com redução de quantidades de modelo, ...

Amostra de pré-digestão com enzimas de restrição ...

A pré-digestão da amostra com enzimas de restrição reduz a variabilidade do ensaio. A linha S91PN1 de transduzida…

Distribuição de VCN em clonado ...

Distribuição de VCN em iPSCs clonados. Clones de célula única de três linhas iPSC transduzidas ...


Afiliações

Smurfit Institute of Genetics, Trinity College Dublin, University of Dublin, Dublin 2, Irlanda

Alan M. Rice e amp Aoife McLysaght

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Contribuições

A.McL. e A.M.R. concebeu o estudo. A.M.R. realizaram experimentos. A.M.R. e A.McL. analisou os dados e redigiu o manuscrito.

Autor correspondente


A variação do número de cópias está associada à alteração da expressão gênica em arquéias

A instabilidade genômica, embora frequentemente deletéria, também é um mecanismo importante para a adaptação microbiana às mudanças ambientais. Embora amplamente estudado em bactérias, em arqueas o efeito da instabilidade genômica sobre os fenótipos e a aptidão do organismo permanece obscuro. Aqui, usamos métodos de segmentação de DNA para detectar e quantificar a variação do número de cópias em todo o genoma (CNV) em grandes compêndios de conjuntos de dados de alto rendimento em uma espécie de archaeal modelo, Halobacterium salinarum. Pontos quentes de CNV foram identificados em todo o genoma. Alguns hotspots foram fortemente associados a mudanças na expressão gênica, sugerindo um mecanismo de inovação fenotípica. Em contraste, os hotspots de CNV em outros loci genômicos deixaram a expressão inalterada, sugerindo tamponamento de certos fenótipos. A correspondência de CNVs com a expressão gênica foi validada com transcriptômica pareada de cepas e condições e experimentos de quantificação de DNA em loci específicos. Correlação significativa de locais de hotspot CNV com as posições de elementos de sequência de inserção (IS) conhecidos sugeriram um mecanismo para gerar instabilidade genômica. Dada a capacidade de recombinação eficiente em H. salinarum, apesar da estabilidade no nível de um único nucleotídeo, esses resultados sugerem que a plasticidade genômica mediada pela atividade do elemento IS pode fornecer uma fonte de inovação fenotípica em ambientes extremos.

Palavras-chave: archaea genômica computacional, variação do número de cópias, plasticidade genômica.

Declaração de conflito de interesse

Os autores declaram não haver conflito de interesses.

Bonecos

Processamento de microarray e fluxo de trabalho de ...

Processamento de microarray e fluxo de trabalho de análise de breakpoint cromossômico. O fluxo de trabalho consistia em (a) ...

Regiões de expressão gênica correlacionada ...

Regiões de expressão gênica correlacionada nos megaplasmídeos de H. salinarum . (uma)…

A amplificação genômica em grande escala influencia o gene ...

A amplificação genômica em grande escala influencia a expressão gênica. (a) Mudanças na expressão gênica na fase logarítmica média ...

Grandes aglomerados de genes sintênicos são ...

Grandes aglomerados de genes sintênicos são co-expressos. (a) Mapa composto de frequência de segmento significativo ...

Localizações de CNVs cromossômicas frequentes ...

Localizações de CNVs cromossômicas frequentes observadas em dados de microarray de entrada de ChIP. (a) Composto ...

Validação de RNA-seq e qPCR de ...

Validação de RNA-seq e qPCR de eventos de exclusão no H. salinarum cromossoma. (uma)…

CNVs estão significativamente associados a ...

CNVs estão significativamente associados a elementos IS. (a) Localização de sobreposição de todos ...


Câncer hereditário de mama e ovário: avaliação de mutações pontuais e variações no número de cópias em pacientes brasileiras

Fundo: Mutações da linha germinativa em BRCA1 e BRCA2 (BRCA1 / 2) e outros genes de suscetibilidade foram identificados como causas genéticas de câncer hereditário de mama e ovário (HBOC). Para identificar as mutações causadoras da doença em uma coorte de 120 mulheres brasileiras que atendem aos critérios para HBOC, realizamos uma triagem abrangente de BRCA1 / 2, TP53 R337H, CHEK2 1100delC, seguido por uma análise das variações do número de cópias em 14 suscetibilidade adicional ao câncer de mama genes (PTEN, ATM, NBN, RAD50, RAD51, BRIP1, PALB2, MLH1, MSH2, MSH6, TP53, CDKN2A, CDH1 e CTNNB1).

Métodos: O sequenciamento capilar e a amplificação de sonda dependente de ligação múltipla (MLPA) foram usados ​​para detectar mutações pontuais e variações do número de cópias (CNVs), respectivamente, para os genes BRCA1 e BRCA2, o sequenciamento capilar foi usado para mutação pontual para ambas as variantes TP53 R337H e CHEK2 1100delC, e finalmente a hibridização genômica comparativa de array (array-CGH) foi usada para identificar CNVs nos 14 genes adicionais.

Resultados: A taxa de detecção positiva em nossa série foi de 26%. Mutações patogênicas BRCA1 foram encontradas em 20 casos, incluindo dois casos com CNVs, enquanto mutações BRCA2 foram encontradas em 7 casos. Também encontramos três pacientes com a mutação TP53 R337H e um paciente com a mutação CHEK2 1100delC. Sete (25%) mutações patogênicas em BRCA1 / 2 foram descritas pela primeira vez, incluindo uma mutação BRCA1 de local de splice para a qual a patogenicidade foi confirmada pela presença de um transcrito aberrante mostrando a perda dos últimos 62 bp do exon 7. Microdeleções do exon 4 em ATM e exon 2 em PTEN foram identificados em pacientes com mutação BRCA2 e negativos para BRCA1 / 2, respectivamente.

Conclusões: Em resumo, nossos resultados mostraram uma alta frequência de mutações BRCA1 / 2 e uma maior prevalência do gene BRCA1 (64,5%). Além disso, a detecção da variante TP53 R337H em nossa série e o fato de que essa variante tem um efeito fundador em nossa população nos levou a sugerir que todas as pacientes com câncer de mama do sexo feminino com critérios clínicos para HBOC e negativos para genes BRCA1 / 2 deveriam ser testadas para a variante TP53 R337H. Além disso, a presença de rearranjo estrutural genômico resultando em CNVs em outros genes que predispõem o câncer de mama em conjunto com mutações pontuais BRCA2 demonstrou uma etiologia genética altamente complexa em famílias brasileiras de câncer de mama.