Em formação

Como os eventos de cotranscrição afetam o splicing?


Quero saber como e com que frequência ocorre a cootranscrição? Os reguladores de transcrição podem influenciar o splicing durante a co-transcrição?


O splicing co-transcricional (CTS) é muito difundido. Diferentes estudos (feitos em diferentes tipos de células) relatam diferentes frequências de CTS. A maioria deles relata uma frequência de ~ 0,8 em células diferentes, exceto para o fígado de camundongo, que foi relatado como tendo uma frequência de 0,45. Este é o artigo que resume esses diferentes estudos.

Os reguladores de transcrição podem influenciar o splicing durante a co-transcrição?

Sim ... incluindo fatores como as posições dos nucleossomos ... esta postagem pode ser útil.


Como os eventos de cotranscrição afetam o splicing? - Biologia

Nos últimos 10 anos, muita atenção tem sido focada na formação do complexo de pré-iniciação da transcrição como um alvo para regular a expressão do gene, e outros alvos, como a montagem do complexo de terminação da transcrição, foram investigados de forma menos intensiva. Estabelecemos a existência de escolha do sítio poli (A) e splicing de fusão de dois genes adjacentes, galactose-1-fosfato uridililtransferase (GALT) e cadeia α do receptor de interleucina-11 (IL-11Rα), em células humanas normais. Esta unidade de transcrição de 16 quilobases (kb) contém dois promotores (o primeiro é constitutivo e o segundo, 8 kb a jusante, é altamente regulado) e dois sinais de clivagem / poliadenilação separados por 12 kb. O promotor do gene GALT produz dois mRNAs, um mRNA de 1,4 kb que codifica GALT e um mRNA de fusão de 3 kb quando o primeiro sítio poli (A) é dividido e o segundo poli (A) é usado. O mRNA de 3 kb codifica uma proteína de fusão de função desconhecida, contendo parte da proteína GALT e toda a proteína IL-11Rα. O promotor GALT / transcrito de IL-11Rα poli (A) resulta de terminação com vazamento e splicing alternativo. Esta característica da transcrição de RNA polimerase (pol) II, que contrasta com a terminação eficiente de RNA pol I e ​​pol III, pode estar envolvida, juntamente com rearranjos cromossômicos, na geração de proteínas de fusão com múltiplos domínios e teria implicações evolutivas importantes em termos de processos naturais para gerar novas proteínas com motivos comuns. Nossos resultados, juntamente com o acúmulo de informações genômicas, estimularão novas considerações e experimentos em estudos de expressão gênica.


Detecção de eventos de splicing aberrantes em dados de RNA-seq usando FRASER

O splicing aberrante é uma das principais causas de doenças raras. No entanto, sua previsão apenas da sequência do genoma permanece na maioria dos casos inconclusiva. Recentemente, o sequenciamento de RNA provou ser uma via complementar eficaz para detectar splicing aberrante. Aqui, desenvolvemos o FRASER, um algoritmo para detectar splicing aberrante de dados de sequenciamento de RNA. Ao contrário dos métodos existentes, o FRASER captura não apenas o splicing alternativo, mas também eventos de retenção de íntrons. Isso normalmente dobra o número de eventos aberrantes detectados e identificou uma retenção patogênica de íntron em MCOLN1 causando mucolipidose. O FRASER controla automaticamente os fatores de confusão latentes, que são generalizados e afetam substancialmente a sensibilidade. Além disso, o FRASER é baseado em uma distribuição de contagem e correção de teste múltiplo, reduzindo assim o número de chamadas em duas ordens de magnitude sobre os pontos de corte de pontuação z comumente aplicados, com uma pequena perda de sensibilidade. A aplicação de FRASER ao diagnóstico de doenças raras é demonstrada pela redefinição da prioridade de um truncamento de exon aberrante patogênico na TAZ a partir de um conjunto de dados publicado. O FRASER é fácil de usar e está disponível gratuitamente.

Declaração de conflito de interesse

Os autores declaram não haver interesses conflitantes.

Bonecos

Fig. 1. A detecção de emenda aberrante FRASER ...

Fig. 1. O fluxo de trabalho de detecção de splicing aberrante FRASER.

O fluxo de trabalho começa com leituras alinhadas de RNA-seq ...

Fig. 2. O FRASER corrige as covariações em ...

Fig. 2. O FRASER corrige as covariâncias no uso do aceitador alternativo.

Fig. 3. Detecção de outlier de emenda com base em ...

Fig. 3. Detecção de outlier de splicing com base na distribuição beta-binomial.

Fig. 4. Benchmark usando outliers injetados artificialmente ...

Fig. 4. Benchmark usando outliers injetados artificialmente para uso de aceitador alternativo.


Predição e quantificação de eventos de emenda a partir de dados de RNA-Seq

A análise de variantes de splice a partir de dados de RNA-seq de leitura curta permanece um problema desafiador. Aqui, apresentamos um novo método para a predição guiada pelo genoma e quantificação de eventos de splice a partir de dados de RNA-seq, que permite a análise de eventos de splice complexos e não anotados. Junções de junção e exões são previstos a partir de leituras mapeadas para um genoma de referência e são montados em um gráfico de junção de todo o genoma. Os eventos de emenda são identificados recursivamente a partir do gráfico e são quantificados localmente com base nas leituras que se estendem até o início ou fim de cada variante de emenda. Avaliamos a precisão da previsão com base em dados simulados e reais de RNA-seq e ilustramos como diferentes alinhadores de leitura (GSNAP, HISAT2, STAR, TopHat2) afetam os resultados da previsão. Validamos nossa abordagem para quantificação com base em dados simulados e comparamos as estimativas locais de uso de variantes de emenda relativas com as de outros métodos (MISO, Cufflinks) com base em dados reais e simulados de RNA-seq. Em um estudo de prova de conceito de variantes de splice em 16 tecidos humanos normais (Illumina Body Map 2.0), identificamos 249 exons internos que pertencem a genes conhecidos, mas não estão relacionados a exons anotados. Usando amostras independentes de RNA de 14 tecidos humanos normais correspondentes, validamos 9/9 desses exons por RT-PCR e 216/249 por RNA-seq de extremidade emparelhada (2 x 250 pb). Estes resultados indicam que a previsão de novo de variantes de splice permanece benéfica mesmo em sistemas bem estudados. Uma implementação de nosso método está disponível gratuitamente como um pacote R / Biocondutor [Fórmula: consulte o texto].

Declaração de conflito de interesse

Concorrência de interesses: Os autores deste manuscrito leram a política da revista e têm os seguintes interesses conflitantes: Todos os autores são ou foram funcionários da Genentech Inc. e alguns possuem ações da Roche. RG é um funcionário da 23AndMe Inc. Isso não altera a adesão dos autores às políticas PLOS ONE sobre o compartilhamento de dados e materiais.


Papéis do splicing alternativo na modulação da regulação da transcrição

Fundo: A capacidade de um fator de transcrição de regular seus alvos é modulada por uma variedade de mecanismos genéticos e epigenéticos. O splicing alternativo pode modular a função do gene adicionando ou removendo certos domínios de proteína e, portanto, afetar a atividade da proteína. A engenharia reversa de redes de regulação gênica usando perfis de expressão gênica tem se mostrado valiosa na dissecação das relações lógicas entre várias proteínas durante a regulação transcricional. No entanto, não está claro se o splicing alternativo de certas proteínas afeta a atividade de outros fatores de transcrição.

Resultados: A fim de investigar os papéis do splicing alternativo durante a regulação da transcrição, construímos um modelo estatístico para inferir se os eventos de splicing alternativo das proteínas moduladoras podem afetar a capacidade dos principais fatores de transcrição na regulação dos níveis de expressão de seus alvos de transcrição. Testamos nossa estratégia em KIRC (Kidney Renal Clear Cell Carcinoma) usando os dados de RNA-seq baixados do TCGA (Cancer Genomic Atlas). Identificamos 828de relações de modulação entre os níveis de splicing de proteínas moduladoras e os níveis de atividade de fatores de transcrição. Por exemplo, descobrimos que os níveis de atividade da proteína GR (receptor de glicocorticóide), um fator-chave de transcrição no rim, podem ser influenciados pelo status de splicing de várias proteínas, incluindo TP53, MDM2 (homólogo de duplo minuto 2 de camundongo), RBM14 (RNA proteína de ligação 14) e SLK (STE20 como quinase). Os alvos GR influenciados são enriquecidos pelas principais vias relacionadas ao câncer, incluindo a via de sinalização de p53, ativação de TR / RXR, ativação de CAR / RXR, via de regulação de ponto de verificação G1 / S e via de regulação de ponto de verificação de dano de DNA G2 / M.

Conclusões: Nossa análise sugere, pela primeira vez, que os níveis de inclusão de exon de certas proteínas regulatórias podem afetar as atividades de muitos fatores de transcrição. Tal análise pode potencialmente desvendar um novo mecanismo de como a variação de splicing influencia a função celular e fornecer informações importantes sobre como a desregulação do resultado de splicing pode levar a várias doenças.

Palavras-chave: Splicing alternativo GR Cancro renal Regressão linear MDM2 TP53 Regulação transcricional.


Impacto das mutações do spliceossomo no splicing do RNA na mielodisplasia: genes / vias desreguladas e associações clínicas

SF3B1, SRSF2, e U2AF1 são os genes do fator de splicing com mutação mais frequente nas síndromes mielodisplásicas (SMD). Realizamos uma análise abrangente e sistemática para determinar o efeito desses fatores de splicing comumente mutados no splicing pré-mRNA nas células-tronco / progenitoras da medula óssea e nos precursores eritroides e mieloides no fator de splicing MDS mutante. Usando RNA-seq, determinamos os genes spliced ​​de forma aberrante e as vias desreguladas em células CD34 + de 84 pacientes com SMD. Mutações do fator de splicing resultam em diferentes alterações no splicing e afetam amplamente genes diferentes, mas estes convergem em vias desreguladas comuns e processos celulares, focados no splicing de RNA, síntese de proteínas e disfunção mitocondrial, sugerindo mecanismos comuns de ação na SMD. Muitas dessas vias desreguladas e processos celulares podem estar ligados à fisiopatologia da doença conhecida associada às mutações do fator de splicing na SMD, enquanto vários outros não foram previamente associados à SMD, como a sinalização da sirtuína. Identificamos eventos com splicing aberrante associados a variáveis ​​clínicas e isoformas que predizem de forma independente a sobrevida em MDS e implicam em desregulação da adesão focal e exossomos extracelulares como condutores de baixa sobrevida. Genes com splicing aberrante e vias desreguladas foram identificados nas linhagens afetadas por MDS no fator de splicing MDS mutante. Estudos funcionais demonstraram que o knockdown dos reguladores de mitose SEPT2 e AKAP8, genes alvo unidos de forma aberrante de SF3B1 e SRSF2 mutações, respectivamente, levaram ao comprometimento do crescimento e diferenciação das células eritróides. Este estudo ilumina o efeito das mutações comuns do spliceosome no fenótipo MDS e fornece novos insights sobre a fisiopatologia da doença.

© 2018 pela American Society of Hematology.

Declaração de conflito de interesse

Divulgação de conflito de interesses: Os autores declaram não haver interesses financeiros concorrentes.


Resultados e discussão

Para investigar os efeitos da hibridização e duplicação do genoma na reprogramação do transcriptoma durante a alopoliploidização, reanalisamos os conjuntos de dados RNA-Seq publicados anteriormente de três combinações de cruzamento interespecífico em linhagens de trigo e brássica (Hao et al. 2017 Zhang et al. 2018) (fig. 1A, tabela suplementar 1 e figuras suplementares S1 – S3, material suplementar online). Para combinações de trigo, dois tetraploides de Triticum turgidum (AABB) foram cruzados com diploides Aegilops tauschii (DD) para produzir híbridos triploides (ABD) cujos genomas foram então duplicados para gerar trigo alohexaplóide (AABBDD) (fig. 1A) (Hao et al. 2017). Da mesma forma, diplóides Brassica Rapa (UMArUMAr) e Brassica oleracea (CoCo) foram cruzados para produzir um híbrido (ArCo) que foi usado na geração de brássicas alotetraplóides (ArUMArCoCo) (fig. 1A) (Zhang et al. 2018). Para examinar os respectivos efeitos de hibridização e duplicação do genoma na expressão gênica, genes expressos significativamente diferencialmente (DEGs) foram identificados pela comparação de híbridos com progenitores (Híbrido-vs-Pais) e alopoliploides com híbridos (Alopoliploide-vs-Híbrido), aplicando o critérios “mudança de dobra de expressão ≥2 e taxa de descoberta falsa & lt 0,05” (tabelas suplementares 2-4, Material Suplementar online). Descobrimos que tanto a hibridização quanto a duplicação do genoma podem induzir mudanças dramáticas na expressão em milhares de genes (fig. 1B, fig. S4 suplementar, Material Suplementar online). O efeito combinado de hibridização e duplicação do genoma foi ainda examinado comparando alopoliploides com os pais (Allopolyploid-vs-Parents). Notavelmente, para a maioria das comparações (subgenomas A e B em trigo e subgenoma Ar em brássica), muito menos DEGs foram causados ​​pelo efeito combinado do que aqueles causados ​​por hibridização ou duplicação do genoma sozinha (fig. 1B, fig. S4 suplementar, Material Suplementar online). Por exemplo, para o subgenoma A na combinação 1 de trigo, até 4.759 e 4.735 DEGs foram induzidos por hibridização e duplicação do genoma, respectivamente, enquanto apenas 1.849 DEGs foram causados ​​por seu efeito combinado (fig. 1B). Para o subgenoma D em trigo e subgenoma Co nas brássicas, o número de DEGs causado pelo efeito combinado era ainda muito menor do que a soma de DEGs causados ​​por esses dois eventos isoladamente (fig. 1B, fig. suplementar S4, Material suplementar online).

Comparação da expressão gênica e mudanças na eficiência de splicing induzidas pela hibridização e duplicação do genoma durante a alopoliploidização. (UMA) Representação esquemática da síntese de trigo alopoliplóide e brássica. Esses híbridos e alopoliploides foram produzidos em estudos anteriores, que forneceram os conjuntos de dados usados ​​neste estudo (Hao et al. 2017 Zhang et al. 2018). Para combinações de trigo, dois tetraplóides, Triticum turgidum (AABB) ssp. durum cv. Langdon (LDN) e ssp. turgidum adesão AS2255, foram cruzados com diploides Aegilops tauschii ssp. Tauschii acesso AS60 (DD) para produzir os dois híbridos triplóides (ABD). Os triploides resultantes foram usados ​​para gerar o trigo alohexaplóide (AABBDD) por meio da duplicação do genoma. Para a combinação de brassica, dois diploides Brassica Rapa (UMArUMAr) e Brassica oleracea (CoCo) foram cruzados para produzir o híbrido diplóide (ArCo), que foi então usado para gerar a brassica alotetraploide (ArUMArCoCo) por meio da duplicação do genoma. (B) O número de DEGs causados ​​por hibridização, duplicação do genoma e alopoliplóide na combinação de trigo 1. Os números de DEGs causados ​​pela hibridização (Hybrid-vs-Parents, barras azuis), duplicação do genoma (Allopolyploid-vs-Hybrid, barras azuis), e alopoliploidização (Allopolyploid-vs-Parents, barras vermelhas) são mostradas para cada subgenoma. (C) O número de DSIs causados ​​por hibridização, duplicação do genoma e alopoliploidização na combinação de trigo 1. Os números de DSIs causados ​​pela hibridização (híbrido-vs-pais, barras azuis), duplicação do genoma (alopoliplóide-vs-híbrido, barras azuis) e alopoliploidização (Allopolyploid-vs-Parents, barras vermelhas) são mostradas para cada subgenoma. (D) Correlações significativamente negativas entre as alterações de dobra da expressão gênica causadas pela hibridização e duplicação do genoma na combinação de trigo 1. Todos os DEGs identificados a partir de Hybrid-vs-Parents, Allopolyploid-vs-Hybrid e Allopolyploid-vs-Parents foram analisados ​​e plotados. O PCC de cada comparação é mostrado (P valores & lt 2,2e-16 para todas as comparações). (E) Correlações significativamente negativas entre mudanças de eficiência de splicing causadas por hibridização e duplicação do genoma na combinação de trigo 1. Todos os DSIs identificados de Hybrid-vs-Parents, Allopolyploid-vs-Hybrid e Allopolyploid-vs-Parents foram analisados ​​e plotados. O valor PCC de cada comparação é mostrado (P valores & lt 2,2e-16 para todas as comparações).

Comparação da expressão gênica e mudanças na eficiência de splicing induzidas pela hibridização e duplicação do genoma durante a alopoliploidização. (UMA) Representação esquemática da síntese de trigo alopoliplóide e brássica. Esses híbridos e alopoliploides foram produzidos em estudos anteriores, que forneceram os conjuntos de dados usados ​​neste estudo (Hao et al. 2017 Zhang et al. 2018). Para combinações de trigo, dois tetraplóides, Triticum turgidum (AABB) ssp. durum cv. Langdon (LDN) e ssp. turgidum adesão AS2255, foram cruzados com diploides Aegilops tauschii ssp. Tauschii acesso AS60 (DD) para produzir os dois híbridos triplóides (ABD). Os triploides resultantes foram usados ​​para gerar o trigo alohexaplóide (AABBDD) por meio da duplicação do genoma. Para a combinação de brássicas, dois diploides Brassica Rapa (UMArUMAr) e Brassica oleracea (CoCo) foram cruzados para produzir o híbrido diplóide (ArCo), que foi então usado para gerar a brassica alotetraploide (ArUMArCoCo) por meio da duplicação do genoma. (B) O número de DEGs causados ​​por hibridização, duplicação do genoma e alopoliploidização na combinação de trigo 1. Os números de DEGs causados ​​pela hibridização (Hybrid-vs-Parents, barras azuis), duplicação do genoma (Allopolyploid-vs-Hybrid, barras azuis), e alopoliploidização (Allopolyploid-vs-Parents, barras vermelhas) são mostradas para cada subgenoma. (C) O número de DSIs causados ​​por hibridização, duplicação do genoma e alopoliploidização na combinação de trigo 1. Os números de DSIs causados ​​pela hibridização (híbrido-vs-pais, barras azuis), duplicação do genoma (alopoliplóide-vs-híbrido, barras azuis) e alopoliploidização (Allopolyploid-vs-Parents, barras vermelhas) são mostradas para cada subgenoma. (D) Correlações significativamente negativas entre as alterações de dobra da expressão gênica causadas pela hibridização e duplicação do genoma na combinação de trigo 1. Todos os DEGs identificados a partir de Hybrid-vs-Parents, Allopolyploid-vs-Hybrid e Allopolyploid-vs-Parents foram analisados ​​e plotados. O PCC de cada comparação é mostrado (P valores & lt 2,2e-16 para todas as comparações). (E) Correlações significativamente negativas entre mudanças de eficiência de splicing causadas por hibridização e duplicação do genoma na combinação de trigo 1. Todos os DSIs identificados de Hybrid-vs-Parents, Allopolyploid-vs-Hybrid e Allopolyploid-vs-Parents foram analisados ​​e plotados. O valor PCC de cada comparação é mostrado (P valores & lt 2,2e-16 para todas as comparações).

Para examinar as mudanças de splicing em todo o genoma durante a alopoliplopidização, a eficiência de splicing de cada íntron foi calculada (material suplementar e fig. S5 suplementar, Material Suplementar online). Os íntrons com splicing significativamente diferencial (DSIs) foram identificados pela aplicação dos critérios “mudança de eficiência de splicing ≥ 20% e taxa de descoberta falsa & lt 0,05” (tabelas suplementares 5-7, Material Suplementar online) (Brooks et al. 2011). Descobrimos que os eventos de hibridização e duplicação do genoma podem induzir mudanças na eficiência de splicing em todo o genoma (fig. 1C, fig. S6 suplementar, Material Suplementar online). Curiosamente, para a maioria das comparações (subgenomas A e B em trigo e subgenoma Ar em brássica), havia menos DSIs causados ​​pelo efeito combinado de hibridização e duplicação do genoma em comparação com aqueles causados ​​por qualquer um dos eventos isoladamente (fig. 1C, fig. S6 suplementar, Material Suplementar online). Por exemplo, para o subgenoma A na combinação 1 de trigo, 803 e 604 DSIs foram causados ​​por hibridização e duplicação do genoma, respectivamente, enquanto apenas 423 DSIs foram identificados devido ao seu efeito combinado (fig. 1C). Para o subgenoma D em trigo e subgenoma Co em brássicas, os DSIs causados ​​pelo efeito combinado também foram muito menores do que o total de DSIs causados ​​por esses dois eventos isoladamente (fig. 1C, fig. S6 suplementar, Material suplementar online). Coletivamente, esses resultados indicaram que o efeito combinado da hibridização e duplicação do genoma na expressão do gene e splicing é muito menor do que a simples soma de seus efeitos individuais, o que sugere uma interação entre a hibridização e a duplicação do genoma durante a alopoliploidização.

A relação entre a hibridização e a duplicação do genoma foi ainda examinada comparando a expressão do gene e as alterações de splicing induzidas por esses dois eventos (fig. 1D e E, figs suplementares. S7-S10, Material Suplementar online). Correlações significativamente negativas foram observadas entre as alterações de dobra de expressão induzidas por esses dois eventos para todos os subgêneros em todas as três combinações cruzadas (fig. 1D, figs suplementares. S7 e S8, Material Suplementar online). Por exemplo, o coeficiente de correlação de Pearson (PCC) é de −0,52 a −0,77 para diferentes subgêneros da combinação 1 de trigo (fig. 1D). Além disso, correlações significativamente negativas também foram observadas entre as mudanças de eficiência de splicing causadas pela hibridização e duplicação do genoma, como visto na combinação 1 de trigo, que teve um PCC de -0,65 a -0,72 (fig. 1E, figos suplementares. S9 e S10, Suplementar Material online). Tomados em conjunto, esses resultados indicam que a duplicação do genoma pode causar efeitos globais opostos em comparação com a hibridização em ambos os níveis de expressão gênica e splicing.

Para determinar o quanto a reprogramação do transcriptoma induzida por hibridização em híbridos pode ser recuperada em alopoliploides após a duplicação do genoma, DEGs / DSIs identificados nos híbridos foram classificados em quatro grupos (Material Suplementar online): DEGs / DSIs em híbridos sendo recuperados para níveis parentais em alopoliploides (Grupo 1) DEGs / DSIs em híbridos sendo retidos em alopoliploides (Grupo 2) DEGs / DSIs em híbridos sendo reforçados por duplicação do genoma (Grupo 3) e outros (Grupo 4) (fig. 2A-D). A maioria (89–96%) dos DEGs e DSIs pode ser classificada nos Grupos 1–3 (fig. 2A – D). Notavelmente, para os subgenomas A e B em ambas as combinações de trigo, a maioria da expressão gênica induzida por hibridização e mudanças de eficiência de splicing em híbridos podem ser recuperados para níveis parentais após a duplicação do genoma (Grupo 1, 61-76% para DEGs e 54-75% para DSIs ), enquanto menos foram retidos em alopoliploides (Grupo 2, 15–29% para DEGs e 20–35% para DSIs) (fig. 2A – D). Para o subgênero D no trigo, relativamente mais DEGs / DSIs em híbridos foram retidos em alopoliploides, mas ainda, ∼32% e ∼39% dos DEGs e DSIs em híbridos foram recuperados para níveis parentais por duplicação do genoma, respectivamente (fig. 2A– D). Da mesma forma, na combinação de brássicas, mais DEGs induzidos por hibridização (45-62%) e DSIs (49-63%) foram recuperados para níveis parentais em comparação com aqueles que mantiveram suas mudanças induzidas por hibridização (31-42% para DEGs, 27 –41% para DSIs) no alotetraplóide após a duplicação do genoma (fig. 2A – D). Também descobrimos que os DEGs e DSIs sendo recuperados após a duplicação do genoma foram distribuídos entre todos os cromossomos sem preferência aparente, o que indicou que esse "efeito de recuperação" é comum entre todos os cromossomos (figs suplementares. S11 e S12, material suplementar online) . Além disso, a maioria dos DEGs (51-70%) ou DSIs (60-69%) causados ​​pela duplicação do genoma também foram encontrados para ser devido à reversão para os níveis parentais (figura suplementar S13, Material Suplementar online). Conclusivamente, a reprogramação do transcriptoma induzida por hibridização em híbridos pode ser recuperada globalmente em alopoliploides após a duplicação do genoma.

Classificação de DEGs e DSIs identificados em híbridos quando comparados com seus pais. (UMA) Classificação dos DEGs identificados nos híbridos em comparação com seus pais. Esses DEGs foram classificados em quatro grupos: A expressão alterada em híbridos foi recuperada para os níveis parentais por duplicação do genoma (Grupo 1) a expressão alterada em híbridos permaneceu em alopoliplóides após duplicação do genoma (Grupo 2), as alterações de expressão induzidas por hibridização foram reforçadas pela duplicação do genoma (Grupo 3, a duplicação do genoma causou mudanças na mesma direção que a causada pela hibridização) e outras (Grupo 4). (B) Classificação dos DSIs identificados em híbridos em comparação com seus pais. Todos os DSIs foram classificados em quatro grupos: eficiência de splicing alterada em híbridos recuperados aos níveis parentais por duplicação do genoma (Grupo 1) eficiência de splicing alterada em híbridos permaneceu em alopoliploides após duplicação do genoma (Grupo 2) as alterações de splicing induzidas por hibridização foram reforçadas pela duplicação do genoma ( Grupo 3, duplicação do genoma causou mudança na mesma direção que aquela causada pela hibridização) e outras (Grupo 4). (C) Os perfis de expressão de DEGs nos Grupos 1-3 da análise de classificação em (UMA) DEGs do mesmo grupo de todos os subgenomas foram plotados juntos e cada gene é representado por cada linha única. Os números de DEGs em cada subgenoma são indicados. Os genes regulados positivamente e regulados negativamente em híbridos são representados por linhas vermelhas e azuis, respectivamente. (D) Os perfis de eficiência de splicing de DSIs nos Grupos 1–3 da análise de classificação em (B) DSIs do mesmo grupo de todos os subgêneros foram plotados juntos e cada íntron é representado por cada linha única. Os números de DSIs em cada subgenoma são indicados. Os íntrons com eficiência de splicing aumentada e eficiência de splicing diminuída em híbridos são representados por linhas vermelhas e azuis, respectivamente.

Classificação de DEGs e DSIs identificados em híbridos quando comparados com seus pais. (UMA) Classificação dos DEGs identificados nos híbridos em comparação com seus pais. Esses DEGs foram classificados em quatro grupos: A expressão alterada em híbridos foi recuperada para os níveis parentais por duplicação do genoma (Grupo 1) a expressão alterada em híbridos permaneceu em alopoliplóides após duplicação do genoma (Grupo 2), as alterações de expressão induzidas por hibridização foram reforçadas pela duplicação do genoma (Grupo 3, a duplicação do genoma causou mudanças na mesma direção que aquela causada pela hibridização) e outras (Grupo 4). (B) Classificação dos DSIs identificados em híbridos em comparação com seus pais. Todos os DSIs foram classificados em quatro grupos: eficiência de splicing alterada em híbridos recuperados aos níveis parentais por duplicação do genoma (Grupo 1) eficiência de splicing alterada em híbridos permaneceu em alopoliploides após duplicação do genoma (Grupo 2) as alterações de splicing induzidas por hibridização foram reforçadas pela duplicação do genoma ( Grupo 3, duplicação do genoma causou mudança na mesma direção que aquela causada pela hibridização) e outras (Grupo 4). (C) Os perfis de expressão de DEGs nos Grupos 1-3 da análise de classificação em (UMA) DEGs do mesmo grupo de todos os subgenomas foram plotados juntos e cada gene é representado por cada linha única. Os números de DEGs em cada subgenoma são indicados. Os genes regulados positivamente e regulados negativamente em híbridos são representados por linhas vermelhas e azuis, respectivamente. (D) Os perfis de eficiência de splicing de DSIs nos Grupos 1-3 da análise de classificação em (B) DSIs do mesmo grupo de todos os subgêneros foram plotados juntos e cada íntron é representado por cada linha única. Os números de DSIs em cada subgenoma são indicados. Os íntrons com eficiência de splicing aumentada e eficiência de splicing diminuída em híbridos são representados por linhas vermelhas e azuis, respectivamente.

Tendo observado a recuperação de mudanças de expressão gênica induzidas por hibridização por duplicação do genoma, nós tentamos determinar a contribuição relativa da hibridização e duplicação do genoma para a reprogramação final do transcriptoma em alopoliploides. Os DEGs e DSIs identificados a partir de comparações entre alopoliploides e seus pais foram agrupados em três grupos de acordo com a contribuição relativa da hibridização e duplicação do genoma (Material Suplementar online): DEGs / DSIs causados ​​principalmente pela hibridização (Grupo 1) DEGs / DSIs causados ​​principalmente por duplicação do genoma (Cluster 2) e DEGs / DSIs contribuíram significativamente para ambos os eventos (Cluster 3) (fig. 3A e B, figs suplementares S14 e S15, Material Suplementar online). Cerca de 34-55% dos DEGs e 31-51% dos DSIs identificados em alopoliploides foram causados ​​principalmente por hibridização, e quantidades comparáveis ​​de DEGs (21-45%) e DSIs (23-43%) foram encontrados para ser principalmente causada pela duplicação do genoma (fig. 3A e B, figs. S14 e S15 suplementares, Material Suplementar online). Relativamente menos DEGs e DSIs foram contribuídos por ambos os eventos com a mesma tendência (fig. 3A e 3B, figs. S14 e S15 suplementares, Material Suplementar online). Esses resultados sugeriram que tanto a hibridização quanto a duplicação do genoma contribuíram substancialmente e comparativamente para a reprogramação do transcriptoma em alopoliplóides. Além disso, a contribuição relativa da hibridização e duplicação do genoma variou entre os diferentes subgenomas e espécies. Por exemplo, na combinação 1 de trigo, mais DEGs foram contribuídos pela hibridização nos subgênomos A e B, enquanto mais DEGs foram contribuídos pela duplicação do genoma no subgênero D (fig. 3A).

Classificação de DEGs e DSIs identificados em alopoliploides quando comparados com seus pais. (UMA) Classificação de DEGs identificados em alopoliploides em comparação com seus pais na combinação de trigo 1. Todos os DEGs podem ser classificados em três grupos: mudanças de expressão causadas principalmente por hibridização (Grupo 1) mudanças de expressão causadas principalmente por duplicação do genoma (Grupo 2) e mudanças de expressão significativamente contribuiu para a hibridização e duplicação do genoma com a mesma tendência (Cluster 3). Alopoliploidização: mudanças de dobra de expressão entre alopoliploides e pais Hibridização: mudanças de dobra de expressão entre híbridos e pais Duplicação do genoma: mudanças de dobra de expressão entre alopoliploides e híbridos. As alterações de dobra de expressão são mostradas em mapas de calor. Genes regulados positivamente e regulados negativamente são coloridos em vermelho e azul, respectivamente. A intensidade da cor reflete a magnitude da alteração da dobra. (B) Classificação de DSIs identificados em alopoliploides em comparação com seus pais na combinação de trigo 1. Todos os DSIs podem ser classificados em três grupos: mudanças de eficiência de splicing causadas principalmente por hibridização (Cluster 1) mudanças de eficiência de splicing causadas principalmente por duplicação do genoma (Cluster 2) e splicing mudanças de eficiência contribuíram significativamente para a hibridização e duplicação do genoma com a mesma tendência (Cluster 3). As mudanças na eficiência de emenda são mostradas em mapas de calor. Os íntrons com eficiência de splicing aumentada e diminuída são coloridos em vermelho e azul, respectivamente. A intensidade da cor reflete a magnitude da mudança na eficiência da emenda.

Classificação de DEGs e DSIs identificados em alopoliploides quando comparados com seus pais. (UMA) Classificação de DEGs identificados em alopoliploides em comparação com seus pais na combinação de trigo 1. Todos os DEGs podem ser classificados em três grupos: mudanças de expressão causadas principalmente por hibridização (Grupo 1) mudanças de expressão causadas principalmente por duplicação do genoma (Grupo 2) e mudanças de expressão significativamente contribuiu para a hibridização e duplicação do genoma com a mesma tendência (Cluster 3). Alopoliploidização: alterações de dobra de expressão entre alopoliploides e pais Hibridização: alterações de dobra de expressão entre híbridos e pais Duplicação do genoma: alterações de dobra de expressão entre alopoliploides e híbridos. As alterações de dobra da expressão são mostradas em mapas de calor. Genes regulados positivamente e regulados negativamente são coloridos em vermelho e azul, respectivamente. A intensidade da cor reflete a magnitude da alteração da dobra. (B) Classificação de DSIs identificados em alopoliploides em comparação com seus pais na combinação de trigo 1. Todos os DSIs podem ser classificados em três grupos: mudanças de eficiência de splicing causadas principalmente por hibridização (Cluster 1) mudanças de eficiência de splicing causadas principalmente por duplicação do genoma (Cluster 2) e splicing mudanças de eficiência contribuíram significativamente para a hibridização e duplicação do genoma com a mesma tendência (Cluster 3). As mudanças na eficiência de emenda são mostradas em mapas de calor. Os íntrons com eficiência de splicing aumentada e diminuída são coloridos em vermelho e azul, respectivamente. A intensidade da cor reflete a magnitude da mudança na eficiência da emenda.

It has long been considered that heterosis in interspecific hybrids can be permanently fixed through genome doubling to form allopolyploids ( Comai 2005 Chen 2010, 2013). The fixation of heterosis can confer advantages to allopolyploids in adaptive evolution ( Comai 2005 Chen 2010). However, little is known about how much heterosis in hybrids can be fixed in allopolyploids, or exactly what role genome doubling plays in the fixation of heterosis. We found that most of the transcriptome reprogramming which occurred in hybrids cannot be fixed in allopolyploids after genome doubling ( fig. 2A–D). As transcriptome reprogramming is an important contributor to heterosis ( Chen 2010, 2013), our results suggest that most of the heterosis resulting from transcriptome reprogramming in interspecific hybrids cannot be fixed in allopolyploids due to the “recovery effect” of genome doubling. Heterosis also arises from other factors, such as combination of different alleles ( Chen 2013). Theoretically, heterotic phenotypes caused by other factors will not be affected by this “recovery effect.” It is also possible that a small number of DEGs were due to homoeologous exchange, although it rarely occurred ( Zhang et al. 2020). However, the distribution of DEGs/DSIs among all the chromosomes indicated that the impact of possible homoeologous exchange is very slight even if it occurred ( supplementary figs. S11 and S12 , Supplementary Material online).

Hybridization is both a common mechanism in plant speciation and one of the most important applications of genetics in crop breeding ( Abbott et al. 2013 Huang et al. 2016). Recent hybridization events were found in nearly half of the world’s crops and wild species during their evolution ( Abbott et al. 2013 Alix et al. 2017). Recent studies demonstrated that hybridization can induce dramatic transcriptome reprogramming which can lead to phenotypic variations and serve as an important source of heterosis in hybrids ( Chen 2013 Yoo et al. 2013). Transcriptome reprogramming in hybrids has typically been considered to be caused by the merger of two genomes or subsequent “genome shock” ( Chen 2013). Our results suggested that a large proportion of hybridization-induced transcriptome reprogramming in interspecific hybrids (Group 1 in fig. 2A and B) was not attributed to genome merger, as it recovered to parental levels in allopolyploids possessing merged genomes. This proportion of transcriptome reprogramming in hybrids was probably due to other factors, such as a reduction of homologous chromosome sets in hybrids, as both parents and allopolyploids have two copies of homologous chromosome sets but hybrids only have one. Thus, our findings provide new insights into the mechanism underlying heterosis and hybrid speciation. In addition, several previous studies have demonstrated that hybridization-induced DNA methylation alterations can also be recovered in allopolyploids after genome doubling ( Beaulieu et al. 2009 Hegarty et al. 2011 Xu et al. 2012 Qi et al. 2018). Together with our findings at gene transcriptional and splicing levels, this “recovery effect” of genome doubling implies a novel gene expression regulatory mechanism which is worth further investigation.


How do transcriptional R loops induce genome instability?

Transcriptional R-loop formation in eukaryotes is highly correlated with DNA recombination and/or impairment of genome stability, indicating an inherent impact of R looping on the integrity of the genome. Although relatively little is known about the molecular mechanism(s) by which transcriptional R loops influence genome stability, several possible scenarios can be envisioned.

It has long been known that ssDNA is more vulnerable to mutations than dsDNA (e.g., Lindahl and Nyberg 1974). Thus, in one model, extensive R-loop formation may make certain transcribed regions of the genome more susceptible to DNA-damaging agents simply by increasing the frequency of single-stranded regions (Fig. 4A). This idea is consistent with early observations that transcription synergistically increases the mutagenic effects of DNA-damaging agents in bacteria (e.g., Brock 1971 Herman and Dworkin 1971). More recently, Garcia-Rubio et al. (2003) provided evidence that transcription can also synergistically increase 4-nitroquinoline-N-oxide or methyl methanesulfonate-induced recombination in yeast. However, it is unclear whether effects such as these are in fact due to R-loop formation. It will be intriguing in the future to determine, for example, if increased mutagenesis is enhanced in topA mutants or decreased by RNase H overexpression.

Potential models of transcriptional R-loop-mediated DNA damage. (UMA) R loops make the genome more susceptible to DNA-damaging agents by increasing the frequency of single-stranded regions. (B) AID-mediated DNA cytosine deamination generates abasic sites on the nontemplated DNA strand within R-loop regions. These lead to DNA lesions, catalyzed, for example, by the base excision repair components UNG and APE, which generate a DNA nick in the R-loop region. (C) G-quartets form on the nontemplate DNA strand, and may both contribute to R-loop formation and generate susceptible sites for specific nucleases. (D) The collision between the DNA replication apparatus and transcription elongation complex leads to the formation of DNA lesions. RNAP II is indicated.

In a second scenario, (a) protein factor(s) that specifically recognize(s) R-loop structures might be involved in initiating the generation of mutagenic/recombinant DNA lesions. One candidate is AID, which was first identified as a factor specifically expressed in germinal center B cells upon activation (Muramatsu et al. 1999). Later studies have demonstrated that AID is indeed a key player necessary for CSR (Muramatsu et al. 2000 Okazaki et al. 2002 Longerich et al. 2006). Two models, the RNA-editing model and the DNA-deamination model, have been suggested to explain AID action in CSR. Since the high homology of the amino acid sequence between AID and apolipoprotein B mRNA-editing catalytic polypeptide 1 (APOBEC-1), AID was initially proposed to be an RNA-editing enzyme that modifies an mRNA encoding an unknown endonuclease, which then specifically targets the S regions (Muramatsu et al. 1999, 2000). While this model has not been ruled out, later studies have provided more and more evidence supporting a DNA-based function for AID in CSR. That is, AID directly deaminates cytidine to generate uracil on the DNA, and the resulting U:G mismatch is then processed by the base excision repair components, such as uracil DNA glycosylase (UNG) and apurinic/apyrimidinic endonuclease (APE), to generate a DNA nick in the switch region (Fig. 4B Di Noia and Neuberger 2002 Petersen-Mahrt et al. 2002 Rada et al. 2002). The nicks are then further converted into DSBs by mismatch repair proteins to initiate CSR (Stavnezer and Schrader 2006). In this view, it is especially noteworthy that AID prefers to deaminate cytidine in ssDNA (Chaudhuri et al. 2003 Dickerson et al. 2003), and transcription enhances AID-mediated cytidine deamination on the nontemplate strand (Ramiro et al. 2003 Sohail et al. 2003). These studies support a model by which the ssDNA regions resulting from transcriptional R looping form targets for AID, and this confers upon AID the specificity to introduce DNA breaks in the S region, which initiate the process of CSR.

An interesting question is whether AID or a related enzyme might also be responsible for initiating the DNA DSBs observed following ASF/SF2 depletion. In keeping with its role in CSR and other immunoglobulin gene alterations, AID is specifically expressed in germinal B cells. While DT40 cells are B cell derived and express AID, HMW DNA fragments have also been observed in HeLa cells upon small interfering RNA (siRNA)-mediated depletion of ASF/SF2 (Li and Manley 2005a). One possibility is that other APOBEC family members might function analogously to AID in other cell types. Indeed, a number of additional members of this family, expressed in a variety of tissues, have been described, and show DNA deamination activity but with differential context dependence (Beale et al. 2004)

In addition to ssDNA regions, other structural features of R loops may also contribute to making these structures targets for certain nucleases. Each R loop contains two duplex–single strand junctions. Several nucleases are capable of recognizing such loop–duplex junctions. For example, XPF-ERCC1 and XPG, originally identified as nucleotide excision repair nucleases, are able to cleave bubble structures at the 5′ and 3′ side of the loop–duplex junction, respectively. Intriguingly, it has been reported that recombinant XPF-ERCC1 and XPG can cleave transcribed S regions (Tian and Alt 2000).

It is also interesting to note that transcriptional R looping occurs preferentially when the nontemplate strand is G rich (e.g., Phoenix et al. 1997 Huertas and Aguilera 2003 Yu et al. 2003 Li and Manley 2005a). Recent studies have indeed shown that guanine is indispensable for the formation of a stable RNA:DNA hybrids in the immunoglobulin S region during in vitro transcription (Duquette et al. 2004 Mizuta et al. 2005). Substitution of GTP with analogs, such as 7-deaza guanine or ITP, impair the formation of higher-order RNA:DNA complexes, presumably R loops, in the S region. This is consistent with the fact that the exceptional stability of the rG/dC base pairs (Sugimoto et al. 1995) facilitates R-loop formation by favoring RNA:DNA over DNA:DNA hybrids in regions where the nontemplate strand is G-rich, such as the S regions (Gritzmacher 1989). On the other hand, the single-stranded G-rich regions are also prone to form stable parallel four-stranded DNA structures, referred to as G-quartets or G4 DNAs (for review, see Gilbert and Feigon 1999). This could help stabilize the single-strand nature of the nontemplate strand and thereby facilitate RNA:DNA hybrid formation during transcription. Formation of G-quartet structures during in vitro transcription of S regions has in fact been observed by electron microscopy, and they have also been detected in S region-containing plasmids propagated in E. coli (Duquette et al. 2004). Notably, several nucleases have been identified, from yeast and mammalian cells, that cleave in the single-stranded region 5′ of stacked G-quartets with striking specificity (Liu et al. 1993 Liu and Gilbert 1994 Sun et al. 2001). These observations raise the possibility that higher-order DNA structures, such as G-quartets, may both help drive the formation of transcriptional R loops and also generate susceptible sites for specific nucleases, although further work is required to determine whether such structures indeed play significant roles in vivo.

An additional possible mechanism for R-loop-mediated DNA damage involves DNA replication. Specifically, transcription elongation complexes halted or slowed by R-loop structures might block the progress of replication forks and lead to DNA recombination and/or DNA DSBs in the newly replicated DNA (Fig. 4D Aguilera 2002). Given that cotranscriptional R loops have been known to be responsible for the transcription elongation defects in yeast THO mutants (Huertas and Aguilera 2003), it is plausible that resulting stalled elongation complexes could interfere with the replication machinery. In fact, transcription-dependent replication fork collisions have been shown to induce recombination in bacteria and yeast (French 1992 Krasilnikova et al. 1998 Takeuchi et al. 2003). Recently, using plasmid-borne direct-repeat constructs, Prado and Aguilera (2005) provided evidence that a clash between transcription and replication facilitates TAR. A significant increase in TAR was observed when RNAP II transcription encountered a head-on oncoming replication fork, and this was concomitant with the appearance of a replication fork pause. These results support the idea that TAR can be a consequence of replication fork collapse caused by RNAP II-mediated transcription, at least in yeast. Evidence for this phenomenon in vertebrate systems, however, is currently lacking. In addition, ASF/SF2 depletion does not appear to cause an overall decrease in RNAP II transcription rate (Wang et al. 1996). Thus, the idea that transcriptional R-loop formation interferes with replication fork progression and thereby induces DNA damage and genome instability is an intriguing possibility, but one that requires further work.


A genome landscape of SRSF3-regulated splicing events and gene expression in human osteosarcoma U2OS cells

Alternative RNA splicing is an essential process to yield proteomic diversity in eukaryotic cells, and aberrant splicing is often associated with numerous human diseases and cancers. We recently described serine/arginine-rich splicing factor 3 (SRSF3 or SRp20) being a proto-oncogene. However, the SRSF3-regulated splicing events responsible for its oncogenic activities remain largely unknown. By global profiling of the SRSF3-regulated splicing events in human osteosarcoma U2OS cells, we found that SRSF3 regulates the expression of 60 genes including ERRFI1, ANXA1 and TGFB2, and 182 splicing events in 164 genes, including EP300, PUS3, CLINT1, PKP4, KIF23, CHK1, SMC2, CKLF, MAP4, MBNL1, MELK, DDX5, PABPC1, MAP4K4, Sp1 and SRSF1, which are primarily associated with cell proliferation or cell cycle. Two SRSF3-binding motifs, CCAGC(G)C and A(G)CAGCA, are enriched to the alternative exons. An SRSF3-binding site in the EP300 exon 14 is essential for exon 14 inclusion. We found that the expression of SRSF1 and SRSF3 are mutually dependent and coexpressed in normal and tumor tissues/cells. SRSF3 also significantly regulates the expression of at least 20 miRNAs, including a subset of oncogenic or tumor suppressive miRNAs. These data indicate that SRSF3 affects a global change of gene expression to maintain cell homeostasis.

© The Author(s) 2015. Published by Oxford University Press on behalf of Nucleic Acids Research.

Bonecos

SRSF3-targeted splicing events and changes…

SRSF3-targeted splicing events and changes of gene expression in U2OS cells. ( UMA…

Functional classification and MEME motif…

Functional classification and MEME motif analysis of the identified SRSF3-responsive targets. ( UMA…

Validation of the SRSF3-responsive events…

Validation of the SRSF3-responsive events identified by B/E ratio analysis. U2OS and HeLa…

Validation of other SRSF3-responsive RNA…

Validation of other SRSF3-responsive RNA splicing events identified by ANOVA analysis. Following transfection…

Validation for protein expression changes…

Validation for protein expression changes following SRSF3 knockdown in U2OS and HeLa cells.…

SRSF3 promotes inclusion of the…

SRSF3 promotes inclusion of the EP300 exon 14 through an exonic SRSF3-binding site.…

SRSF3 and SRSF1 are mutually…

SRSF3 and SRSF1 are mutually regulated in cells. ( UMA ) SRSF3 knockdown…

SRSF3 and SRSF1 are mutually…

SRSF3 and SRSF1 are mutually regulated in cell lines and coexpressed in normal…


How does temperature affect splicing events? Isoform switching of splicing factors regulates splicing of LATE ELONGATED HYPOCOTYL (LHY)

One of the ways in which plants can respond to temperature is via alternative splicing (AS). Previous work showed that temperature changes affected the splicing of several circadian clock gene transcripts. Here, we investigated the role of RNA-binding splicing factors (SFs) in temperature-sensitive AS of the clock gene LATE ELONGATED HYPOCOTYL (LHY). We characterized, in wild type plants, temperature-associated isoform switching and expression patterns for SF transcripts from a high-resolution temperature and time series RNA-seq experiment. In addition, we employed quantitative RT-PCR of SF mutant plants to explore the role of the SFs in cooling-associated AS of LHY. We show that the splicing and expression of several SFs responds sufficiently, rapidly, and sensitively to temperature changes to contribute to the splicing of the 5'UTR of LHY. Moreover, the choice of splice site in LHY was altered in some SF mutants. The splicing of the 5'UTR region of LHY has characteristics of a molecular thermostat, where the ratio of transcript isoforms is sensitive to temperature changes as modest as 2 °C and is scalable over a wide dynamic range of temperature. Our work provides novel insight into SF-mediated coupling of the perception of temperature to post-transcriptional regulation of the clock.

Palavras-chave: 5′UTR Arabidopsis alternative splicing circadian isoform switch signalling splicing factors temperature thermostat.

© 2018 The Authors. Plant, Cell & Environment Published by John Wiley & Sons Ltd.

Bonecos

Temperature‐dependent AS of LHY transcripts.…

Temperature‐dependent AS of LHY transcripts. (a) Gene organization of LHY (At1g01060) with the…

Temperature associated AS and isoform…

Temperature associated AS and isoform switching of PTB1 , PTB2 , U2AF65A ,…

Splicing of LHY and splicing…

Splicing of LHY and splicing factors are sensitive to small extents and durations…

Effects of splicing factor mutations…

Effects of splicing factor mutations on LHY 5′UTR AS. Levels of (a) LHY…

White light intensity consolidates temperature…

White light intensity consolidates temperature associated AS for PTB1 but not for LHY…


Predicting how splicing errors impact disease risk

No one knows how many times in a day, or even an hour, the trillions of cells in our body need to make proteins. But we do know that it's going on all the time, on a massive scale. We also know that every time this happens, an editing process takes place in the cell nucleus. Called RNA splicing, it makes sure that the RNA "instructions" sent to cellular protein factories correspond precisely with the blueprint encoded in our genes.

Researchers led by Adrian Krainer, a Cold Spring Harbor Laboratory (CSHL) Professor, and Assistant Professor Justin Kinney, are teasing out the rules that guide how cells process these RNA messages, enabling better predictions about the impact of specific genetic mutations that affect this process. This in turn will help assess how certain mutations affect a person's risk for disease.

Splicing removes interrupting segments called introns from the raw, unedited RNA copy of a gene, leaving only the exons, or protein-coding regions. There are over 200,000 introns in the human genome, and if they are spliced out imprecisely, cells will generate faulty proteins. The results can be life-threatening: about 14% of the single-letter mutations that have been linked to human diseases are thought to occur within the DNA sequences that flag intron positions in the genome.

The cell's splicing machinery seeks "splice sites" to correctly remove introns from a raw RNA message. Splice sites throughout the genome are similar but not identical, and small changes don't always impair splicing efficiency. For the splice site at the beginning of an intron -- known as its 5' ["five-prime"] splice site, Krainer says, "we know that at the first and second [DNA-letter] position, mutations have a very strong impact. Mutations elsewhere in the intron can have dramatic effects or no effect, or something in between."

That's made it hard to predict how mutations at splice sites within disease-linked genes will impact patients. For example, mutations in the genes BRCA1 or BRCA2 can increase a woman's risk of breast and ovarian cancer, but not every mutation is harmful.

In experiments led by first author Mandy Wong, a Krainer lab postdoc, the team created 5' splice sites with every possible combination of DNA letters, then measured how well the associated introns were removed from a larger piece of RNA. For their experiments, they used introns from three disease-associated genes -- BRCA2 and two genes in which mutations cause neurodegenerative diseases, IKBKAP and SMN1.

In one intron of each of the three genes, the team tested over 32,000 5' splice sites. They found that specific DNA sequences corresponded with similar splicing efficiency or inefficiency in different introns. This is a step toward making general predictions. But they also found that other features of each gene -- the larger context -- tended to modify the impact in each specific case. In other words: how a mutation within a given 5' splice site will affect splicing is somewhat predictable, but is also influenced by context beyond the splice site itself.

Krainer says this knowledge will better help predict the impact of splice-site mutations -- but a deeper investigation is needed.


Assista o vídeo: Síntese Proteica Parte 1 - Transcrição. Prof. Samuel Cunha (Dezembro 2021).