Em formação

Diferença funcional entre o promotor distal e a região do realçador


De acordo com o artigo da Wikipedia sobre regiões promotoras eucarióticas, o promotor distal é:

Qualquer coisa mais a montante (mas não um intensificador ou outra região reguladora cuja influência seja independente da posição / orientação)

Qual é a diferença entre a região regulatória e o promotor distal? A região distal do promotor tem um efeito maior na taxa de transcrição? Em caso afirmativo, a determinação do que tem um efeito grande o suficiente para ser um promotor distal é subjetiva?


Arquitetura nuclear 3D e memórias epigenéticas: reguladores da plasticidade fenotípica no desenvolvimento, envelhecimento e câncer

17.2.1 Uso do Enhancer em 3D e a regulação da expressão gênica específica do tipo de célula

Elementos estimuladores coordenam entradas de vias de desenvolvimento e oncogênicas, bem como sinais da estrutura da cromatina local para regular a probabilidade e a variabilidade de explosões transcricionais em seus genes-alvo [17-19]. O mecanismo molecular das interações potenciador-promotor e os determinantes do tipo de célula e as características específicas do estágio de diferenciação desse processo estão apenas sendo elucidados. Análises globais de contatos de fibra de cromatina mapearam, portanto, interações potenciador-promotor específico do tipo de célula de longo alcance [16] - sugerindo que os movimentos estocásticos das fibras da cromatina e a estabilização transitória das interações das fibras da cromatina formam a base da regulação transcricional. A frequência das interações potenciador-promotor pode, portanto, regular a frequência e / ou duração da transcrição produtiva e, assim, modular a variabilidade da expressão gênica em uma população de células.

Interações raras, mas funcionais entre regiões localizadas em cromossomos diferentes, por exemplo, mostraram resultar em expressão gênica variegada, fornecendo uma característica selecionável dentro de uma população de células [20]. Em contraste, a transcrição específica do tipo de célula e do estágio de diferenciação estável é regulada pela convergência de múltiplos elementos potenciadores em genes alvo compartilhados específicos em cis. Este padrão garante a ativação robusta do promotor, aumentando a concentração local de fatores que promovem a montagem do complexo de pré-iniciação e a liberação de Pol II da pausa. Uma forma intrigante de especificidade do potenciador é exemplificada pelos chamados potenciadores à prova de falhas ou divididos que são unidades potenciadoras espacialmente separadas, que precisam estar simultaneamente ativas para a indução da expressão gênica, conferindo regulação rígida e específica de genes que podem se tornar oncogênicos se desregulamentado [21]. Finalmente, o agrupamento de múltiplos elementos realçadores cobrindo dezenas ou centenas de quilobases evoluíram na vizinhança de genes determinantes do destino celular para permitir sua expressão estável e a manutenção de fenótipos celulares [22]. As subunidades desses chamados superenhancers colaboram e interagem dinamicamente entre si e com outros potenciadores para integrar sinais de múltiplas vias de determinação do destino celular que regulam as diferentes subunidades potenciadoras individuais, resultando em uma saída de sinal combinatória que aumenta a probabilidade de transcrição em seus genes alvo [17].

A formação e o descomissionamento de superenhancers são hipersensíveis a flutuações nos níveis de reguladores transcricionais e fatores de cromatina, como bromodomínio contendo 4 (BRD4) e o complexo mediador - um co-fator essencial regulador de contato promotor-promotor, remodelação da cromatina e liberação de Pol II de pausando [23]. Por exemplo, a ativação do fator de necrose tumoral de citocina pró-inflamatória (TNF) leva à redistribuição do complexo mediador do destino celular - especificando superenenciadores para potenciadores que ativam genes inflamatórios, levando à regulação negativa de genes que definem a identidade celular [23]. Além disso, a localização e a atividade dos superenhorificadores também são afetadas pelo microambiente celular do nicho de células-tronco [24]. Conseqüentemente, as posições genômicas dos superen-estimuladores são reorganizadas reversivelmente nas células-tronco foliculares quando elas se localizam fora de seu nicho de células-tronco durante a cicatrização de feridas ou sob condições de cultura in vitro.

A probabilidade de contatos funcionais entre potenciadores e promotores é regulada por fatores que atuam como os laços moleculares das interações potenciador-promotor [25-28], e por restrições de mobilidade da cromatina, que é influenciada pela organização 3D do contexto da cromatina vizinha [ 29]. Consistente com o papel dos potenciadores na definição de estados celulares, regulação negativa ou mutações nos laços moleculares das interações potenciador-promotor e proteínas arquitetônicas da cromatina prejudicam a diferenciação [30], neutralizam a reprogramação de células diferenciadas em um estado pluripotente induzido [31] e afetam programas de expressão gênica específicos de células tumorais e sobrevivência [32]. Por exemplo, a regulação negativa de um membro do complexo de coesina, um complexo de proteínas que estabiliza os contatos entre o promotor e o potenciador, interfere no estabelecimento de alças intracromossômicas no OCT4 locus e com a geração de células-tronco pluripotentes induzidas (iPS) [31]. Além disso, amarrar o domínio de autoassociação de um fator de looping, ligação de domínio lim 1 (LDB1), ao promotor do gene β-globina é suficiente para estabelecer uma interação com a região de controle do locus globina e para induzir o início da transcrição na ausência de o fator de transcrição específico de linhagem GATA1 [33]. Outros domínios da proteína LDB1 são então necessários para o recrutamento subsequente de fatores de transcrição e atividades de remodelação da cromatina [34] para uma transição para o alongamento produtivo. Além disso, o nocaute de LDB1 específico do fígado promove o desenvolvimento de câncer de fígado em camundongos expostos a carcinógenos [32]. Finalmente, RNAs potenciadores (eRNAs) que marcam potenciadores ativos também mostraram regular a formação de alça de cromatina entre potenciadores e promotores, promovendo o recrutamento e aumentando a atividade quinase do complexo mediador que regula a atividade de Pol II e se liga a enzimas de remodelação da cromatina e transcrição fatores necessários para uma transcrição eficiente [35]. Mutações na subunidade 12 do mediador (MED12) causam defeitos de desenvolvimento e também abolem as interações eRNA-MED12, apoiando ainda mais a importância dos eRNAs na formação de padrões de expressão gênica específicos do tipo celular.

Além dos laços moleculares que medeiam os contatos da cromatina, a organização do genoma em domínios topologicamente associados (TADs) também afeta a probabilidade de interações potenciador-promotor, fornecendo restrições para os movimentos da cromatina (ver também Capítulo 1) [36]. É importante ressaltar que a força limite dos TADs é influenciada pela presença de proteínas arquitetônicas da cromatina ou organizadores do genoma, como o fator de ligação CCCTC (CTCF) [36]. Certas variações de sequência de ocorrência natural em humanos e mutações projetadas em camundongos que impedem a ligação do CTCF a um limite TAD estão causalmente ligadas a defeitos de desenvolvimento do membro devido ao surgimento de interações ectópicas entre intensificadores distais e genes que regulam o desenvolvimento do membro [29]. Como o CTCF freqüentemente se liga ao DNA de uma maneira sensível à metilação, os limites do TAD podem ser reprogramados também em tumores devido à frequente desregulação dos padrões de metilação do DNA. Os limites alterados do TAD, por sua vez, podem desregular a mobilidade dos superenotificadores oncogênicos e interferir na estabilidade dos padrões de expressão gênica específicos do tipo de célula [7]. Dada a estreita ligação entre a organização do genoma 3D e a transcrição, será importante determinar como o cross talk da cromatina 3D é reprogramado durante as transições entre vários estados celulares em desenvolvimento e neoplasia.


Opções de acesso

Obtenha acesso completo ao diário por 1 ano

Todos os preços são preços NET.
O IVA será adicionado mais tarde no check-out.
O cálculo do imposto será finalizado durante o checkout.

Obtenha acesso limitado por tempo ou ao artigo completo no ReadCube.

Todos os preços são preços NET.


Materiais e métodos

Genes de fusão potenciadores

Sequências potenciadoras de Drosófila foram amplificados a partir do DNA genômico por PCR. Usamos Expand Long Template ou Expand High Fidelity PCR Systems da Roche Molecular Biochemicals para diminuir o número de alterações de sequência introduzidas durante a amplificação. Os produtos de PCR foram então clonados a montante do gene GFP em um vetor de clonagem apropriado. Usamos os plasmídeos pPD95.75 e pPD122.53 (o último foi modificado para remover o sinal de localização nuclear), ambos presentes de A. Fire, para gerar fusões translacionais e transcricionais, respectivamente. Os genes de fusão translacional continham elementos potenciadores, promotor basal e os primeiros vários códons do Drosófila gene fundido a GFP. Nas fusões transcricionais, o elemento potenciador era o único segmento de DNA da mosca colocado a montante do mínimo pes-10 promotor de C. elegans, que não foi relatado anteriormente para produzir um padrão de expressão sozinho. A identidade de cada construção foi verificada por digestão de restrição e o DNA de sequenciamento foi preparado a partir de múltiplos isolados independentes e uma mistura foi usada para as injeções. Procedimentos idênticos foram usados ​​na preparação de genes de fusão contendo potencializadores putativos de C. briggsae. As sequências de nucleotídeos de elementos potenciadores, a localização de iniciadores individuais e os vetores usados ​​são dados na Fig. S1.

Cepas de vermes, injeções e microscopia

Genes de fusão foram injetados de acordo com protocolos padrão (Mello et al., 1991) em Bristol N2 ou pha-1 (e2123) animais. Genes de fusão contendo potenciador foram sempre injetados a 50 ng / μl sempre que pha-1 (e2123) vermes foram usados, estes foram co-injetados com um pha-1 resgatando a construção (Granato et al., 1994) a 2 ng / μl. Métodos de injeção usados ​​para C. briggsae (AF16) eram idênticos aos usados ​​para C. elegans N2. Múltiplas linhas independentes foram examinadas quanto à consistência dos padrões de expressão. Estabelecemos que genes de fusão injetados em pha-1(e2123) e os animais N2 produzem padrões de expressão idênticos. Observamos que animais de várias linhagens transgênicas apresentam expressão difusa no intestino, principalmente nos compartimentos mais anterior e posterior, o neurônio PVT, que possui uma projeção conforme descrito por Aurelio et al. (Aurelio et al., 2002), não White et al. (White et al., 1986), e em várias células musculares da faringe (Fig. 1E). Observamos este padrão de expressão inespecífica para uma série de genes de fusão, incluindo os vetores pPD95.75 e pPD122.53 sozinhos, tanto no N2 quanto no pha-1(e2123) origens genéticas. Portanto, consideramos que representa o padrão de 'background' associado à expressão do transgene GFP no verme provavelmente causado pelo controle transcricional promíscuo nesses tecidos e / ou um elemento potenciador críptico no DNA do vetor. Ocasionalmente, essa expressão de "fundo" também foi observada nos músculos vulvares e em três células epiteliais retais. Todos os animais foram avaliados inicialmente em um microscópio de dissecação e, posteriormente, examinados em detalhes em um microscópio composto Zeiss Axioplan. As imagens foram capturadas com o pacote de software Open Lab e processadas com Adobe Photoshop.

Padrões de expressão de genes de fusão contendo intensificadores específicos de tecido de Drosófila no C. elegans. (UMA) Drosophila Gad1 :: GFPé expresso nas células gliais (gl) na cabeça. (B) Drosophila Cha :: GFP é expresso nas células gliais dos neurônios labiais (gl) e em várias células musculares da faringe (pha). (C) Drosophila unc-119 :: GFP é expresso nas células gliais dos neurônios labiais (gl) e em vários neurônios da cabeça dorsal (dhn) e ventral (vhn), bem como nos neurônios da cauda (tn). (D) Drosophila ey :: GFP é expresso em IL1D (L, R) e PVT. (E) Drosophila eya :: GFP é expresso em PVT, no intestino e em certas células musculares da faringe. (F) Drosophila nompA :: GFP é expressa na hipoderme da cabeça (hip) e em vários neurônios anfíbios (amph). (G) Drosophila Mef2 :: GFP é expresso em toda a faringe (pha) e em um único interneurônio AVG. (H) Véspera da drosófila :: GFP é expresso em até seis células gliais (gl) de neurônios labiais.

Padrões de expressão de genes de fusão contendo intensificadores específicos de tecido de Drosófila no C. elegans. (UMA) Drosophila Gad1 :: GFPé expresso nas células gliais (gl) na cabeça. (B) Drosophila Cha :: GFP é expresso nas células gliais dos neurônios labiais (gl) e em várias células musculares da faringe (pha). (C) Drosophila unc-119 :: GFP é expresso nas células gliais dos neurônios labiais (gl) e em vários neurônios da cabeça dorsal (dhn) e ventral (vhn), bem como nos neurônios da cauda (tn). (D) Drosophila ey :: GFP é expresso em IL1D (L, R) e PVT. (E) Drosophila eya :: GFP é expresso em PVT, no intestino e em certas células musculares da faringe. (F) Drosophila nompA :: GFP é expressa na hipoderme da cabeça (hip) e em vários neurônios anfíbios (amph). (G) Drosophila Mef2 :: GFP é expresso em toda a faringe (pha) e em um único interneurônio AVG. (H) Véspera da drosófila :: GFP é expresso em até seis células gliais (gl) de neurônios labiais.


Unidade 4 - Teste de Domínio da Biologia 7

A acetilação das caudas das histonas na cromatina permite o acesso ao DNA para a transcrição.

Algumas formas de modificação da cromatina podem ser transmitidas às futuras gerações de células.

A metilação das caudas das histonas na cromatina pode promover a condensação da cromatina.

A acetilação das caudas das histonas é um processo reversível.

Um dos mecanismos pelos quais os eucariotos regulam a expressão gênica é por meio de modificações na estrutura da cromatina. Quando a cromatina está condensada, o DNA não está acessível para transcrição. A acetilação das caudas das histonas reduz a atração entre os nucleossomos vizinhos, fazendo com que a cromatina assuma uma estrutura mais frouxa e permitindo o acesso ao DNA para a transcrição. Se as caudas das histonas sofrem desacetilação, a cromatina pode recondensar, tornando o DNA inacessível para transcrição.

Evidências recentes sugerem que a metilação das caudas das histonas pode promover a condensação ou a descondensação da cromatina, dependendo de onde os grupos metil estão localizados nas histonas. Assim, a metilação pode inativar ou ativar a transcrição, e a desmetilação pode reverter o efeito da metilação.


Materiais e métodos

Pegada filogenética e análise de sequência

A determinação da sequência e a análise do locus do gene αIIb humano e murino foram realizadas conforme descrito anteriormente.8,23 As sequências geradas foram submetidas ao banco de dados público GenBank em www.ncbi.nih.gov e incluem os seguintes números de acesso: AF170316, AF169829, AF160252 e AF489555. Usando esses arquivos de sequência original junto com os arquivos de sequência genômica BAC completos e incompletos disponíveis no GenBank (números de acesso: AC007722, AC003043, AC025326, um cromossomo 11 BAC clone-RP11-621L13 de murino) e bancos de dados Celera (número de andaime: GA_x5J8B7W82RK: 6500001.6874571 esqueleto do locus mαIIb parcialmente completo), compilamos sequências compostas de ambas as sequências humanas e murinas, abrangendo para cada um um domínio de sequência de 200 kb. Esses arquivos foram então usados ​​para uma comparação de homologia de regiões ortólogas usando o programa de comparação de sequência de nucleotídeos, Visual Tools for Alignment (VISTA / AVID [www-gds.lbl.gov/vista]). O comprimento da comparação foi definido para 100 bp com um mínimo de 50% de correspondência. Regiões específicas dentro da região de 200 kb foram comparadas usando a Basic Local Alignment Search Tool (BLAST) .24 Sub-regiões específicas também foram comparadas com o banco de dados de tag de sequência expressa pública (EST) em www.ncbi.nih.govusing BLAST. Uma sub-região de 10 kb que se estende de +7,8 kb dentro do domínio intergênico αIIb 3 'também foi analisada usando o software de predição de genes GeneMachine disponível emhttp: //genome.nhgri.nih.gov/genemachine. Este programa permite aos usuários consultar vários programas de predição de exon e gene de maneira automatizada e incorpora a análise BLAST, bem como na avaliação das predições finais. Além disso, o Transcript Assembly Program (TAP) disponível em http://sapiens.wustl.edu/∼zkan/TAP/ foi usado para delinear estruturas gênicas usando sequências EST genomicamente alinhadas. A análise de regiões de sequência conservada alinhada para locais de ligação de fator de transcrição de consenso foi feita usando o programa rVISTA (www.gds.lbl.gov/vista) e o Software de pesquisa de elementos de transcrição (TESS) desenvolvido pela Universidade da Pensilvânia (PENN) Laboratório de Informática em Biologia Computacional (http://www.cbil.upenn.edu/).

Estudos DNase I HS

As células 288-11 da eritroleucemia humana (HEL) e da Children's Hospital Research Foundation (CHRF) foram as 2 linhas celulares que expressam αIIb megacariocíticas 25,26 utilizadas nestes estudos de local HS da DNase I. A linha de fibroblastos HeLa27 e a linha de células de carcinoma gástrico SNU-128 foram estudadas como linhas que não expressam αIIb. As células HEL, HeLa e SNU-1 foram obtidas na American Type Culture Collection (Rockville, MD). As células CHRF foram obtidas do Dr. Michael Liebman (University of Cincinnati, OH). Células HEL, SNU-1 e HeLa foram cultivadas em RPMI 1640, 10% de soro fetal bovino (FBS), 1% de penicilina / estreptomicina e 1-glutamina (Invitrogen, Carlsbad, CA). As células CHRF foram cultivadas como acima, mas com FBS a 20%. Todas as linhas de células foram divididas 24 horas antes de cada experiência de DNase I HS. A preparação dos núcleos das células para o tratamento com DNase I foi conforme descrito anteriormente.29 Os núcleos de 1 × 10 8 células foram centrifugados por 10 minutos a 500g e foram suspensos em 4,5 mL de tampão DNase I (Tris [tris (hidroximetil) aminometano] 10 mM, pH 7,5, NaCl 10 mM, MgCl 5 mM2, 0,1 mM de fluoreto de fenilmetilsulfonil, 5 mM de butirato de sódio e 1 mM de CaCl2) Alíquotas de 500 μL de núcleos foram adicionadas a 500 μL de tampão de DNase I contendo a enzima DNase I (Invitrogen) variando de 0 a 3,4 μg / mL. Os tubos foram misturados suavemente, depois colocados a 37 ° C durante 5 minutos e depois recolocados no gelo. O DNA genômico foi recuperado e digerido ainda com qualquer EcoRI ouBamEnzimas de restrição HI para análise de Southern blot conforme descrito anteriormente.29,30 As sondas utilizadas para detecção foram produzidas por meio de amplificação por reação em cadeia da polimerase (PCR). Os iniciadores usados ​​para gerar essas sondas foram os seguintes pares de sentido / anti-sentido: αIIb exon 1 (P1) 7: 5′-CCTGTGGAGGAATCTGAA-3 ′ / 5′-TCCTGCTCTCTCCCAATAC-3 ′ αIIb exon 4 (P2) 7: 5′-CAATCGGGGGCAGGGACAC-3 ′ / 5′-CAAGCCGTCGCGAGTGGG-3 ′ e αIIb exon 30 (P3)7: 5′-GAGTACAGTGGGCTTCATGTTCT-3 ′ / 5′-CCCTGGCAGTGACTCTCTCGTTCA-3 ′. Um clone genômico λ descrito anteriormente contendo o locus hαIIb serviu como molde para as reações.23

Construções transgênicas

o SalEu fragmento usado para fazer o2,5hαIIb linhagens animais transgênicas foram isoladas de um clone de bacteriófago λDash (Stratagene, La Jolla, CA) subclonado de P1 (clone nº 1147), um clone P1 contendo hαIIb descrito anteriormente.23 Este construto se estende do vetor poliligante λDash SalSítio I através de 2,5 kb da região flanqueadora 5 ', 17,35 kb da sequência de exon / íntron codificante e 2,2 kb da sequência flanqueadora 3' até o poliligante 3 'SalI site e tem um comprimento total de 22 052 bp. oEcoRV /AflFragmento de restrição II usado para fazer o7.1hαIIb linhagens animais transgênicas foram isoladas de um clone cosmídeo hαIIb pWE15. Este fragmento se estende a partir de um poliligante de vetor pWE15 EcoLocal RV através de 7,1 kb da região flanqueadora de 5 'a 2,1 kb a jusante do códon de parada do gene hαIIb, terminando em um endógeno AflSite II com comprimento total de 26 559 bp. A construção transgênica final3 ′ + hαIIb é um EcoRV /PvuFragmento de restrição I, derivado do mesmo clone cosmídeo descrito acima. É idêntico ao 7.1hαIIbconstrução, exceto que a região flanqueadora 3 'é 5,2 kb mais longa, estendendo-se para um poliligante PvuI site em pWE15 com um comprimento total de 31 759 bp.

Geração e análise inicial de animais transgênicos

Os camundongos transgênicos foram gerados por injeções pronucleares seguindo métodos padrão no PENN Transgenic Mice Core Facility. Animais fundadores positivos foram detectados por análise de reação em cadeia da polimerase (PCR) do DNA genômico da cauda usando múltiplos pares de primers humanos específicos para hαIIb.7 primers genômicos PF4 murinos22 foram usados ​​como controle. Esses pares de primers sense / antisense eram os seguintes: hαIIb-exon 14: 5′-AGGCCTCTGTCCAGCTAC-3 ′ / 5′-GCCATTCCAGCCTCCGTG-3 ′ emPF4: 5′-GTCCAGTGGCACCCTCTTGA-3 ′ / 5′-AATTGACATTTAGGCAGC-3 ′.

As linhas fundadoras positivas com genes hαIIb intactos por análise Southern e PCR foram ainda caracterizadas quanto ao número de cópias por Southern blot. O DNA genômico da cauda foi digerido com EcoRI e tamanho separados em um gel de agarose a 0,8% (peso / vol). Os procedimentos de Southern blot e de determinação do número de cópias foram conforme descritos anteriormente.22,23

Análise de tecido e plaquetas RT-PCR

Isolamento de RNA e procedimentos de transcriptase reversa (RT) -PCR para todas as análises de expressão de mRNA, bem como uma lista dos 11 tecidos examinados, foram descritos antes em nossos estudos transgênicos anteriores.22 Resumidamente, usando cerca de 0,1 μg de RNA plaquetário total, ou 1 μg de RNA de outros tecidos, RT-PCR foi feito usando o kit SuperScript II Reverse Transcriptase (Invitrogen) com os seguintes conjuntos de pares de primers sense / antisense:haIIb7: 5′-AGGCCTCTGTCCAGCTAC-3 ′ / 5′-G CCATTCCAGCCTCCGTG-3 ′mαIIb8: 5′-TCAAGACTCCCTGAATCCAACAC-3 ′ / 5′-GGGCTCCTCCAGTCTCTTCT-3 ′mPBP22: 5′-GCCTGCCCACTTCATAACCTC-3 ′ / 5′-GGGTCCAGGCACGTTTTT-3 ′mPF422: 5′-GTCCAGTGGCACCCTCTTGA-3 ′ / 5′-AATTGACATTTAGGCAGCTGA-3 ′mHPRT31: 5′-CACAGGACTAGAACACCTGC-3 ′ / 5′-GCTGGTGAAAAGGACCTCT-3 ′mKIAA05538: 5′-GACCCAAAGGTGCTTGTAAT-3 ′ / 5′-GAAAACTACCTCCAGGATGG-3 ′.

Os experimentos de controle incluíram estudos onde nenhum RT foi adicionado e outros tratados com RNase A (Sigma, St Louis, MO) antes da etapa de RT, foram feitos para garantir que as bandas de PCR vistas nos experimentos não fossem geradas por meio de fontes pré-RT de DNA , todos os dados de RT-PCR apresentados abaixo usaram amostras de RNA não tratadas.

Para quantificar o nível de expressão do mRNA do transgene hαIIb em plaquetas em relação ao mαIIb endógeno, usamos métodos descritos anteriormente.18,20,22 Resumidamente, os PCRs do cDNA da primeira fita do RNA das plaquetas foram configurados usando os primers descritos acima e o número do ciclo em que ambos os genes estavam em sua faixa linear de amplificação. Os primers anti-sentido foram marcados com 5 'com um corante fluorescente “Cy-5” (Oligos Etc, Wilsonville, OR). Experimentos preliminares foram realizados para determinar a faixa linear detectável de amplificação para o gene mαIIb nativo e o transgene hαIIb para cada linha fundadora. Depois disso, uma mistura de PCR de 100 μL foi dividida em seis alíquotas de 15 μL, uma para cada ciclo começando 3 ciclos abaixo do ponto médio da faixa linear detectável e se estendendo até 2 ciclos acima dela, antes de iniciar a PCR. O PCR foi realizado a 94 ° C por 2 minutos, seguido por ciclos a 94 ° C por 25 segundos, 62 ° C por 36 segundos, 72 ° C por 55 segundos em um controlador térmico programável PTC-100 (MJ Research, Waltham, MA ) Para cada mudança consecutiva de ciclo único, um dos tubos de PCR para as reações hαIIb e mαIIb foi removido do termociclador e colocado no gelo. Todas as amostras foram então executadas em um Gel Ready de acrilamida a 10% de 12 poços (Bio-Rad Laboratories, Hercules, CA), e as bandas foram detectadas com um sistema de imagem STORM a laser de luz vermelha (Molecular Dynamics, Sunnyvale, CA). As bandas detectadas foram então analisadas usando o software ImageQuant PhosphorImager (Molecular Dynamics) .22 O log da intensidade do sinal de cada banda foi calculado. A diferença de valor de log para cada banda entre 2 ciclos consecutivos foi calculada, com a diferença de log esperada sendo 0,3 unidades (log102). Esses valores, que caíram em uma faixa de 0,2- a 0,4-log unidades de diferença / ciclo, foram considerados dentro da faixa linear de amplificação. A intensidade do sinal bruto dessas bandas de PCR humanas dentro da faixa linear foi normalizada para a do produto de camundongo, também dentro da faixa linear no mesmo ciclo. Os sinais foram posteriormente normalizados para diferenças na capacidade das condições do iniciador / PCR para amplificar hαIIb e mαIIb de quantidades molares iguais do molde de controle de cDNA apropriado como descrito antes.22 Esses valores normalizados foram usados ​​para comparar o nível de expressão do transgene entre as diferentes linhas fundadoras.

Detecção de proteína

Plasma rico em plaquetas (PRP) de sangue humano e de camundongo foi isolado conforme descrito.22 Para esses estudos, a prostaglandina E1 (Sigma) foi adicionado a uma concentração final de 1 μM antes de girar as plaquetas a 800g por 10 minutos em temperatura ambiente. Os peletes foram lavados duas vezes em tampão de plaquetas (PB 134 mM NaCl, 3 mM KCl, 0,3 mM NaH2PO4, 2 mM MgCl2, 5 mM de HEPES [ácido N-2-hidroxietilpiperazina-N′-2-etanossulfônico], 5 mM de glicose, 0,1% de NaHCO3, pH 6,5) mais EGTA 1 mM (ácido etilenoglicol-tetraacético) e ressuspenso em PB sem EGTA. As plaquetas foram lisadas por congelamento e descongelamento duas vezes. A concentração de proteína de cada lisado foi determinada pelo kit Pierce BCA Protein Assay de acordo com as instruções do fabricante (Pierce, Rockford, IL). Vinte microgramas da proteína plaquetária total foram submetidos à eletroforese em eletroforese em gel de dodecil sulfato de sódio-poliacrilamida com gradiente de 4% a 12% (SDS-PAGE) e corados com azul de Coomassie. Um gel de SDS-PAGE duplicado foi transferido para uma membrana de transferência de difluoreto de polivinilideno (PVDF) Immobilon-P (Millipore, Bedford, MA). A proteína hαIIb foi detectada usando MAB1990 (Chemicon, Temecula, CA), um anticorpo monoclonal anti-hαIIb de camundongo. Os sinais de Western blot foram visualizados por fosfoimagem do sinal de quimioluminescência intensificada (Perkin-Elmer, Wellesley, MA) no STORM e quantificados usando o software Imagequant PhosphorImager. Para estudos de citometria de fluxo, 1 × 10 7 plaquetas de camundongos transgênicos e de tipo selvagem e plaquetas humanas foram preparadas como descrito anteriormente, 32 usando o anticorpo monoclonal MAB199032 como o anticorpo primário e um isotiocianato de fluoresceína (FITC) - etiquetado, cabra antimouse IgG (Sigma) como o anticorpo secundário.


Conclusões

Ao analisar a sequência de promotores de genes específicos de tecido, confirmamos que os promotores e estimuladores específicos de tecido compartilham motivos de ligação ao TF dentro dos loci de seus genes cognatos. Além disso, observamos que a informação regulatória nos promotores de genes específicos do tecido é preditiva dos potenciadores direcionados a esses genes. Para 73/79 tecidos, pudemos distinguir de forma confiável entre genes altamente e fracamente expressos com base exclusivamente na presença ou ausência de motivos putativos (AUC ≥60%). Embora cortes semelhantes tenham sido empregados recentemente (por exemplo, [18, 59]), reconhecemos que a metade dos modelos que exibem desempenhos modestos (AUC ≤80%) pode ter valor preditivo limitado. É, no entanto, importante notar que as AUCs relatadas representam o limite inferior da precisão do classificador devido ao fato de que se espera que a força do sinal do intensificador de especificidade de tecido varie entre os promotores de genes específicos de tecido. Os promotores contendo apenas sinais fracos irão esvaziar inerentemente as estimativas de classificação AUC. Para abordar ainda mais o desempenho dos classificadores na previsão de realçadores específicos do tecido, introduzimos um painel de testes computacionais e experimentais independentes, que finalmente validaram nossa análise. Muitos dos TFs que se ligam aos motivos que são identificados como relevantes para cada um desses modelos são conhecidos por desempenhar um papel fundamental no desenvolvimento ou manutenção da função normal dos tecidos correspondentes. Mostramos que os motivos encontrados nas regiões promotoras podem ser usados ​​para prever potenciadores com especificidade de tecido correspondente. A precisão de nossas previsões de intensificador específico de tecido por modelos baseados em promotor é suportada por uma associação altamente significativa de previsões de intensificador com os genes mais altamente expressos em um determinado tecido e por uma sobreposição significativa de previsões com intensificadores específicos de tecido identificados experimentalmente.

Mais importante, 58% (7/12) das previsões do potenciador do fígado geradas pelo modelo baseado no promotor direcionaram a expressão da luciferase no fígado após a injeção hidrodinâmica na veia da cauda em camundongos, enquanto nenhum dos cinco controles negativos o fez.

Seis dos sete intensificadores de fígado validados estavam localizados dentro dos íntrons (para os genes TBX6, SERINC2, TF, ARAP1, STARD10, e GPRC5C), enquanto a previsão restante estava nas imediações de GPRC5C. Esses genes foram relatados anteriormente como moderada a altamente expressos no fígado e na vesícula biliar [60]. Por exemplo, embora a função específica de GPRC5C é desconhecido, o gene é altamente expresso no fígado e foi sugerido que desempenhe um papel na sinalização de eventos quando induzido pelo ácido retinóico [61]. Além de outros motivos, as previsões do intensificador do fígado que exibiram atividade da luciferase continham locais de ligação previstos para 5 a 11 dos 27 TFs do fígado conhecidos (arquivo adicional 5). Embora cada um dos FTs críticos do fígado PPARA, PPARG, NR2F2 e HNF4A tivesse sítios de ligação em 6/7 (86%) sequências, nenhum TF teve um sítio de ligação em todas as 7 sequências que exibiram atividade de luciferase, destacando a capacidade do nosso método para modelar criptografias de sequência regulatórias flexíveis. Por sua vez, cada uma das 7 sequências incluiu locais de ligação para pelo menos 2 desses 4 TFs e 4/7 (57%) para todos os 4. As 5 previsões de intensificador de fígado que não exibiram atividade significativa de luciferase continham locais de ligação para 4 a 8 de 27 TFs hepáticos conhecidos. HNF4A tinha locais de ligação em todas as 5 sequências, PPARA e NR2F2 tinham locais de ligação em 4/5 (80%) sequências e PPARG em 3/5 (60%). Com uma exceção, cada uma das sequências incluiu locais de ligação para pelo menos 2 desses 4 TFs e 3/5 (60%) para todos os 4. Para comparação, 87% de todas as sequências marcadas pelo modelo baseado no promotor do fígado continham 1 a 18 de 27 TFs hepáticos conhecidos. HNF4A teve sítios de ligação em 28% das sequências. Apenas 11% das sequências tinham sítios de ligação para pelo menos dois TFs entre PPARA, PPARG, NR2F2 e HNF4A, e 7% para todos os quatro TFs. Apesar das limitações na precisão das previsões do local de ligação do TF e apesar do fato de que muitos motivos podem ser não funcionais [62], nossos resultados sugerem que combinações específicas de TFs, em vez de TFs individuais, são necessárias para estabelecer a transcrição hepática. Além disso, a função das sequências testadas pode estar sujeita a ativação ou inibição por cis- e trans-Elementos reguladores. Por exemplo, a atividade intensificadora pode ser induzida por hormônios ou drogas sob condições particulares [63] ou depender de elementos funcionais vizinhos que estão ausentes na construção usada para o experimento. Este e outros fenômenos podem produzir observações falso-negativas nos ensaios do repórter. Em qualquer caso, os dados experimentais apresentados aqui fornecem validação independente e robusta das previsões do intensificador obtidas com os modelos baseados em promotor e fornecem suporte adicional para a hipótese de que a especificidade das interações entre intensificadores e promotores é pelo menos parcialmente devido à ligação de TFs específicos de tecido.

Nossos modelos prevêem vários realçadores específicos de tecido por locus e por tecido, bem como vários tecidos ou domínios de atividade para a maioria dos realçadores. Essa redundância, que tem sido relatada há muito tempo (por exemplo, [64-66]), pode servir para aumentar a robustez da rede regulatória [67]. Furthermore, it is likely that apparently redundant enhancers activate gene expression in different cell types and/or under different developmental stages or conditions [68–71]. The genomic distribution of enhancers is also likely to vary depending on the function of their target genes. For example, the loci of transcription factors and developmental genes are known to contain particularly high densities of CNEs, many of which act as distal enhancers [72–77]. More recently, advances in technical approaches, such as chromosome conformation capture and its derivatives, have confirmed these findings independent of sequence conservation [24, 78]. We observed that relatively long loci, such as those of genes expressed in brain tissues, featured more enhancer predictions per locus compared to short loci. However, some compact loci, such as those of genes highly expressed in liver, lung, and heart, contained a relatively large number of enhancer predictions, providing evidence for a particular need for fine-tuning the expression level in these tissues. Furthermore, the level of conservation of enhancer sequences is likely to depend, as other studies suggests (for example, [79, 80]), on their particularly activity, although we found that, for all models, a large proportion of the enhancer predictions is likely to be conserved across mammals.

Finally, our results add further evidence for a significant role of both promoters and enhancers in determining tissue specificity. This role is supported by several examples from the literature [14, 81, 82]. Different enhancer-promoter preferences would provide an additional level of transcriptional control, assisting in establishing the favorable interactions, for instance, between enhancers and their cognate promoters when they are distant, or between enhancers and their cognate promoters within a gene cluster. The intimate coordination of promoters and enhancers in regulating tissue-specific transcription has immediate practical consequences. It makes it possible to describe the complex regulatory landscape of higher eukaryotes, and eventually identify regulatory elements located hundreds of kilobases away from their target gene, based solely on the analysis of proximal regulatory elements. DNA microarrays and, more recently, RNA-seq are currently being used to profile the transcriptomes of a diverse range of cell/tissue types, conditions, and species. As more expression data become available, particularly in the context of large projects such as ENCODE [83] and the 1000 Genome Project [84], it is our belief that the application of approaches such as the one we are proposing here will result in important new insights and improve our understanding of transcriptional regulation. Such projects are also generating a wealth of epigenetics information that can be easily integrated with our models to reveal genomic signatures controlling transcription.


NamiRNAs colocalize with enhancers and eRNAs

Proposed eRNA and NamiRNA dual gene activation model

eRNAs and NamiRNAs work simultaneously to activate target genes in this proposed model. Chromatin looping and high alteration of chromatin structure before replication proximate target genes and enhancers of both NamiRNA and eRNA, inducing an interaction between the enhancers and genes of eRNAs and NamiRNA. NamiRNAs target the enhancer promoters and subsequently activate them, leading to the transcription of eRNAs [3]. NamiRNA forms a complex with nAGO2 and Pol II and activates markers such as H3K27ac, H3K4me3, and H3K4me1 at active enhancers [18, 19]. The enhancer’s activation is recognized by Pol II, which then transcribes eRNAs [3] (Fig. 5). The eRNAs interacting with CBP and p300 [23] elevate chromatin accessibility for TFs via acetylating histones H3 and H4 at the gene promoter [84]. These activities of eRNAs alter enhancer features such as H3K27ac and DNase hypersensitivity and the binding of TFs [85]. For example, knockdown of eRNAs at their respective enhancer and target-promoter areas decreases H3K27ac but increases H3K27me3 levels [43]. These enhance features at genes’ promoter and attract NamiRNAs. The attracted NamiRNAs overlap within the enhancer markers and form a complex with nAGO2 and recruits p300, catalyzing H3K27ac at the promoter region and activating it (Fig. 5). These predict an interactive eRNA-NamiRNA, starting and improving target genes on the same or different chromosomes during chromatin looping [10, 17]. Transcribed eRNAs may orchestrate miRNA expression since eRNAs can solely regulate gene expression [73].

The proposed model of eRNAs and NamiRNAs cooperatively enhancing and activating target genes. NamiRNAs form a complex with AGO2 and p300 they bind to enhancers and activate markers such as H3K27ac and H3K27me3, which attract RNA polymerase to recognize and translate the enhancer. Transcribed RNAs bind to p300 and other proteins to activate enhancer features at the target gene’s promoters. The attracted NamiRNAs then attach to the gene’s promoter and subsequently activate the target gene’s expression

ERNAs and NamiRNAs located on different chromosomes may interact during their activities

NamiRNAs and eRNAs located on different chromosomes may interact and perform similar functions. For example, miR-17 from miR-17HG interacts with NET1e, an eRNA transcribed from a close enhancer of the NET1 gene to induce drug resistance (Table 2). Overexpressed miR-17 knocks down PTEN (its target tumor suppressor), activating other downstream cellular components such as AKT and hypoxia-inducible factor-1α (HIF-1α) [86]. Similarly, NET1e interacts with the NET1 to form subsequent resistance to induced compounds and drugs, hence worsening cell survival and increasing tumor growth [87]. And overexpressing NET1e caused drug resistance to the PI3K inhibitor and BCL-2 inhibitor in MCF7 cells via PI3k-Akt pathways [87]. It can be speculated that NET1e can function similarly to miR-17 since both exhibit Akt pathways during their drug resistance activities, indicating an interaction between them (Fig. 6a).

Proposed eRNA and NamiRNA interaction in drug resistance (uma) and breast cancer tumorigenesis (b) During drug resistance, overexpressed miR-17 represses PTEN leading to the activation of the PI3K-Akt pathway and HIF-1α. Simultaneously, Net1e increases the expression of NET1 while inhibiting the PI3K inhibitor and BCL-2. NET1 and NET1e interact with miR-17 via the PI3K-Akt pathway to inhibit apoptosis and increase tumor growth, while NET1 causes induced drug resistance (uma) In breast cancer, fibroblast growth factor receptor 2 interacts with NET1e, the Estrogen receptor (ER), to regulate BRCA and other cancer genes, which are targets of miR-200b

429. These trigger an interaction between miR-200b

429, ER, NET1e, and ER-associated genes leading to tumor suppression, increased proliferation, and inhibited apoptosis in breast cancer cells

Moreover, NamiRNAs and eRNAs contribute to cancer drug resistance through enhanced drug efflux, altered drug metabolism, and enhanced anti-apoptosis pathways [88]. In tumor suppression and apoptosis, eRNAs originating from p53-bound enhancer regions (p53BERs) are required for p53-dependent cell-cycle arrest NamiRNA miR-17–92 suppresses chromatin regulatory genes (Sin3b, Hbp1, Suv420h1, and Btg1) and the apoptosis regulator (Bim) via similar TFs (such as AGO2 and FOXA1) to regulate cell survival and autonomous proliferation [89]. Another example of eRNA-NamiRNA dual interaction is the proposed model of Net1e and miR-200b

429 in breast cancer. The miR-200b

429 gene produces miR-200b eRNAs from an enhancer located approximately 5.1 kb upstream [90]. miR-200b

429 targets BRCA associated proteins and orchestrates their expression in cancer. Moreover, fibroblast growth factor receptor 2 (FGFR2) interacts with NET1e and the estrogen receptor (ER) ER associates with BRCA and other cancer genes that are targets of miR-200b

429. These connect miR-200b

429, miR-200b eRNA, NET1e, and ER-associated genes, leading to breast cancer regulation by controlling tumor suppression, proliferation, and apoptosis (Fig. 6b). The activities and expression of these RNAs can be a predictive factor in monitoring the expression of genes associated with the eRNAs mentioned above in breast cancer. These observations demonstrate that chromatin looping aids the interaction between eRNAs and NamiRNAs, which associates and works hand in hand to regulate cellular activities.

ERNA and NamiRNA action in disease diagnosis

Recently, SEs, enhancers, and eRNAs have been used as factors for analyzing, mapping, and studying a broad range of conditions, including autoimmunity [103], cancer [101], and muscle-related disease such as muscular dystrophies [104]. About 80% of genes in the canonical cancer signaling pathways are associated with specific eRNAs [87] and NamiRNAs in at least one cancer type. A genome-wide association study found eRNAs or SEs near known genetic variants for autoimmune disease risk in autoimmune disease patients, hence serving as biomarkers [103], which makes disease diagnostics easy [22, 109].

Moreover, eRNAs and NamiRNAs explore autophagy, apoptosis, and signaling pathways to regulate diseases. For instance, overexpression of the NamiRNA miR-378/378 enhances autophagy and represses apoptosis by targeting caspase 9, while the opposite reduces autophagy and accumulates abnormal mitochondria, and enhances apoptosis. These miRNAs target the rapamycin (mTOR)/unc-51-like autophagy activating kinase 1 pathway to inhibit apoptosis, and target phosphoinositide-dependent protein kinase 1 to maintain autophagy via Forkhead box class O (FoxO)-mediated transcriptional reinforcement [97]. Alternatively, the knockdown of growth-regulating estrogen receptor binding 1 (GREB1) eRNA enhances apoptosis and represses proliferation in bladder cancer [105]. These small RNA molecules, i.e., NamiRNA and eRNA, are predicted to contribute to cancer drug resistance through enhanced drug efflux, altered drug metabolism, overexpression of target molecules, and enhanced survival anti-apoptosis pathways [88]. Subsequent downregulation of NamiRNAs miR-34, miR-17, and let-7a is associated with sensitivity to drugs commonly used as cancer treatments.

ERNA and NamiRNA activities in therapeutics

NamiRNA and eRNA are the next options in diagnosing, treating, and studying the pathogenesis of diseases that are not associated with current biomarkers [106]. People can exploit these biomarkers regarding the dysregulation of genes and mRNAs in myopathy and other disorders. Concerning this effort, the USA FDA approved its first siRNA drug (patisiran infusion) in 2018 to treat peripheral nerve disease caused by hereditary transthyretin-mediated amyloidosis [107]. Moreover, the drug’s therapeutic mechanism is based on silencing the RNA that causes the disease. eRNAs are now known to play roles in diseases such as myopathy hence eRNA-targeted therapy [108] may be the next option. However, the environmental conditions or manipulation affects the expression and activities of NamiRNAs and eRNAs in diseases. Likewise, epigenetic factors also regulate eRNAs and NamiRNAs. For instance, epigenetic silencing of cell or tissue-specific eRNAs or NamiRNAs (e.g., miR-495 [96], Epstein–Barr virus super-enhancer eRNAs [109], and miR-335 [110]) can induce proliferation. Table 2 presents some diseases and therapeutics involving both eRNA and NamiRNA.


Human DNA methylation data as measured by bisulfite sequencing or Illumina 450k array available for 15 cell lines was obtained from SALK and ENCODE databases. The regulatory regions predicted from chromatin marks were downloaded from ENCODE database [35]. Gene expression data by RNA-Seq, available in 4 cell lines, was imported from SALK database [16]. RPKM (Reads per kilo base per million) values was used for transcripts' expression [36]. Transcription factor binding is based on ChiP-seq or computational predictions [23, 35]. Gene annotation from UCSC Genome database was used [37].

CpG sites in the study

The methylation level of a CpG site was measured as the ratio of the number of methylated cytosines to the total number of sequences on that position in the bisulfite sequencing data. To take into account only the sites with reliable measurement, we only consider the CpG sites covered with more than 4 sequences.

Random region selection

Only the mCpGs in the coding regions and the upstream regions of genes were considered, where the upstream region of a gene was defined as the 10 kb region upstream of the gene transcription start site (TSS). The immediate downstream gene was classified as the target gene for those identified mCpGs. To exclude the effect of differential methylation due to different genomic regions, we selected random regions with similar genomic positions as mCpG sites. For a regulatory region in the upstream region, we selected the corresponding random regions with the same relative distance to the TSS (Figure 7A). Here the relative distance to the TSS was measured as the actual distance normalized by the total length of the coding region and the upstream region of the gene. For a regulatory region in an exon or an intron region, we selected the corresponding random regions with the same relative distance to the nearest boundary of the exon or intron of the target gene. Here the relative distance was normalized by the length of the exon or intron, depending on whether the region of interest is on exon or intron (Figure 7B). 1000 random region selections for each regulatory region were performed in this study.