Em formação

Mutações / exclusões com CRISPR


Preciso impedir que alguma proteína seja ativa e procurar uma maneira universal de fazer isso. Em mamíferos.

Com o CRISPR é possível nocautear todo o gene. Mas é um pouco complicado (precisa de dois gRNA por exemplo). Há também outros motivos, então preciso fazer isso com apenas um gRNA.

Portanto, estou pensando em inserir alguma mutação.

Minha pergunta: Existe maneira de fazer alguma mutação que irá impedir a criação de proteína funcional, com alta eficiência - com um gRNA. E sem precisar saber o sítio ativo da proteína.

Por exemplo, deslocamento de quadro ou mutação em torno do códon de início? É possível? Se sim, como posso fazer isso? Para onde devo enviar o gRNA?

Obrigado.


Você pode fazer com um único gRNA. Tudo o que os sistemas CRISPR-Cas, ZFN ou TALEN fazem é introduzir uma quebra de fita dupla em um local específico. O DNA é reparado por meio de dois mecanismos - união de extremidades não homólogas (NHEJ) e recombinação homóloga (HR). O NHEJ está sujeito a erros e pode introduzir indels que podem comprometer a função do gene (frameshifts, etc.). Enquanto HR pode ser usado para integrar um transgene ou reparar uma mutação, NHEJ pode ser usado para criar mutações.

Eu realmente não eliminei um gene usando CRISPR-Cas, mas é bom ter como alvo a parte inicial da ORF. Haverá muitos outros fatores que determinarão qual local deve ser escolhido para segmentação e um fator importante seria a singularidade da sequência de destino. Consulte este site para obter orientações sobre como selecionar uma boa sequência de destino.

Você teria que fazer uma triagem rigorosa, no entanto; a vantagem do nocaute por inserção é que a triagem pode ser muito mais fácil (por exemplo, inserindo GFP ou gene de resistência à puromicina).

Você pode dar uma olhada neste artigo e nas informações complementares; eles têm como alvo 18080 genes com uma biblioteca CRISPR-Cas.


A edição do gene CRISPR pode causar centenas de mutações indesejadas

Proteína Cas9 associada a CRISPR (branco) de Staphylococcus aureus com base em Protein Database ID 5AXW. Crédito: Thomas Splettstoesser (Wikipedia, CC BY-SA 4.0)

À medida que CRISPR-Cas9 começa a entrar em ensaios clínicos, um novo estudo publicado em Métodos da Natureza descobriu que a tecnologia de edição de genes pode introduzir centenas de mutações indesejadas no genoma.

"Sentimos que é fundamental que a comunidade científica considere os riscos potenciais de todas as mutações fora do alvo causadas por CRISPR, incluindo mutações de nucleotídeo único e mutações em regiões não codificantes do genoma", disse o co-autor Stephen Tsang, MD, PhD, o Laszlo T. Bito Professor Associado de Oftalmologia e Professor Associado de Patologia e Biologia Celular no Centro Médico da Universidade de Columbia e no Instituto de Medicina Genômica e Instituto de Nutrição Humana de Columbia.

A tecnologia de edição CRISPR-Cas9 - em virtude de sua velocidade e precisão sem precedentes - tem sido uma bênção para os cientistas que tentam entender o papel dos genes nas doenças. A técnica também aumentou a esperança de terapias genéticas mais poderosas, que podem excluir ou reparar genes defeituosos, não apenas adicionar novos genes.

O primeiro ensaio clínico para implantar o CRISPR está em andamento na China, e um ensaio nos EUA está programado para começar no próximo ano. Mas embora o CRISPR possa atingir com precisão trechos específicos de DNA, às vezes atinge outras partes do genoma. A maioria dos estudos que procuram essas mutações fora do alvo usa algoritmos de computador para identificar as áreas mais prováveis ​​de serem afetadas e, em seguida, examinam essas áreas em busca de exclusões e inserções.

"Esses algoritmos preditivos parecem fazer um bom trabalho quando CRISPR é realizado em células ou tecidos em um prato, mas o sequenciamento do genoma inteiro não foi empregado para procurar todos os efeitos fora do alvo em animais vivos", diz o co-autor Alexander Bassuk, MD, PhD, professor de pediatria da Universidade de Iowa.

No novo estudo, os pesquisadores sequenciaram todo o genoma de camundongos que foram submetidos à edição do gene CRISPR no estudo anterior da equipe e procuraram todas as mutações, incluindo aquelas que alteraram apenas um único nucleotídeo.

Os pesquisadores determinaram que o CRISPR corrigiu com sucesso um gene que causa cegueira, mas Kellie Schaefer, uma estudante de doutorado no laboratório de Vinit Mahajan, MD, PhD, professora associada de oftalmologia na Universidade de Stanford e coautora do estudo, descobriu que os genomas de dois receptores independentes de terapia gênica sustentaram mais de 1.500 mutações de nucleotídeo único e mais de 100 deleções e inserções maiores. Nenhuma dessas mutações no DNA foi prevista por algoritmos de computador amplamente usados ​​por pesquisadores para procurar efeitos fora do alvo.

“Os pesquisadores que não estão usando o sequenciamento do genoma inteiro para encontrar efeitos fora do alvo podem estar perdendo mutações potencialmente importantes”, diz o Dr. Tsang. "Mesmo uma única mudança de nucleotídeo pode ter um grande impacto."

O Dr. Bassuk diz que os pesquisadores não notaram nada obviamente errado com seus animais. "Ainda estamos otimistas com relação ao CRISPR", disse o Dr. Mahajan. "Somos médicos e sabemos que cada nova terapia tem alguns efeitos colaterais potenciais - mas precisamos estar cientes de quais são eles."

Os pesquisadores estão atualmente trabalhando para melhorar os componentes do sistema CRISPR - sua enzima de corte de genes e o RNA que guia a enzima para o gene certo - para aumentar a eficiência da edição.

"Esperamos que nossas descobertas encorajem outros a usar o sequenciamento do genoma inteiro como um método para determinar todos os efeitos fora do alvo de suas técnicas CRISPR e estudar diferentes versões para a edição mais segura e precisa", disse o Dr. Tsang.

O artigo é intitulado, "Mutações inesperadas após a edição do CRISPR-Cas9 in vivo". Os autores adicionais são Kellie A. Schafer (Stanford University), Wen-Hsuan Wu (Columbia University Medical Center) e Diana G. Colgan (Iowa).


Introdução

As amebas sociais Dictyostelium discoideum tem sido usado como um organismo modelo eucariótico simples por várias décadas. Este organismo é relativamente fácil de crescer como células individuais, no entanto, após a inanição, as células começam a se reunir em agregados mediados por quimiotaxia que, em última instância, formam um corpo de frutificação multicelular que consiste em dois tipos de células diferenciadas: células-tronco e células de esporos. Como consequência, este organismo é útil para examinar genes envolvidos em funções celulares e de desenvolvimento fundamentais, como regulação da transcrição, migração celular, fagocitose e macropinocitose [1].

Uma vez que a sequência do genoma de D. discoideum foi determinado [2], mutantes nocaute de gene foram amplamente gerados para investigar as funções dos genes. Vários genes marcadores, como aqueles que conferem resistência à blasticidina, G418 ou higromicina, têm sido usados ​​para direcionar genes de interesse [3]. No entanto, os métodos de nocaute de gene com base na recombinação homóloga (HR) às vezes são ineficientes e demorados, especialmente para gerar vários nocautes de gene como o Cre-loxP sistema sequencialmente nocauteou os genes reciclando o cassete de resistência a drogas [4]. Recentemente, um método eficiente de direcionamento de genes sem marcadores com base no sistema CRISPR / Cas9 foi desenvolvido em D. discoideum [5, 6]. Neste sistema, a nuclease Cas9 e os sgRNAs são expressos simultaneamente a partir de um vetor tudo-em-um. O complexo Cas9 / sgRNA reconhece um local alvo específico de 20 nucleotídeos adjacente a uma sequência de motivo adjacente de protoespaçador (PAM). O complexo induz uma quebra de fita dupla (DSB) de aproximadamente 3 pares de bases (pb) a montante da sequência PAM, e o dano ao DNA é então reparado por meio de união de extremidade não homóloga (NHEJ) ou reparo dirigido por homologia (HDR) [7 ] NHEJ deixa inserções ou deleções (indels) no local de clivagem, e a via de HDR pode introduzir sequências que codificam uma proteína fluorescente, tag ou mutação pontual no gene de interesse [8, 9]. É muito provável que os indels resultantes interrompam o gene alvo, introduzindo mutações de deslocamento de quadro em regiões codificadoras de proteínas.

Apesar da grande promessa e robustez do sistema CRISPR / Cas9, existem duas preocupações quanto ao uso deste sistema em D. discoideum. Em primeiro lugar, espera-se que a especificidade do direcionamento seja baixa [5, 6]. Em células de mamíferos que são extensivamente estudadas, as nucleases Cas9 às vezes clivam locais fora do alvo que compartilham alta homologia de sequência com o local alvo [10-13]. Refinamentos para melhorar a especificidade do direcionamento para minimizar os efeitos fora do alvo são essenciais. Em segundo lugar, a sensibilidade na triagem e validação dos mutantes indel modificados por CRISPR via PCR para detecção de mutação é insuficiente no sistema atual [6]. Ao contrário dos nocautes de gene convencionais gerados por meio de métodos baseados em HR, as mutações indel geradas por CRISPR / Cas9 consistem em deleções ou inserções de um ou alguns nucleotídeos na região alvo. Ao projetar um dos primers para abranger o local de clivagem, que contém uma mutação indel que altera alguns nucleotídeos, é possível identificar a mutação quando a amplificação por PCR é suprimida no locus mutado. No entanto, a possibilidade de falsos positivos devido à amplificação por PCR ineficiente não pode ser excluída, portanto, ambigüidades permanecem no método. Portanto, é necessário um método de detecção de mutação preciso no qual os comprimentos dos produtos de PCR gerados a partir dos modelos de tipo selvagem e mutantes que são obviamente diferentes.

Para reduzir a probabilidade de efeitos fora do alvo sem diminuir a eficiência de direcionamento do gene, uma cas9 nickase foi desenvolvida para introduzir quebras de fita única específicas para o alvo (nicks) [14-16]. Nicks individuais no genoma são reparados com alta fidelidade [17], enquanto a produção simultânea de nicks em ambas as fitas de DNA por um par de nickases Cas9 leva a um DSB específico do alvo que é reparado por NHEJ [18, 19]. A atividade de clivagem da nuclease Cas9 é mediada por dois domínios catalíticos, RuvC e HNH. Esses domínios foram inativados por meio de mutações pontuais (D10A em RuvC e H840A em HNH) de modo que a nuclease Cas9 foi convertida em uma Cas9 nickase [15, 20, 21]. O domínio RuvC é necessário para a clivagem da fita não alvo, portanto, o mutante D10A produz apenas um corte na fita alvo que contém a sequência PAM. Por outro lado, o domínio HNH normalmente cliva a fita alvo, no entanto, o mutante H840A gera um corte na fita complementar ao sgRNA. Embora projetar um par de sgRNAs para o sistema de nickase Cas9 seja mais complicado, uma vez que dois sgRNAs com sequências PAM voltadas para fora devem ser selecionados, o método de corte duplo foi usado com sucesso para reduzir os efeitos fora do alvo em 50 a 1.500 vezes sem reduzir a eficiência de direcionamento do gene [15, 16, 22]. Usando este método, exclusões de até 100 bp foram geradas no primeiro relatório [15, 16], enquanto relatórios posteriores descreveram deleções de aproximadamente 1 kb [22]. Essas delecções longas suportam uma detecção de mutação melhorada devido às diferenças de tamanho maiores nos produtos de PCR gerados a partir das linhas WT e mutantes.

Neste estudo, desenvolvemos um sistema de edição de genoma mediado por nickase Cas9 eficiente e direto com um vetor tudo-em-um para uso em D. discoideum. O sistema gerou mutantes de forma eficiente com deleções maiores que 1 kb. Além disso, ao misturar o oligo DNA de fita simples (ssODN) com o vetor, foram geradas deleções precisas e mutações pontuais sem a introdução de cassetes de resistência a drogas. O sistema de nickase CRISPR recém-desenvolvido servirá como uma ferramenta poderosa e valiosa de modificação do genoma em D. discoideum.


Resultados e discussão

TiD composto por proteínas efetoras Cas com um Cas10d pode ser usado para edição do genoma

O locus CRISPR / Cas TiD que consiste em oito genes Cas (Cas1d-Cas7d, Cas10d) seguido por uma matriz de unidades espaçadoras de repetição, foi identificado a partir de Microcystis aeruginosa 1,2. O gene Cas8 típico - o efetor comum em CRISPR tipo I-A, B, C, E e F 2,16 - está ausente do locus CRISPR / Cas TiD de M. aeruginosa, prevendo diferentes mecanismos de estabilidade do complexo em cascata e atividade de clivagem de DNA in vivo em TiD em comparação com outros subtipos de tipo I (Fig. 1a). Para identificar o PAM no sistema TiD em M. aeruginosa, realizamos um ensaio de depleção usando o marcador de seleção negativa ccdB. pCmMa567d10 (Fig. 7 suplementar), contendo cassetes de expressão para Cas5d, Cas6d, Cas7d e Cas10d carregando uma mutação no domínio semelhante a HD [dCas10d (H177A)] e gRNAs direcionados ao ccdB promotor, foi introduzido em Escherichia coli estirpe BL21-AI seguida por um plasmídeo da biblioteca PAM, pPAMlib-ccdB (Fig. 1b, Fig. 9 suplementar). ccdB a seleção negativa revelou o PAM: 5′-GTH-3 ′ (H = A ou C ou T) adjacente à sequência alvo (Fig. 1b painel inferior, Dados Suplementares 1 e 2). Quando pCmMa567 (Fig. 8 suplementar), que carrega cassetes de expressão para Cas5d, Cas6d e Cas7d, foi usado para triagem em vez de pCmMa567d10, GTH PAMs foram selecionados, mas os transformantes resultantes eram instáveis ​​e o crescimento de E. coli as células estavam muito fracas. Estes resultados sugeriram que Cas10d requer o PAM correto para repressão total, e que Cas10d é uma contraparte funcional de Cas8 para reconhecimento e estabilização de PAM. Não encontramos nenhuma sequência de aminoácidos semelhante compartilhada entre as famílias de proteínas Cas10d e Cas8.

uma A estrutura CRISPR tipo I-D (TiD). Organização da subunidade superior de TiD e esquema de gRNA (preto) de TiD. Esquemático do meio de gRNA (azul) de TiD e DNA alvo (preto). O PAM do alvo é mostrado em vermelho. b Identificação do PAM pelo E. coli triagem de seleção negativa usando ccdB sistema de expressão. A biblioteca PAM foi inserida na frente da sequência alvo de ccdB promotor. A frequência do PAM foi determinada usando o E. colli células. Os dados são médias ± S.E. de experimentos independentes (n = 3). c Esquema do ensaio repórter de luciferase usado para detectar a edição do genoma em células HEK293T humanas. Os vetores de expressão Cas e um vetor repórter LUC, no qual a sequência alvo foi introduzida, foram transfectados em células HEK293T e a clivagem de endonuclease foi detectada por luminescência. d O ensaio de repórter Luc mostrou que Cas3d e Cas10d eram necessários para a atividade de TiD. Barra preta gRNA não alvo no ensaio luc repórter. gRNAs foram direcionados para o humano AAVS locus listado na Tabela Suplementar 1. Os dados são médias ± S.E. de experimentos independentes (n = 4). *P & lt 0,05 e **P & lt 0,01 são determinados pelos testes t de Student. e, Efeito do comprimento da sequência alvo de gRNA na atividade de TiD. Os dados são médias ± S.E. de experimentos independentes (n = 4). *P & lt 0,05, **P & lt 0,01 e ***P & lt 0,005 são determinados por Student’s t testes. f Ensaio de repórter Luc para determinar os alvos para o SlIAA9 gene. gRNAs foram direcionados ao tomate IAA9 gene (SlIAA9) listados na Tabela Suplementar 1. Os dados são médias ± S.E. de experimentos independentes (n = 4) e *P & lt 0,05, **P & lt 0,01 e ***P & lt 0,005 são determinados pelos testes t de Student.

Para detectar a atividade de edição do genoma da função de nuclease TiD e Cas10d, realizamos o sistema de recombinação de recozimento de fita simples de luciferase (SSA) usando células HEK293T (Fig. 1c). Este sistema consiste em luciferase NanoLuc contendo braços de homologia de 300 bp separados por um códon de parada e um fragmento do gene alvo. Primeiro, o humano AAVS1 fragmento de gene contendo o sítio alvo TiD (Tabela Suplementar S2) foi usado para avaliar o complexo TiD usando a sequência espaçadora crRNA de 35 pb. Neste ensaio, as células HEK293T foram transfectadas simultaneamente com efetores TiD Cas, gRNA e NanoLuc interrompidos com fragmento do gene alvo e vetores de expressão de luciferase de pirilampo e, em seguida, o ensaio repórter luc foi realizado 72 horas após a transfecção. A exclusão de Cas3d ou Cas10d aboliu a atividade de edição do genoma TiD no ensaio de repórter luc (Fig. 1d, Dados Suplementares 1), sugerindo que Cas3d ou Cas10d têm papéis essenciais na atividade de edição do genoma. No locus CRISPR original de M. aeruginosa cepa PCC9808, ambas as sequências espaçadoras de 35 pb e 36 pb são usadas para direcionar DNAs genômicos específicos, ambos os espaçadores funcionam na edição do genoma em células humanas (Fig. 1e, Dados Suplementares 1). Para avaliar a atividade de edição do genoma de TiD para genes de plantas, realizamos o ensaio luc para várias sequências de genes alvo de arroz e tomate, SlIAA9 (importante na partenocarpia) 17 e NADK2 (OsNADK2) (Fig. 1f, Fig. 1b suplementar, Dados 1 suplementares). Os resultados mostraram que havia vários alvos com GTT ou GTC PAM com maior atividade no ensaio luc do que GTA PAM.

Mutagênese direcionada por TiD em plantas

Em seguida, construímos vetores de expressão TiD com promotores específicos de células vegetais para expressão de genes Cas otimizados para códons e gRNA foram empregados para induzir mutagênese dirigida ao local em tomate: pTiDP1.2, um vetor tudo-em-um, abrigando um único CaMV35S promotor que conduz todos os 5 ORFs de efetores Cas separados por 2A de peptídeo autoclivante e pMGTiD20, em que dois cassetes de expressão sob dois promotores (CaMV35S e Salsa UBIQUITIN 4-2) são usados ​​para expressar genes efetores Cas (Suplementar Fig. 1a). As cassetes separadas em pMGTiD20 foram concebidas para eliminar níveis decrescentes de expressão do terminal C na cassete única longa para ORFs múltiplos em pTiDP1.2. gRNAs direcionados a uma sequência de 35 pb nos genes do tomate, SlIAA9 e RIN (SlRIN envolvidos no amadurecimento dos frutos) 18. Para o SlIAA9 gene, os gRNAs selecionados no ensaio luc repórter, GTT_gRNA5-A (-) e GTC_gRNA1 (+) (Fig. 1f), ambos um único gRNA para GTC_gRNA1 (+) e gRNAs multiplex para GTT_gRNA5-A (-) e GTT_gRNA5- B (+) (Tabela Suplementar 1) foram usados ​​para análises posteriores. O vetor TiD, pTiDP1.2, contendo os gRNAs projetados, um único gRNA para GTC_gRNA1 (+) ou gRNAs multiplex para GTT_gRNA5-A (-) e GTT_gRNA5-B (+) foram então transformados no cultivar de tomate Micro-Tom por Agrobacterium-transformação mediada, respectivamente. Analisamos a eficiência da mutação induzida por TiD em calli de tomate transgênico por Cel-1, PCR-RFLP usando AccI 17 e sequenciamento. Nos calos e rebentos de tomate transgénico T0, as pequenas mutações indels foram detectadas por estas análises (Fig. 2, Figs. Complementares 2, 3).

uma, b As mutações foram detectadas pelo ensaio Cel-1 (uma) e PCR-RFLP (b) Controle de vetor WT (VC), MT Micro-Tom, AC Ailsa Craig, uma, # 5 e 11 os calli Micro-Tom transgênicos CRISPR TiD (geração T0). b Acima, # 6, 8 e A, o Micro-Tom transgênico CRISPR TiD dispara (geração T0), # A-1 e A-2 nas próximas gerações (T1) de #A. inferior, # 4, 7 e 8 os brotos transgênicos CRISPR TiD Ailsa Craig (geração T0), - sem enzimas, + com nuclease Cel-1 (superior) ou AccI (inferior), bandas de mutação com setas vermelhas. c Fenótipos de plantas de SlIAA9tomateiros interrompidos (Ailsa Craig) gerados por CRISPR TiD. Barras = 2 cm (direita). d SlIAA9 frutos de tomate nocaute (Ailsa Craig) com fenótipos de partenocarpia (direita). Barras = 1 cm. e Sequências de mutação no IAA9 gene dos brotos mutantes Micro-Tom (MT) e Ailsa Craig (AC) (geração T0) transformados com CRISPR TiD analisados ​​pelo método de Sanger. Sequências de tipo selvagem WT. As sequências alvo de gRNA são indicadas em caixas verdes e PAM é indicado em caixas rosa. As frequências de sequência nos produtos de PCR clonados foram indicadas à direita da sequência. f Sequências de mutação no IAA9 gene de brotos de Ailsa Craig (AC) (geração T0) transformados com CRISPR TiD analisado por sequenciamento profundo do amplicon usando Mi-seq (illumina). Sequências de tipo selvagem WT. As sequências alvo de gRNA são indicadas em caixas verdes e PAM é indicado em caixas rosa. As frequências de sequência nas contagens de leitura no sequenciamento profundo são indicadas à direita da sequência. Todos os resultados da eletroforese e análise de sequência são exemplos típicos das plantas mutantes representativas geradas por TiD.

Ensaio Cel-1 e análise de sequência de produtos de PCR para determinar pequenas mutações indels induzidas por SlIAA9 GTC_gRNA1 (+) revelou mutação somática em calos Micro-Tom transgênicos 7/11 (Fig. 2a, Fig. 2a suplementar). Analisamos ainda a eficiência da mutação em brotos de tomate regenerados usando PCR-RFLP para SlIAA9 GTC_gRNA1 (+), identificando bandas não digeridas com AccI em brotos Micro-Tom 14/15 transgênicos (Fig. 2b, painel superior, Fig. 2b suplementar). Juntamente com a análise da sequência, os resultados indicaram que esses brotos transgênicos continham 100% de DNA mutado (Fig. 2e, Fig. 3a suplementar). Assim, as taxas de mutação foram aumentadas em brotos de tomate transgênicos durante a regeneração de calos Micro-Tom, e a análise de sequência de produtos clonados de PCR do DNA alvo do broto revelou mutações bialélicas. Mutantes homozigotos foram efetivamente isolados na geração T1 (Fig. 2b, painel superior, 2e, Fig. 3a suplementarSlIAA9-tid gRNA (+) MT T1_ # A-1, # A-2, # B-1). Mutantes bialélicos também foram gerados usando a cultivar comercial de tomate Ailsa Craig, conforme indicado por PCR-RFLP e análises de sequenciamento de sequenciamento baseado em clones e sequenciamento de próxima geração MiSeq (Fig. 2b, painel inferior, 2e, 2f). Tomateiros bi-alélicos maduros exibiram um claro típico SlIAA9 fenótipos de ruptura, como partenocarpia (fertilidade sem sementes) e mudanças na morfologia da folha 17 (Ailsa Craig Fig. 2c, d, Micro-Tom Supplementary Fig. 3b).

Juntos com o SlIAA9 experimentos, TiD induziu pequenos indels no local alvo (Fig. 2). No estudo anterior de Ueta et al., O CRISPR / Cas9 que tinha como alvo o SlIAA9 exon2 - localizado muito perto do local do SlIAA9 GTC_gRNA1 (+) - induziu mutações bialélicas em calos de tomate 17. Ao comparar as frequências de mutação de CRISPR / Cas9 e TiD em calli, as atividades de TiD foram ligeiramente inferiores às de Cas9 (63,6% para TiD e 73,0% para Cas9) 17, no entanto, o TiD SlIAA9 GTC_gRNA1 (+) não pode induzir mutações bialélicas em calli (Fig. 1a, Fig. 2a suplementar). Assim, a atividade de TiD na indução de mutações somáticas em calos foi menor do que a de Cas9. Ao contrário, nas amostras de broto, TiD poderia induzir mutações bialélicas em locais alvo com níveis de eficiência semelhantes aos de Cas9 (Fig. 2b, c, Figs. Suplementares 2, 3) 17. Juntos, esses resultados sugerem que pode haver especificidade de tecido no mecanismo de mutagênese mediada por TiD. Análises adicionais de outros alvos serão necessárias para testar esta hipótese, por exemplo, a detecção de padrões de mutação em linhagens celulares durante a regeneração de rebentos e a investigação de mutagênese específica de tecido pode fornecer pistas para uma melhoria adicional do sistema TiD na edição do genoma da planta.

Detecção de mutações de deleção de longo alcance por TiD em plantas

O CRISPR-Cas tipo I-E pode induzir a deleção de longo alcance em locais alvo no genoma de mamífero 13,14,15. Para detectar a atividade de TiD em um genoma de planta, realizamos PCR de longo alcance em calos de tomate transgênicos TiD. A PCR de longo alcance foi realizada usando primers específicos localizados em torno de 2–4 kbp a montante e a jusante da sequência alvo, respectivamente (Fig. 3, painel superior, Tabela complementar 4). A Figura 3 mostrou que os vários tipos de deleção de longo alcance induzida por SlIAA9 GTC_gRNA1 (+) foram detectados em calli transgênicos por PCR, e o sequenciamento do DNA clonado identificou a deleção bidirecional (∆2463 nt) do produto de PCR misto, com uma taxa de mutação de 6,7% (1/15 clones de sequenciamento) em um calo (# 5 Fig. 3, faixa 5 do painel superior esquerdo, Fig. 6 suplementar). Usando SlIAA9 GTT + GTT_gRNA5 - (-) (+), bandas de deleção específicas foram detectadas pela PCR aninhada em calos transgênicos 1/20 e 1/30, respectivamente (# 3 Fig. 3, painel inferior esquerdo pista 3, Fig. 6 suplementar ) A análise de sequência mostrou os mesmos fragmentos 100% mutados nestes clones, com deleções bidirecionais de ∆4305 nt (Fig. 3). Curiosamente, esses resultados indicaram que as mutações de deleção geradas por TiD no genoma do tomate eram bidirecionais, o que, junto com a geração de pequenas mutações indels por TiD, é a característica única de TiD que difere da mutação por tipo IE 13,14, 15, embora um trabalho recente sugira que Cas9 induziu grandes deleções complexas raras, além dos pequenos indels desejados em células ES de camundongo, e que essas grandes deleções eram bidirecionais, semelhantes a TiD, mas com menor frequência 19. Além disso, microhomologia e inserções foram observadas em locais de mutação TiD em mutações de deleção de longo alcance (Fig. 3), sugerindo que as vias de reparo de DNA específicas funcionam nessas mutações.

A detecção de mutações de deleção de longo alcance no SlIAA9 gene induzido pelo CRISPR TiD. São indicados a estrutura do gene, as posições do gRNA e os diferentes conjuntos de primers para amplificar a mutação. Os números mostram os conjuntos de primers (1 1 º PCR, 2 nested PCR). Os fragmentos amplificados por PCR separados em géis de agarose também são mostrados nos painéis à esquerda. Os resultados das grandes mutações de deleção analisadas pelo sequenciamento Sanger do DNA clonado dos calos de tomate transgênicos CRISPR TiD são mostrados nos painéis direitos. As posições dos nucleotídeos do PAM foram indicadas na sequência. As setas indicam as bandas específicas usadas para clonagem e sequenciamento. Todos os resultados da eletroforese e análise de sequência são exemplos típicos das plantas mutantes representativas geradas por TiD.

Em seguida, tentamos gerar um CRISPR TiD visando outro locus no genoma do tomate, o SlRIN , usando o vetor pMGTiD20, e analisou as mutações nos calos transgênicos e nos brotos regenerados (Fig. 4). A PCR de longo alcance foi realizada usando iniciadores específicos localizados a cerca de 3 kbp a montante e a jusante da sequência alvo, respectivamente (Fig. 4a, painel superior, Tabela Suplementar 4). Usando SlRIN GTC_4003–4238 (+), bandas de deleção específicas foram detectadas pelo PCR aninhado em 1/30 calli transgênicos (# 6 Fig. 4a, pista 6, Suplementar Fig. 6) e a análise de sequência mostrou os mesmos 100% de fragmentos mutados nestes clones, com deleções bidirecionais de ∆4930 nt (Fig. 4a). Na análise dos rebentos regenerados, 4 linhas de rebentos regenerados de 12 rebentos transgénicos individuais exibiram bandas específicas por PCR de longo alcance (Fig. 4b, painel esquerdo, Fig. 6 suplementar). Curiosamente, padrões de banda semelhantes foram detectados nas linhas de tiro individuais # 4, # 5 e # 12 (Fig. 4b, painel esquerdo, Fig. 6 suplementar) e a análise de sequência dos produtos de PCR clonados indicou dois tipos de deleções de longo alcance ( ∆4930 nt e ∆7257 nt) por outro lado, um único tipo de deleções de longo alcance de ∆7257 foi encontrado na linha # 6 (Fig. 4c, d). Os resultados indicaram que os primers de PCR diretos emparelharam com sequências homólogas 4,6 kbp a montante da sequência alvo e puderam detectar a mutação ∆7257 nessas linhas. Juntos, esses resultados sugerem que as mutações bialélicas foram efetivamente induzidas pelo CRISPR TiD em brotos de tomate, e as plantas mutantes maduras para RIN foram efetivamente obtidos na primeira geração (T0) por CRISPR TiD (Fig. 4b, painel direito). A partir desses resultados, podemos ver que os pequenos indels não foram detectados nesses loci usando SlIAA9 GTT + GTT_gRNA5 - (-) (+) e SlRIN GTC_4003–4238 (+), indicando que vários padrões de mutação foram induzidos por cada gRNA no sistema CRISPR TiD.

uma A detecção de mutações de deleção de longo alcance no SlRIN gene induzido pelo CRISPR TiD. A estrutura do gene, as posições do gRNA e os diferentes conjuntos de primers para amplificar a mutação foram indicados. Os números mostram os conjuntos de primers (1 1 º PCR, 2 nested PCR). Os fragmentos amplificados por PCR separados em géis de agarose indicam deleções de longo alcance induzidas por CRISPR TiD no tomate RIN locus nos calli mutantes (Micro-Tom, geração T0). Plantas de controle de vetor VC, 1-7 as linhas de calo transgênicas. b Os fragmentos amplificados por PCR separados em géis de agarose indicam delecções de longo alcance induzidas por CRISPR TiD no tomate RIN locus nos rebentos mutantes (Micro-Tom, geração T0). WT tipo selvagem, 1-12 as linhas de rebentos transgênicos. As grandes deleções foram detectadas nas linhas # 4, 5, 6 e 12. As bandas com o mesmo comprimento que as do tipo selvagem eram bandas não específicas. As setas indicam as bandas específicas que foram submetidas a análises de sequenciamento adicionais, as setas vermelhas indicam o fragmento1 e as setas azuis indicam o fragmento2, conforme mostrado em c. Jovem mutante atira para tomate RIN (Micro-Tom direito, T0 geração # 6) gerado por CRISPR TiD. Barra = 1 cm. c O sequenciamento de Sanger usando o DNA clonado dos brotos de tomate transgênicos CRISPR TiD (T0 # 4, 5, 6 e 12) indicou que as grandes mutações de deleção ocorreram de forma idêntica, no entanto, as frequências de mutação foram variadas nas linhas. d As sequências de mutação do DNA clonado de uma. As posições dos nucleotídeos do PAM foram indicadas na sequência.

Efeitos fora do alvo gerados por TiD no genoma da planta

Em seguida, analisamos os efeitos fora do alvo do TiD no genoma da planta. Os alvos TiD que têm o 5′-GTH -3 ′ PAM em todo o genoma de Arabidopsis e arroz, e toda a região dos cromossomos 4 e 5 do tomate, e cada SlIAA9 e SlRIN gene foram contados e comparados com aqueles de Cas9 (5′-NGG -3 ′ PAM) (Fig. 5a, b, Fig. 4 suplementar, no alvo). Nesta análise, os cromossomos do tomate foram selecionados como representativos de todo o genoma do tomate. Os resultados indicam que existem mais sítios-alvo para TiD em ambos os genes-alvo e níveis de cromossomos em tomate e Arabidopsis do que para Cas9. Ao contrário, o genoma do arroz tem mais alvos Cas9 do que os de TiD, isso pode resultar do maior conteúdo de GC no genoma do arroz e no PAM Cas9 do que em outras espécies e no PAM TiD. Além disso, quando as sequências candidatas fora do alvo que contêm 0 a 5 incompatibilidades também foram contadas no genoma inteiro do tomate para cada SlIAA9 e SlRIN gene, em Arabidopsis e genomas inteiros de arroz, e nos cromossomos representativos de tomate para os alvos no mesmo cromossomo, respectivamente, há menos sequências incompatíveis para TiD do que para Cas9 (Fig. 5a, b, Fig. 4 suplementar , números incompatíveis de 0 a 5). Em cromossomos de arroz, a tendência decrescente de alvos TiD em comparação com Cas9 foi mais clara em alvos fora do alvo. Esses dados mostram que há menos sequências fora do alvo para TiD em genomas de plantas, sugerindo uma vantagem de TiD na edição do genoma de plantas.

uma, b Números de site de destino TiD, incluindo incompatibilidades no SlIAA9 e SlRIN genes (uma) e os cromossomos do tomate, Arabidopsis e arroz (b) Os locais alvo para SpCas9 (PAM NGG) e MaTiD (PAM GTH) foram contados usando Cas-OFFinder e um script Perl interno. c Superior As sequências fora do alvo de SlIAA9 Sequência alvo GTC_gRNA1 (+). Os caracteres vermelhos não combinaram com os nucleotídeos. Caixas verdes PAM. Eficiências de mutação mais baixas nos produtos de PCR clonados de locais fora do alvo dos brotos T0 transgênicos de Ailsa Craig (SlIAA9-tid_gRNA1 (+) AC T0s_ # 1, 2 e 4) e tipo selvagem (WT) foram calculados a partir das contagens de leitura no sequenciamento de amplicon profundo por Mi-seq. d Sequências superiores fora do alvo de SlRIN GTC_4003–4238 (+) sequência de destino. Os caracteres vermelhos não combinam com os nucleotídeos. Caixas verdes PAM. PCR de longo alcance inferior (3 kbp + 3 kbp) em locais fora do alvo em brotos T0 transgênicos de Micro-Tom (SlRIN-tid_ GTC_4003–4238 (+) MT T0s_ # 1–12), tipo selvagem (WT) e plantas de controle de vetor (VC).

Embora as sequências alvo de gRNA usadas neste estudo, SlIAA9 GTC_gRNA1 (+), SlIAA9 GTT + GTT_gRNA5 - (-) (+), e SlRIN GTC_4003-4238 (+), não têm sequências altamente semelhantes e têm menos incompatibilidades no genoma do tomate, avaliamos a seguir as mutações fora do alvo na geração T0 de tomateiros exibindo SlIAA9-fenótipos de nocaute de gene Três potenciais locais fora do alvo para SlIAA9 GTC_gRNA1 (+) com 9-11 incompatibilidades, dois potenciais sites fora do alvo para SlIAA9 GTT + GTT_gRNA5-(–)(+) with 11 mismatches, and two potential off-target sites for SlRIN GTC_4003–4238(+) with 6 and 7 mismatches, respectively, which are the sites with lowest mismatches for each on-target, were selected and further analyzed (Fig. 5c, d, Supplementary Table 5, Supplementary Figs. 5, 6). MiSeq analysis of PCR products around the potential off-target sites for SlIAA9 GTC_gRNA1(+) showed that there was little-to-no off-target mutation in the T0 generation of tomato plants (Fig. 5c). Long-range nested PCR of the potential off-targets for SlIAA9 GTC_gRNA1(+) and SlIAA9 GTT + GTT_gRNA5-(–)(+) was also performed using specific primers located around 5–8 kbp upstream and downstream of the target sequence, and the results suggested there were no obvious effects (Supplementary Fig. 5a, b). Also, the off-target effects of long-range deletion mutations were evaluated for SlRIN GTC_4003–4238(+) in the T0 transgenic plants using specific primers located around 3 kbp upstream and downstream of the target sequence, respectively. As before, no off-target mutations were found in the T0 generation of tomato plants (Fig. 5d, Supplementary Fig. 6). The Cel-1 assay to evaluate small indels also showed no digested bands in the SlIAA9 GTT + GTT_gRNA5-(–)(+) and SlRIN GTC_4003–4238(+) lines, indicating no mutations in these off-target sites (Supplementary Fig. 5c). Together with a comprehensive analysis of many other on-targets for TiD, further work in vivo to evaluate off-target effects for fewer mismatches will be required in order to precisely elucidate the mechanisms of the TiD system when used in conjuction with the advanced unbiased technologies, i.e. CIRCLE-seq 20 and DISCOVER-seq 21 .

Conclusões

Although there are eight subtypes of CRISPR type I families identified from bacteria and archaea 2 , type I-D CRISPR-Cas, namely TiD, remains less well characterized. We showed that the CRISPR/Cas TiD locus from M. aeruginosa strain PCC9808 consists of eight Cas genes (Cas1d–Cas7d, Cas10d) followed by an array of 36 repeat-spacer units. In the TiD system, the HD domain, a functional DNA cleavage domain that has been identified in CRISPR type I-A, B, C, E, and F 7,22,23,24,25,26 , is lacking in Cas3d. Instead of the active Cas3 nuclease, TiD has Cas10d, which has an HD-like nuclease domain in the N-terminal region 1 . Interestingly, the Cas10d in TiD was highly divergent compared with Cas10s in the type III CRISPR-Cas family instead, the Cas10d HD domain was similar to the Cas3 HD domains of type I- B, C, E, and F 1 . In the present study, we first developed a CRISPR TiD system as a genome editing tool for site-directed mutagenesis yielding both short indels and long-range deletion mutations in plant cells. Notably, the desired phenotypes in TiD transgenic mutated tomato were identified. Plant genomes, especially those of crop plants, have complex genome gene structures, with highly duplicated and redundant functional genes, as well as clusters of miRNA and non-coding RNA regions. The specific features of CRISPR type I-D CRISPR, which produces diverse and long-range deletion in genomic regions of interest, could be an effective genome editing tool kit with which to remove complex genome gene structures with low off-target effects. In this study, we used two types of TiD vectors, both of which induced mutations at their respective targets in the tomato genome. Further improvement of the TiD vector will still be important in developing this efficient tool. The unique TiD-induced mutation patterns suggest that the specific DNA cleavage mechanism and subsequent DNA repair pathway may differ from those of other genome editing tools. The diverse range of large deletions that can be generated from a single target site by TiD would enable long-range chromosome engineering thus allowing expansion of the types of plant genome engineering that are possible using novel technologies in the CRISPR-Cas system.


Materiais e métodos

Primary human CD4 + T cell isolation and activation

Blood from healthy donors was obtained from the Swiss Blood Donation Center of Basel and Lugano (Switzerland), with informed consent from the Swiss Red Cross and authorization number CE 3428 from the Comitato Etico Canton Ticino. Peripheral blood mononuclear cell (PBMCs) were separated by gradient centrifugation (Ficoll-Paque Plus GE Healthcare). CD4 + T helper lymphocytes were then enriched from PBMCs by positive selection using magnetic microbeads (Miltenyi Biotec), following manufacturer’s instructions. Memory CD4 + T cells were further separated by cell sorting using a FACSaria (BD Bioscience), based on the expression of surface markers as follows: CD4 + CD25 – CD45RA – CCR7 +/– . For T lymphocyte activation, cells were stimulated for 48 h with plate-bound anti-CD3 (clone TR66, recombinant, made in-house) and anti-CD28 (1 μg, BD Bioscience) antibodies, using NUNC 96-well plates (ThermoFisher), and then re-plated and expanded as needed. T cell culture medium was RPMI-1640 supplemented with 5% human serum, 1% non-essential amino acids, 1%, sodium pyruvate, 1% glutamine and 50 μM β-mercaptoethanol, 1% penicillin and streptomycin (complete medium).

Considerations for gRNA design and controls

Many online tools are available for the design of gRNAs that achieve high on-target efficiency with relatively low off-target effects [12–14]. We found that the use of more than one gRNA per gene locus can lead to high efficiency of deletion without increasing cell death. However, high editing efficiency depends primarily on the quality of the gRNA, and one single high-quality gRNA can also be as effective. The ideal experimental setup will therefore depend on the specific gene to be deleted and on the quality of the gRNAs. Furthermore, the gene structure should also be taken into account, for instance by avoiding exon-intron boundaries (which may lead to the excision of the intervening intron without significantly affecting protein expression), or alternative splice junctions. In this study, oligonucleotides specific for the gene of interest were designed using a gRNA design online tool (Dharmacon, IDT). These RNA oligonucleotides contain a 20 nt target-specific sequence with a protospacer and a 16 nt sequence complementary to an ATTO-550-labelled tracrRNA (Dharmacon, IDT). Sequences were then manually screened based on their on-target and off-target score (which should be ideally both >70) and their position in the gene body, to give preference to the first exons. Negative controls for this experimental design include mock transfected cells (electroporated without any reagent) or with Cas9 protein only, or transfected using a non-targeting scrambled gRNA or gRNAs against a gene different from the one under consideration and not associated with the phenotype to be observed.

Transfection with fluorescent oligonucleotides and CRISPR-Cas9 ribonucleoproteins

For transfection optimization, about 7x10 5 primary memory T cells were transfected with NEON nucleofector (Invitrogen) at different voltages, pulses and widths, using the provided buffer T. A fluorescent siGLO oligonucleotide was used at the concentration of 1–2 μM. For the transfection of CRISPR-Cas9 ribonucleoproteins (RNPs), the selected oligonucleotides (Dharmacon, IDT) were mixed with the fluorescently labelled tracrRNA at a final concentration of 80 μM in 10 μl of nuclease-free duplex buffer (Dharmacon, IDT), followed by annealing by boiling and cool-down, to form the functional gRNA recognized by Streptococcus pyogenes Cas9. The annealed gRNA can be aliquoted and stored at -80°C for subsequent use. The RNP complex was instead prepared freshly immediately before transfection by mixing 7.5 μg of recombinant TrueCut Cas9 Protein v.2 (ThermoFisher) with 1.5 μl of the annealed gRNA in a total volume of 3 μl followed by incubation for 20 min at

25°C. To improve transfection efficiency, Alt-R electroporation enhancer (Dharmacon, IDT) was added to the mix at a final concentration of 1.7 μM. About 7x10 5 freshly sorted CD4 + T cells were resuspended in Neon electroporation buffer T and electroporated using the 10 μl Neon transfection system kit, with one pulse at 2’200 V, width 20 ms, unless otherwise specified. Transfected cells were incubated 24 h in pre-warmed RPMI-1640 medium supplemented with 5% human serum, 1% non-essential amino acids, 1%, sodium pyruvate, 1% glutamine and 50 μM β-mercaptoethanol (complete medium without antibiotics). Transfection efficiency was determined by measuring the intracellular fluorescence of the ATTO-550-labelled tracrRNA by flow-cytometry 24 h post-transfection, compared to control, mock transfected cells (no RNP). To assess the efficiency of gene targeting at the level of protein or gDNA, T cells were cultured for at least 72 h after transfection. The sequences of the RNA oligonucleotides used for targeting are indicated in Table 1.

Primary CD4 + T lymphocyte single cell cloning

Primary T cells transfected with RNPs targeting the gene of interest were cloned by limiting dilution as described [15]. Briefly, 24 h after transfection, T cells were seeded in complete medium in 384-well plates at a concentration of 0.5 cells/ well and in the presence of recombinant human IL-2 (500 U/ml, made in-house), 1 μg/ml phytohemagglutinin (Remel) and 5x10 5 irradiated (45 Gy) allogeneic feeder cells/ml (PBMCs) as previously described [4, 15]. After 14 days, individual clones were picked and transferred into round-bottom 96-well plates and further expanded in the presence of IL-2.

Analysis of gene deletion efficiency

Genomic DNA from primary human T cells and single T cell clones was isolated using the QIAamp DNA Micro Kit (Qiagen) (1x10 4 to more that 1x10 5 cells can be used, depending on the ability of each individual clone to expand). To screen for the presence of indels/mutations in the genomic region of interest, a T7 endonuclease I cleavage assay was performed as previously described [4], using PCR primers flanking the targeted gDNA region, and generating a PCR amplicon of

1000 bp (“long” PCR). Briefly, the PCR reaction was performed using the high fidelity KOD Hot Start DNA polymerase (Novagen) and 100 ng of gDNA template in 30 μl of total volume. Because the T7 endonuclease I enzyme recognizes and cleaves mismatched heteroduplex DNA, 8.5 μl of PCR product were denatured (95°C, 5 min) after addition of 1 μl of 10x NEB Buffer 2 (New England Biolabs), and re-annealed by gradual cooling to produce potential heteroduplexes of wild-type and mutated DNA strands. Then, 5 units of T7 endonuclease I enzyme (New England Biolabs) were added directly to the annealed PCR product and incubated at 37°C for 15 min. As a control, a parallel reaction was performed without the addition of T7 endonuclease I. The reaction was stopped by adding 1.6 μl of 6x gel loading dye (New England Biolabs) and the resulting products resolved on a 1% agarose gel to display cleavage at heteroduplex mismatch sites. When using two RNPs targeting two different regions of the same gene (thereby leading to a deletion of the intervening sequence in at least a proportion of the cells), an independent confirmation of the presence of deletions could be obtained also by designing primers complementary to the region to be deleted (“short” PCR). Upon efficient deletion of this region, or mutation of the primers’ target sequences, the primers would be therefore incapable of generating any PCR product. PCR primers used for these assays are indicated in Table 1. Specific for the TRAC e B2M genes, efficiency of deletion was also measured by surface staining using anti-human CD3-APC-Cy7 and anti-human β2-microglobulin-APC antibodies (Biolegend).

Quantification of T7 endonuclease I cleavage assay

Images of the agarose gels displaying the results of the T7 endonuclease I cleavage assay were taken using an INgenius3 instrument and loaded in ImageJ [16]. Using the “Gel analysis tool” each gel line was selected and profile plots were generated, which displayed the intensity of pixels within the selected area along a line. Background subtraction was performed by drawing a baseline on the bottom of each density profile peak, excluding the underlying area from the measurement. The area below each peak was measured using the “Wand tool” and values were used to calculate the percentage of cleavage efficiency using the following formula: % gene modification = 100 x (1- (1 –fraction cleaved) 1/2 ), as previously described [17].

Intracellular cytokine staining and measurement of cell death

Memory CD4 + T cells were stimulated for 5 h with PMA (phorbol 12- myristate 13-acetate, 200 nM) and ionomycin (1 μg/ml). For the last 2.5 h of stimulation, brefeldin A (10 μg/ml) was added to the cells. After fixation (paraformaldehyde, 4%) and permeabilization [0.5% BSA and saponin in Dulbecco’s phosphate-buffered saline (DPBS)], the staining was performed with the conjugated antibody anti-IFN-γ-APC/Cy7 (Biolegend) following manufacturer’s instructions. All samples were acquired on a Fortessa Flow Cytometer (BD Bioscience) and data was analyzed with FlowJo Software. To determine the extent of cell survival and cell death, T cells were stained with a live/dead dye (LIVE/DEAD Fixable Aqua Dead Cell Stain Kit Life Technologies).


Materiais e métodos

Target locus selection and sgRNA design

Gene sequences for B. oleracea BolC.GA4.a (Bol038154) and barley HvPm19 (AF218627.1 [15]) were obtained from The Brassica Database [40] and the International Barley Sequencing Consortium [41] databases. For barley, sequence of the BAC clone HVVMRXALLmA0022M08 from the cultivar ‘Morex’ was kindly provided pre-publication by Dr Nils Stein (IPK). This BAC was annotated and four copies of HvPm19 were identified (HvPM19-1 para HvPM19-4) Target sequences that conformed to G(N)20GG were identified on sense and antisense strands in the coding sequence for BolC.GA4.a and for HvPM19-1 e HvPM19-3 and potential off-target sequences were detected via BLAST searches [40, 41]. Potential targets were also evaluated for the presence of non-CpG sensitive restriction site sequences predicted to be disrupted by Cas9 induced in-dels, which also had to be unique within a PCR amplicon. Final target sequences were chosen to be as specific as possible to the intended target sequence (that is, keeping the number of mismatches to off-target sequences high), close to the start codon, and to include an appropriate restriction site (Fig. 1). These targets were checked by PCR and Sanger sequencing (Additional file 3) in the varieties to be transformed (spring barley cultivar ‘Golden Promise’ and Brassica oleracea DH1012) to ensure that no polymorphisms existed between the sgRNA and the target G(N)20GG sequences. Single sgRNAs were used for barley HvPM19-1 e HvPM19-3, whereas two independent sgRNAs were targeted to the first exon of Brassica BolC.GA4.a. Barley ‘Golden Promise’ sequences for the three HvPM19 genes were deposited in GenBank (accession numbers KT336449-KT336451).

Construct assembly

The binary plasmid vector constructs were assembled using Golden Gate Modular Cloning (MoClo) [42]. We used Level 0 parts from the Golden Gate MoClo Plant Parts Kit (Addgene kit # 1000000047) and plasmids from Golden Gate MoClo Plant Toolkit (Addgene kit # 1000000044) described in Engler et al. [43]. Level 1 transcriptional units were assembled from Level 0 parts and these were subsequently assembled to make the plasmids vectors shown in Fig. 2. A detailed protocol for the assembly of binary vectors with multiple sgRNAs using the Golden Gate MoClo ToolKit and the identity of all plasmids used are given in Additional file 4. Annotated sequences of the plasmids made in this study are provided in Additional file 5 and are available at the non-profit plasmid depository AddGene (https://www.addgene.org/browse/article/14759/).

Plant transformation and screening of transgenic material

Barley (cv. ‘Golden Promise’) was transformed by Agrobacterium tumefaciens-mediated transformation of immature embryos as described by Harwood [44]. Brassica oleracea (DH1012) was transformed by Agrobacterium tumefaciens infection of 4-day-old cotyledonary petioles according to Hundleby and Irwin [45].

Primary transgenic T0 materials were screened using a modified restriction enzyme site loss method [46]. Briefly, for single sgRNA targets, genomic DNA was digested prior to PCR with a CpG-insensitive enzyme to remove wild-type template and thus favour the PCR amplification of mutant DNA where the restriction site had been lost. Para Brassica, where a pair of sgRNAs was used, an additional screen was implemented a CpG-insensitive restriction enzyme (AflII) was used prior to PCR to enrich for mutant DNA where the fragment between the two guides had been removed. PCR amplification across the region thus led to shorter PCR products than expected from a wild-type individual.

DNA was extracted according to Edwards et al. [47] from rooted shoots of less than 10 cm in height and quantified using a Nanodrop 8000 (Thermo Scientific). Genomic DNA (100 ng) was digested overnight with 20 units of the appropriate restriction enzyme shown in Fig. 1 (SapI, HaeIII, HphI, AflII (NEB) MaeIII (Roche)) and then purified using a Qiagen QIAquick Gel Extraction Kit (final elution with 25 uL of water). Purified digested DNA (5 μL) was used as PCR template to amplify across the target regions using gene-specific primers (Additional file 3). PCR products were confirmed by agarose gel electrophoresis, purified using the QIAquick Gel Extraction Kit, and Sanger sequenced (Eurofins MWG) to confirm the presence of in-dels. Where the amplicon was too short for direct sequencing, the PCR product was first cloned using the pGEMT-Easy kit (Promega) according to the manufacturer’s instructions and then sequenced with M13 universal primers.

The detection of mutations in T1 e T2 transgenic lines was performed though Sanger sequencing of PCR amplicons produced using genomic DNA template that was not digested prior to PCR (Additional file 3). Sequences were compared to wild type to detect the presence of homozygous in-dels. Chromatograms were also examined to identify overlapping traces in the region surrounding the PAM, indicative of the presence of mutations. The presence of the T-DNA construct was assessed in progenies of active lines by PCR amplification of the nptII CDS in Brassica e hptII CDS in barley (Additional file 3).

Phenotyping of B. oleracea transgenic lines

The 80 primary T0 transgenic lines and corresponding controls were grown in a controlled environment room with 16 h light (high-pressure sodium lamps with an average bench reading of 200 μmol/m 2 /s) at 12 °C and 8 h dark at 12 °C and constant 65–75 % humidity. Plant height was measured at final maturity. Seed pods at developmental stage 17 [48] were collected from dwarf line L2F1_A and the wild-type DH1012 control. Pods were fixed for 16 h in FAA solution (3.7 % formaldehyde, 5 % acetic acid, 50 % ethanol) and subsequently dehydrated through an ethanol series consisting of 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, and 100 % ethanol for 30 min each at room temperature. The tissues were cleared with Histoclear (National Diagnostics,) and embedded in paraffin wax. Transverse sections 8 μm thick were cut using an RM 2055 rotary microtome (Leica) and mounted on Polysine™ slides (VWR International).The wax was removed using Histoclear and sections stained using an Alcian Blue/Safranin-O solution (0.05 % Alcian Blue and 0.01 % Safranin-O in 0.1 M acetate buffer (pH5.0)) as described by Østergaard et al. [49]. Sections were examined by light microscopy using a Zeiss Axioplan microscope and images captured using a Leica DFC 320 camera with Leica Application Suite software.

T-DNA copy number and presence/absence determination in transgenic barley

Quantitative real-time PCR was used to determine copy number (T0) and presence/absence (T2) of the T-DNA in transgenic barley and B. oleracea lines. The reaction compared the Cq values of an HptII (Fig. 2a) amplicon to a single-copy barley gene CO2 (Constans-like, AF490469) amplicon and the Cq values of an NptII amplicon to a single-copy B. oleracea gene GL2-like (Bol021421) within a single multiplexed assay (Additional file 3). The reactions used Thermo ABGene Absolute QPCR Rox Mix (Cat number AB1139) with the probes and primers at a final concentration of 200 nM (HptII e NptII) and 100nM (CO2 e GL2) The assay contained 5 μL DNA solution, and was optimised for final DNA concentrations of 1 to 10 ng/μL (5 to 50 ng DNA in the assay). PCRs were carried out in a Bio-Rad CFX96 machine (C1000 Touch). The detectors used were FAM-TAMRA and VIC-TAMRA for barley and HEX-BHQ1 and FAM-BHQ1 for B. oleracea. The PCR cycling conditions were 95 °C for 15 min (enzyme activation), 40 cycles of 95 °C for 15 s, and 60 °C for 60 s. Each sample was analysed twice and for presence/absence determinations, two independent DNA extractions of the T2 transgenic plants were used. Cq values were determined using the accompanying CFX96 software (version 3.1), with Cq determination set to regression mode. Values obtained were used to calculate T-DNA copy number according to published methods [50].


Publisher’s note: A Springer Nature permanece neutra em relação a reivindicações jurisdicionais em mapas publicados e afiliações institucionais.

Supplementary Figure 1 Examination of APOBEC3’s effect on the base substitution frequency of sgRNA and ODNs.

(a) Endogenous expression of APOBEC-AID family members in 293FT and HeLa cells. mRNA levels of APOBEC-AID family members were determined by RT-qPCR and normalized against TATA binding protein (TBP) mRNA levels. (b) Western blots of the whole-cell lysates from wild type 293FT cells (293FT) and 293FT cells stably expressing the C-terminal HA tagged APOBEC3B (A3B) or the catalytically inactive one (A3Bm). Western blots were performed using anti-HA antibody. Alpha tubulin served as loading control. Uncropped blot images are shown in Supplementary Data Set 1. The blots shown are representative of three experiments. (c) Relative APOBEC3B mRNA level in 293FT and A3B cells. APOBEC3B mRNA levels were determined by RT-qPCR and normalized against TATA binding protein (TBP) mRNA levels. (d) Schematic diagram illustrating the procedures to examine the base substitutions in the sgRNAs transfected into cells. (e) Base substitution frequency of each base in the spacer regions of indicated sgRNAs that are either non-transfected or transfected into 293FT or A3B cells. The data were from two independent experiments. (f) Base substitution frequency of each base in ssODNs or dsODNs that are transfected into A3B or A3Bm cells. (g) Comparison of the theoretical base substitution fractions at each dinucleotide calculated from the base content of ssODNs and the experimentally determined ones in 293FT and A3B cells. The base substations on C of CpC or TpC reflected APOBEC3 mutational signatures. Red arrows highlight the same base substitutions as observed in the ODN-cognate genomic regions in Fig. 2. (a, c, f) The means (±s.d.) were from three independent experiments.

Supplementary Figure 2 Amplification of ODN-cognate genomic region derived from HDR.

(a) Schematic diagrams illustrating the procedures to amplify the ODN-cognate genomic region from HDR products. (b), (c) Tag-specific genomic DNA PCR was performed using 3' end phosphorothioate modified primers, which prevent the 3' to 5' exonuclease activity of Hi-Fi DNA polymerases, to amplify the ODN-cognate genomic region from 293FT, A3B and A3Bm cells that are treated as indicated. The gels shown in (b, c) are representative of three experiments. (d), (e) Tag-specific genomic DNA PCR was performed to amplify the ODN-cognate genomic region from primary human T cells that are treated as indicated. The gels shown in (d, e) are representative of two experiments. Uncropped gel images for (b-e) are shown in Supplementary Data Set 1.

Supplementary Figure 3 APOBEC3s expression in primary human T cells.

(a) Expression of endogenous APOBEC3s was up-regulated during primary human T cell activation. mRNA levels of APOBEC3 family in naive (day 0) and activated (day 3, 7 and 10) primary human CD8 + T cells were determined by RT-qPCR and normalized against TATA binding protein (TBP) mRNA levels. ND denotes non-detected. (b) Efficiency of endogenous APOBEC3s knockdown. (c) Schematic diagram illustrating that APOBEC could target both ssODN donor and the complementary genomic ssDNA for cytidine deamination, which finally cause base substitutions on Cs and Gs in genomic DNA. (a, b) The means (±s.d.) were from three independent experiments.

Supplementary Figure 4 APOBEC3 introduces sparse base substitutions in genomic DNA near Cas9 nickase-generated SSBs.

(a) Schematic diagram illustrating the procedures to determine the base substitution and indel mutations induced by Cas9 variant-generated breaks in genomic DNA. (b) Base substitution frequency induced by Cas9 variant-generated breaks in genomic DNA. 293FT cells were either left non-transfected (NT) or co-transfected with indicated sgRNAs and Cas9, D10A, H840A or dCas9. Base substitution frequency of each base in the upstream and downstream 25-bp region of Cas9 cleavage sites was measured by deep sequencing. Red arrow indicates the APOBEC3-featured base substitution. Asterisk indicates a base substitution specifically induced by sgVEGFA-3-Cas9, which however was not up-regulated by APOBEC3B over-expression (data not shown). Other mutations were all background base substitutions that remain largely unchanged in all tested situations (compare Cas9, D10A, H840A, dCas9 and NT with each other). (c) Base substitution frequency induced by sgVEGFA-D10A-generated SSB was up-regulated by A3B overexpression. 293FT, A3B or A3Bm cells were co-transfected with sgVEGFA together with Cas9, D10A, H840A or dCas9, respectively. (b, c) The means (±s.d.) were from three independent experiments.

Supplementary Figure 5 Overexpression of APOBEC3 upregulates the indel formation induced by Cas9 nickase-generated SSB in genomic DNA.

(a), (b) Indel frequencies induced by Cas9 variant-generated breaks in 293FT (a) and HeLa (b) cells. 293FT and HeLa cells were either non-transfected (NT) or co-transfected with indicated sgRNAs together with Cas9, D10A, H840A or dCas9, after which the indel frequencies were determined by deep sequencing. (c) Left: Schematic diagram illustrating that indels induced by Cas9 nickases are more distal to SSB sites, while Cas9 mainly induced indels at DSB site (at the ±3-bp region). Right: Statistical analysis of the fractions of reads containing indels at the ±3-bp region of cleavage site. The data represented are from (a, b) and Fig. 3b. The median, interquartile range (IQR), 1.5 × IQR and outliers are shown. ***: P < 0.001, one-tailed Student’s t-test. (d) Indel frequencies induced by Cas9 variant-generated breaks in 293FT, A3B or A3Bm cells. (e) Indel frequencies at indicated non-relevant genomic loci in A3B cells that are co-transfected with indicated sgRNAs and Cas9, D10A, H840A or dCas9. The data were from two independent experiments. (a, b, d) The means (±s.d.) were from three independent experiments.

Supplementary Figure 6 Examination of base substitution and indel mutations induced by Cas9-variant-generated breaks in episomal shuttle vectors.

(a) Schematic diagram illustrating the procedures to determine the base substitution and indel mutations induced by Cas9 variant-generated breaks in episomal shuttle vectors. (b) Number of colonies containing mutated shuttle vectors that are induced by Cas9 variant-generated breaks. (c) Indel frequencies induced by Cas9 variant-generated breaks in episomal shuttle vectors. The means (±s.d.) were from three independent experiments. (d) Fractions at each base and distribution curves of Cas9 variant-induced indels at the cleavage site upstream and downstream 50-bp region in episomal shuttle vectors.

Supplementary Figure 7 Distributions of indels induced by Cas9 variants.

(a) 293FT indel fraction at each base (indel counts at each base relative to the total indel counts in the cleavage site upstream and downstream 25-bp region, %) and the fitting curves of indel fractions in the same region. The indel fitting curves illustrating indel distribution are presented in Fig. 3c. (b) Left: Fractions at each base and distribution curves of Cas9 or D10A-induced indels in the cleavage site upstream and downstream 25-bp region for A3B cells. Right: statistical analysis of the distances from the cleavage site to curve peaks. The median, interquartile range (IQR) and 1.5 × IQR are shown. ***: P < 0.001, one-tailed Student’s t-test.

Supplementary Figure 8 APOBEC3 binds to genomic ssDNA regions exposed near Cas9 nickase-generated SSBs and induces indel formation.

(a) Indel frequencies induced by Cas9-generated DSB at indicated activation time points in primary human T cells that are pretreated with control siRNA (siCtrl) or siRNA against endogenous APOBECs (siA3(Mix)). (b) Normalized indel frequencies (D10A- or dCas9-induced indel frequencies relative to Cas9-induced ones) at indicated activation time points in primary human T cells. The indel frequencies induced by Cas9 increased during T cell activation (a), suggesting that the sgRNA-Cas9 RNP electroporation efficiency may increase during T cell activation. Therefore, D10A-induced indel frequencies (Fig. 3f) were normalized against Cas9-induced ones to exclude the effect of electroporation efficiency. (c) APOBEC3 knockdown suppressed the indel formation induced by Cas9 nickase-generated SSB in episomal shuttle vector. (d) A3B cells were either non-transfected (NT) or co-transfected with indicated sgRNAs and Cas9, D10A, H840A or dCas9. ChIP-qPCR assays were then performed to detect the binding capacities of histone H3 (using H3 antibody, H3 ab) at indicated genomic loci. The results from the anti-6×His-tag antibody (Ctrl ab) were included as negative controls. The means (±s.d.) were from three independent experiments. (a-c) The data were from two independent experiments.

Supplementary Figure 9 Inhibiting DNA-repair enzymes manifested their effects on indel formation.

(a)-(d) Knockdown or knockout of DNA repair enzymes MRE11, Exo1, UNG, SMUG1 and APE1. The inhibitions were examined by western blots and the knockouts were confirmed by sequencing the genomic loci of indicated gene. (e)-(h) Inhibition of various DNA repair enzymes manifested their effects on the indel formations induced by Cas9 variant-generated breaks. 293FT and the corresponding knockdown (KD) or knockout (KO) cells were co-transfected with indicated sgRNAs and Cas9, BE3, D10A, H840A or dCas9, after which the indel frequencies were determined by deep sequencing. (e-h) The means (±s.d.) were from three independent experiments for sgEMX1. The data were from two independent experiments for sgRNF2. Uncropped blot images for (a-d) are shown in Supplementary Data Set 1. All blots shown are representative of three experiments.

Supplementary Figure 10 Association of sgRNA-H840A RNP complex to single-stranded target DNA strand.

(a), (b) Purified Cas9 and Cas9 nickases showed expected nuclease or nickase activities in oligonucleotides cleavage assay. Double stranded DNA substrates were 5’ labeled in the target (a) or non-target (b) strand. (c), (d) EMSA assay results showed that sgRNA-H840A and sgRNA-dCas9 RNP complex can re-associate to the single-stranded target strand that are generated via resection of non-target strand from the SSB (right panels), while sgRNA-D10A and sgRNA-dCas9 RNP complex cannot re-associate to the single-stranded non-target strand (left panels). (e) Schematic diagram illustrating the hypothesis that different indel frequencies induced by D10A- and H840A-generated SSB result from their different strand preferences. Uncropped gel images for (a-d) are shown in Supplementary Data Set 1. All gels shown are representative of three experiments.


CRISPR gene editing can cause hundreds of unintended mutations

As CRISPR-Cas9 starts to move into clinical trials, a new study published in Métodos da Natureza has found that the gene-editing technology can introduce hundreds of unintended mutations into the genome.

"We feel it's critical that the scientific community consider the potential hazards of all off-target mutations caused by CRISPR, including single nucleotide mutations and mutations in non-coding regions of the genome," says co-author Stephen Tsang, MD, PhD, the Laszlo T. Bito Associate Professor of Ophthalmology and associate professor of pathology and cell biology at Columbia University Medical Center, and in Columbia's Institute of Genomic Medicine and the Institute of Human Nutrition.

CRISPR-Cas9 editing technology -- by virtue of its speed and unprecedented precision -- has been a boon for scientists trying to understand the role of genes in disease. The technique has also raised hope for more powerful gene therapies that can delete or repair flawed genes, not just add new genes.

The first clinical trial to deploy CRISPR is now underway in China, and a U.S. trial is slated to start next year. But even though CRISPR can precisely target specific stretches of DNA, it sometimes hits other parts of the genome. Most studies that search for these off-target mutations use computer algorithms to identify areas most likely to be affected and then examine those areas for deletions and insertions.

"These predictive algorithms seem to do a good job when CRISPR is performed in cells or tissues in a dish, but whole genome sequencing has not been employed to look for all off-target effects in living animals," says co-author Alexander Bassuk, MD, PhD, professor of pediatrics at the University of Iowa.

In the new study, the researchers sequenced the entire genome of mice that had undergone CRISPR gene editing in the team's previous study and looked for all mutations, including those that only altered a single nucleotide.

The researchers determined that CRISPR had successfully corrected a gene that causes blindness, but Kellie Schaefer, a PhD student in the lab of Vinit Mahajan, MD, PhD, associate professor of ophthalmology at Stanford University, and co-author of the study, found that the genomes of two independent gene therapy recipients had sustained more than 1,500 single-nucleotide mutations and more than 100 larger deletions and insertions. None of these DNA mutations were predicted by computer algorithms that are widely used by researchers to look for off-target effects.

"Researchers who aren't using whole genome sequencing to find off-target effects may be missing potentially important mutations," Dr. Tsang says. "Even a single nucleotide change can have a huge impact."

Dr. Bassuk says the researchers didn't notice anything obviously wrong with their animals. "We're still upbeat about CRISPR," says Dr. Mahajan. "We're physicians, and we know that every new therapy has some potential side effects -- but we need to be aware of what they are."

Researchers are currently working to improve the components of the CRISPR system -- its gene-cutting enzyme and the RNA that guides the enzyme to the right gene -- to increase the efficiency of editing.

"We hope our findings will encourage others to use whole-genome sequencing as a method to determine all the off-target effects of their CRISPR techniques and study different versions for the safest, most accurate editing," Dr. Tsang says.


Affordable CRISPR app reveals unintended mutations at site of CRISPR gene repair

CRISPR-associated protein Cas9 (white) from Staphylococcus aureus based on Protein Database ID 5AXW. Credit: Thomas Splettstoesser (Wikipedia, CC BY-SA 4.0)

Scientists have developed an affordable, downloadable app that scans for potential unintended mistakes when CRISPR is used to repair mutations that cause disease. The app reveals potentially risky DNA alterations that could impede efforts to safely use CRISPR to correct mutations in conditions like sickle cell disease and cystic fibrosis. The development of the new tool, called DECODR (which stands for Deconvolution of Complex DNA Repair), was reported today in The CRISPR Journal by researchers from ChristianaCare's Gene Editing Institute.

"Our research has shown that when CRISPR is used to repair a gene, it also can introduce a variety of subtle changes to DNA near the site of the repair," said Eric Kmiec, Ph.D., director of ChristianaCare's Gene Editing Institute and the principal author of the study. "We developed DECODR to accelerate the development of CRISPR gene therapies by providing a way to rapidly detect these changes so we can determine whether they pose a risk to patients."

He said that such changes may be harmless, but researchers must determine whether the changes can disrupt the repair itself or alter gene function in a way that could potentially harm patients. He said an easy-to-use tool like DECODR also will be valuable for assessing whether CRISPR gene repairs produce different outcomes from patient to patient that affect safety and efficacy.

"Like many medical interventions, CRISPR gene therapies are likely to come with a mix of risks and benefits," he said. "More information is needed to ensure patients can make an informed decision."

Intern's inspiration leads to potentially industry-changing new tool

The development of DECODR began in 2019 when a young intern at the Gene Editing Institute with a talent for software development offered to help researchers develop an app for analyzing the huge volumes of DNA data produced by a single CRISPR edit. Rohan Kanchana said he was intrigued by the fact that the best way to screen large populations of cells, a process known as "targeted deep sequencing," was too costly and time consuming to be practical for most labs. Meanwhile, his mentorsnoted that available alternatives to deep sequencing did not detect the full range of DNA mutations that may be introduced by a CRISPR gene repair.

The study in The CRISPR Journal presents evidence that the DECODR app, which was written with open-source software to allow for easy updating, can essentially produce the same data as a deep sequencing process in much less time and at a fraction of the cost. The study reports that DECODR can accurately determine a wide range of insertions and deletions of DNA code that may occur during a CRISPR-directed gene repair to better determine how a CRISPR experiment impacts a targeted gene of interest.

"We were particularly interested in developing an algorithm that is capable of crunching a large amount of data to break down or 'deconvolute' the outcome of repairs that involve deleting and inserting long strands of DNA code," said lead author Kevin Bloh, a researcher at the Gene Editing Institute and a Ph.D. candidate in medical and molecular sciences at the University of Delaware. "These are edits where there is a greater risk that unintended mutations introduced by CRISPR could disrupt the targeted gene."

"The beauty of DECODR is that it is designed to be scaled to evaluate insertion and deletions of DNA executed by a CRISPR edit regardless of size," added Byung-Chun Yoo, Ph.D., study author and associate director of the Gene Editing Institute. "This means it can evolve as researchers develop the capacity to attempt more complex repairs."

The challenge of unintended consequences in CRISPR

CRISPR stands for "clustered regularly interspaced short palindromic repeats." It is a defense mechanism found in bacteria that can recognize and slice up the DNA of invading viruses. Scientists have learned how to modify this mechanism so it can be directed to "edit" specific sequences of DNA code, with a focus on repairing DNA mutations that cause deadly diseases.

Dr. Kmiec said DECODR is focused on CRISPR edits that delete a strand of DNA code that is causing a gene to malfunction and insert a new strand of code that corrects the problem—as opposed to edits that are focused on just eliminating or "knocking out" a gene. He noted that even though the repair may target a single gene—such as the malfunctioning gene that causes sickle cell patients to produce abnormal red blood cells—that gene is present in a large number of cells. And he said there is evidence that the process of deleting and inserting DNA code has the potential to introduce subtle mutations near the site of the gene repair, mutations that may vary from cell to cell.

Last year, in a study in the Nature journal Communications Biology, scientists at the Gene Editing Institute found that such unintended changes are more common than previously understood. According to the new study, "it is the unpredictability and diversity of edited outcomes within a population of cells that have raised caution as CRISPR-directed gene editing programs advance toward clinical application."

Kmiec pointed out that both studies are focused on changes introduced by CRISPR around the site of the intended repair, not on the separate concern about the risk of CRISPR causing "off-target" mutations by drifting far afield from the target and making random cuts across the genome.


Informação sobre o autor

Xinyi Zhang, Di Yue, Yinan Wang, Yuexin Zhou and Ying Liu contributed equally to this work.

Afiliações

Biomedical Pioneering Innovation Center, Beijing Advanced Innovation Center for Genomics, Peking-Tsinghua Center for Life Sciences, Peking University Genome Editing Research Center, State Key Laboratory of Protein and Plant Gene Research, School of Life Sciences, Peking University, Beijing, 100871, China

Xinyi Zhang, Di Yue, Yinan Wang, Yuexin Zhou, Ying Liu, Yeting Qiu, Feng Tian, Ying Yu, Zhuo Zhou & Wensheng Wei

Academy for Advanced Interdisciplinary Studies, Peking University, Beijing, 100871, China