Em formação

5.9: Tamanhos do Genoma - Biologia


O genoma de um organismo é o conjunto completo de genes que especificam como seu fenótipo se desenvolverá (sob um determinado conjunto de condições ambientais). Nesse sentido, então, diplóide organismos (como nós) contêm dois genomas, um herdado de nossa mãe e outro de nosso pai. A tabela abaixo apresenta uma seleção de tamanhos de genoma representativos da lista de rápido crescimento de organismos cujos genomas foram sequenciados.

Tabela de tamanhos do genoma (haplóide)
Pares de basesGenesNotas
φX1745,38611vírus de E. coli
Mitocôndria humana16,56937
Nasuia deltocephalinicola112,091137o menor genoma já encontrado em uma bactéria. Esta β-proteobactéria vive em uma relação mutualística dentro de um órgão especial de um inseto (um saltador de folhas) que fornece aminoácidos essenciais.
Vírus Epstein-Barr (EBV)172,28280causa mononucleose
nucleomorfo de Guillardia theta551,264511tudo o que resta do genoma nuclear de uma alga vermelha (um eucarioto) engolfado há muito tempo por outro eucarioto
Mycoplasma genitalium580,073525dois dos menores organismos verdadeiros
Mycoplasma pneumoniae816,394679
Rickettsia prowazekii1,111,523834bactéria que causa tifo epidêmico
Treponema pallidum1,138,0111,039bactéria que causa sífilis
Pelagibacter ubique1,308,7591,354menor genoma já encontrado em um Vida livre organismo (α-proteobacterium marinho)
Helicobacter pylori1,667,8671,589principal causa de úlceras estomacais (não estresse e dieta)
Methanocaldococcus jannaschii1,664,9701,783Esses micróbios unicelulares se parecem com bactérias típicas, mas seus genes são tão diferentes daqueles das bactérias ou dos eucariotos que são classificados em um terceiro reino: Archaea.
Aeropyrum pernix1,669,6951,885
Methanothermobacter thermoautotrophicus1,751,3772,008
Streptococcus pneumoniae2,160,8372,236o pneumococo
Pandoravirus2,473,8702556UMA vírus (de uma ameba) com um genoma maior do que o das bactérias e arqueas acima e quase o mesmo que o de alguns parasitas eucariotos.
Listeria monocytogenes2,944,5282,9262.853 destes codificam proteínas; os demais RNAs
Synechocystis3,573,4704,003uma cianobactéria marinha ("alga verde-azulada")
E. coli K-124,639,2214,3774.290 desses genes codificam proteínas; os demais RNAs
E. coli O157: H75,44 x 1065,416cepa que é patogênica para humanos; tem 1.346 genes não encontrados em E. coli K-12
Schizosaccharomyces pombe12,462,6374,929Levedura de fissão. UMA eucarioto com menos genes do que as três bactérias abaixo.
Agrobacterium tumefaciens4,674,0625,419Vetor útil para fazer plantas transgênicas; compartilha muitos genes com Sinorhizobium meliloti
Pseudomonas aeruginosa6,3 x 1065,570Causa cada vez mais comum de infecções oportunistas em humanos.
Sinorhizobium meliloti6,691,6946,204O simbionte rizóbio da alfafa. O genoma consiste em um cromossomo e 2 grandes plasmídeos.
Saccharomyces cerevisiae12,495,6825,770Levedura de brotamento. Um eucarioto.
Neurospora crassa38,639,76910,082Mais 498 genes de RNA.
Thalassiosira pseudonana34,5 x 10611,242Uma diatomácea. Mais 144 cloroplasto e 40 genes mitocondriais que codificam proteínas
Naegleria gruberi41 x 10615,727Este organismo unicelular de vida livre vive como uma forma amebóide e flagelada. 4.133 de seus genes também são encontrados em outros eucariotos, sugerindo que eles estavam presentes no ancestral comum de todos os eucariotos. A grande variedade de funções codificadas por esses genes também sugere que o ancestral comum de todos os eucariotos era ele mesmo tão complexo quanto muitos dos membros unicelulares atuais.
Drosophila melanogaster122,653,977~17,000a "mosca da fruta"
Caenorhabditis elegans100,258,17121,733
Humanos3,3 x 109~21,000
Tetraodon nigroviridis (um baiacu)3,42 x 10827,918Embora o Tetraodon pareça ter mais genes que codificam proteínas do que nós, ele tem muito menos DNA não codificador, de modo que seu genoma total é cerca de um décimo do nosso.
Mouse2,8 x 109~23,000
Anfíbios109–1011?
Arabidopsis thaliana0,135 x 10927,407uma planta com flores (angiospermas) com um dos menores genomas conhecidos no reino vegetal.
Picea abies19,6 x 10928,354o abeto da Noruega, uma conífera (gimnosperma). Embora tenha apenas cerca de 900 genes a mais do que Arabidopsis, tem 145 vezes mais DNA. A maior parte disso parece ser derivado de transposons.
Psilotum nudum2,5 x 1011?

Apesar de Psilotum nudum (às vezes chamada de "samambaia whisk") é uma planta muito mais simples do que Arabidopsis (não tem folhas, flores ou frutos verdadeiros), tem 3.000 vezes mais DNA. Ninguém sabe por quê, mas 80% ou mais disso é DNA repetitivo sem informação genética. Este também é o caso de alguns anfíbios, que contêm 30 vezes mais DNA do que nós, mas certamente não são 30 vezes mais complexos. A quantidade total de DNA no genoma haplóide é chamada de valor C. A falta de uma relação consistente entre o valor C e a complexidade de um organismo (por exemplo, anfíbios vs. mamíferos) é chamada de paradoxo do valor C.

Nem todos os genes são indispensáveis

Os cientistas do Instituto de Pesquisa Genômica (agora conhecido como Instituto J. Craig Venter) que determinaram o Mycoplasma genitalium Sequência seguiram este trabalho destruindo sistematicamente seus genes (por mutação deles com inserções) para ver quais são essenciais para a vida e quais são dispensáveis. Dos 485 genes que codificam proteínas, eles concluíram que apenas 381 deles são essenciais para a vida. Em outras palavras, a perda de qualquer um dos 381 é letal; a perda de qualquer um dos outros, não. (Isso não quer dizer que todas as necessidades do organismo são 381 - consulte "Um Genoma Mínimo?" Abaixo.)

Usando técnicas semelhantes, três grupos descobriram recentemente que apenas cerca de 10% dos genes no genoma humano (cerca de 2.000 deles) devem estar presentes para que as células humanas cresçam com sucesso em cultura. Esses genes codificam proteínas para funções essenciais como controle do ciclo celular, replicação de DNA, transcrição de DNA e tradução de RNA. As células podem tolerar a perda de qualquer um dos outros ~ 18.000 genes. Assim, o genoma humano parece ter vias redundantes que muitas vezes podem compensar a perda de um único gene, pelo menos para células que crescem em cultura. Provavelmente, outras se revelarão essenciais para o desenvolvimento e funcionamento dos vários tipos de células diferenciadas no corpo intacto.

Um genoma mínimo?

Em março de 2016, os trabalhadores do Instituto J. Craig Venter relataram que criaram uma variedade de micoplasma contendo apenas 473 genes. Este organismo sintético, que cresce vigorosamente em cultura, agora detém o recorde do menor genoma de um organismo de vida livre.


O Projeto Genoma Humano: a grande ciência transforma a biologia e a medicina

O Projeto Genoma Humano transformou a biologia por meio de sua abordagem científica integrada para decifrar uma sequência de genoma humano de referência junto com as sequências completas de organismos-modelo-chave. O projeto exemplifica o poder, a necessidade e o sucesso de grandes esforços integrados e interdisciplinares - os chamados "big science" - direcionados a objetivos principais complexos. Neste artigo, discutimos as maneiras pelas quais esse ambicioso empreendimento levou ao desenvolvimento de novas tecnologias e ferramentas analíticas, e como ele reuniu a experiência de engenheiros, cientistas da computação e matemáticos com biólogos. Estabeleceu uma abordagem aberta para compartilhamento de dados e software de código aberto, tornando os dados resultantes do projeto acessíveis a todos. As sequências do genoma de micróbios, plantas e animais revolucionaram muitos campos da ciência, incluindo microbiologia, virologia, doenças infecciosas e biologia vegetal. Além disso, um conhecimento mais profundo da variação da sequência humana começou a alterar a prática da medicina. O Projeto Genoma Humano inspirou iniciativas subsequentes de aquisição de dados em grande escala, como o Projeto Internacional HapMap, 1000 Genomes e The Cancer Genome Atlas, bem como o recentemente anunciado Projeto Cérebro Humano e o emergente Projeto Proteoma Humano.


Sobre o jornal

Biologia e evolução do genoma (GBE) publica pesquisas originais de ponta na interface entre a biologia evolutiva e a genômica. Os artigos considerados para publicação relatam novas descobertas evolutivas que dizem respeito à diversidade do genoma natural, genômica populacional, estrutura, função, organização e expressão de genomas, genômica comparativa, proteômica e interações genômicas ambientais. Os principais insights evolutivos dos campos da biologia computacional, biologia estrutural, biologia do desenvolvimento e biologia celular também são considerados, assim como os avanços teóricos no campo da evolução do genoma. GBE 'O escopo abrange investigações evolutivas de todo o genoma em todos os níveis taxonômicos e para todas as formas de vida - dentro de populações ou entre domínios. Seus objetivos são aprofundar a compreensão dos genomas em seu contexto evolutivo e ainda mais a compreensão da evolução de uma perspectiva ampla do genoma.

GBE é propriedade da Society for Molecular Biology and Evolution (SMBE). Motivada pelo crescimento contínuo do campo, a SMBE conduziu uma pesquisa de base em 2007 para investigar as necessidades da área em relação a novos veículos de publicação. A pesquisa suscitou uma resposta retumbante de membros da SMBE e de outros cientistas nas áreas de genômica e evolução molecular. As principais conclusões dessa pesquisa foram que o campo queria um jornal apenas online que fosse dedicado especificamente às áreas de evolução do genoma e genômica comparativa e que fosse publicado sob um modelo de acesso aberto. A resposta do SMBE foi lançar GBE a fim de atender a essas necessidades do campo. O encontro SMBE atrai cerca de 800 participantes a cada ano. Como um reflexo do rápido crescimento das tecnologias genômicas, cerca de metade da ciência apresentada em cada reunião da SMBE é sobre genômica. Com a ajuda da experiência evolutiva reunida no SMBE, GBE está posicionado e projetado para definir os mais altos padrões para papéis no campo crescente da genômica evolutiva.


Resultados e discussão

Montagem, avaliação e anotação do genoma

DNA genômico de alta qualidade foi extraído de tecidos musculares dos três Sinocyclocheilus espécies, que foram coletadas nas províncias de Yunnan (Sg e Sr) e Guangxi (Sa) na China (Arquivo adicional 1: Figura S1). Uma série de bibliotecas de sequenciamento (250 bp a 20 kb) foram construídas e aplicadas em uma estratégia de sequenciamento shotgun de genoma completo, e um total de 313,3, 174,0 e 188,2 Gb de dados brutos foram obtidos para os peixes Sg, Sr e Sa, respectivamente (Arquivo adicional 2: Tabela S1). Os tamanhos do genoma montado são de aproximadamente 1,7 Gb (1,75 Gb para Sg, 1,73 Gb para Sr e 1,68 Gb para Sa), e os valores de contig N50 e scaffold N50 calculados são 17-29 Kb e 0,9-1,3 Mb, respectivamente (Fig. 1 Arquivo adicional 2: Tabela S3). A qualidade dos três conjuntos de genoma foi avaliada (Arquivo adicional 2: Tabelas S5 e S9, Arquivo adicional 3: Figuras S6 e S7), e nossa avaliação confirmou que todos eram de alta qualidade e poderiam ser usados ​​para análises comparativas posteriores. Além disso, empregamos um pipeline de anotação padrão para prever conjuntos de genes, resultando em aproximadamente 40.000 genes nos três genomas de peixes (42.109 para Sg, 40.333 para Sr e 40.470 para Sa ver mais detalhes no arquivo adicional 2: Tabela S15 e arquivo adicional 4 : Figura S14), que eram o dobro da maioria das espécies diplóides (Arquivo adicional 4: Figura S13). As análises de distribuição de genes Hox adicionais em três Sinocyclocheilus espécies (arquivo adicional 4: Figura S11) e alinhamento do genoma entre peixe-zebra e Sg (arquivo adicional 4: Figura S10) forneceram mais evidências para apoiar a natureza tetraploide de Sinocyclocheilus.

Relações filogenéticas e tempo de divergência

A colisão entre a Índia e a Ásia no início do Cenozóico pode ter sido o maior evento orogênico de todos os tempos na história da Terra [9]. Não só desencadeou a extraordinária elevação do planalto Qinghai-Tibete [10], mas também influenciou profundamente o clima asiático através da gênese das monções asiáticas [11], o desenvolvimento de padrões de drenagem em grande escala [12] e, especialmente, a especiação e a biodiversidade dos organismos que vivem no planalto e abaixo dele (por exemplo, [9, 13]). Porque Sinocyclocheilus, o gênero de ciprinídeos mais rico em espécies, é endêmico da maciça área cárstica do sudoeste (a parte norte da qual confina com a parte oriental do planalto Qinghai-Tibetano), foi proposto que o desenvolvimento desta diversidade foi correlacionado com o cíclico elevação e aplainamento do planalto Qinghai-Tibete [14, 15]. Ambas as análises filogenéticas de genes ortólogos de cópia única e dos conjuntos de dados de DNA mitocondrial (arquivo adicional 5: Figuras S15 e S16) apoiaram esta correlação, recuperando as mesmas relações para os três Sinocyclocheilus espécies estudadas aqui (Fig. 2a). O cronograma gerado revelou que Sr emergiu primeiro das outras duas espécies em 26,3 Ma e Sg se dividiu de Sa em 17,5 Ma. Esses tempos de divergência são semelhantes aos obtidos para outros eventos de especiação de congêneres inferidos de um estudo mais abrangente da filogenia de Cyprininae [16]. Esses eventos de divisão ocorreram durante as fases inicial e final, respectivamente, da segunda elevação tectônica do Platô Qinghai-Tibet (25-17 Ma), uma época em que as evidências mostram que a região de calcário em que viviam experimentava cársico em grande escala desenvolvimento [17]. A frequente captura e isolamento dos sistemas fluviais subterrâneos junto com o desenvolvimento cársico foram considerados as principais razões para a especiação neste gênero [15], embora o quadro completo permanecerá desconhecido até que mais espécies tenham sido examinadas. A antiga separação revelada aqui pode ser uma das razões para explicar a alta diversidade de espécies dentro de uma área de distribuição relativamente estreita (cerca de 270.000 km 2 [15]) (Arquivo adicional 1: Figura S1).

Análise filogenômica e histórias demográficas dos três Sinocyclocheilus espécies. uma Relações filogenômicas inferidas de 3.181 genes ortólogos dos três Sinocyclocheilus e seis outras espécies de teleósteos (Homo sapiens foi o grupo externo), com os comprimentos dos ramos escalados para tempos de divergência estimados (os números em azul mostram os valores medianos e de intervalo). Os números além do ramo indicavam famílias de genes expandidos (verdes) e contraídos (vermelhos) desde a separação de um ancestral comum mais recente (MRCA). b Histórias demográficas foram reconstruídas usando o modelo coalescente sequencialmente Markoviano par a par (PSMC). O processo de elevação do Platô Qinghai-Tibete desde 3,6 Ma foi obtido de um artigo publicado [11] e outros eventos ambientais significativos, como a temperatura atmosférica da superfície do ar e o volume de gelo da Eurásia nos últimos 3 Ma, foram retirados dos Centros Nacionais para informações ambientais (NCEI http://www.ncdc.noaa.gov/). O intervalo de tempo de três rodadas de elevação intensa (Qingzang, Kunhuang e Movimento Gonghe) é destacado em lilás. Todas as três espécies têm padrões semelhantes de diminuição sob o Movimento Qingzang e Kunhuang, mas uma tendência divergente subsequente sob o Movimento Gonghe

História da população

Uma reconstrução da demografia da população dos três Sinocyclocheilus espécie revelou um início semelhante, mas uma tendência divergente subsequente de 10 4 a 10 7 anos atrás (Fig. 2b). Parece que a demografia da população tem uma correlação maior com a elevação do planalto Qinghai-Tibete do que outros eventos ambientais significativos, como o volume de gelo da Eurásia ou a temperatura do ar na superfície atmosférica. Em um período de tempo relativamente curto (de 3,0 a 0,5 Ma), todas as três espécies sofreram duas rodadas de declínio populacional, que ocorreram após duas fases de elevação intensa na terceira elevação tectônica do Platô Qinghai-Tibete [17, 18]. Essas duas fases de movimentos em Qingzang (3,6-1,7 Ma) e Kunhuang (1,1-0,6 Ma) elevaram o Planalto de uma média de & lt1.000 m até 4.000 m, seguido pela intensificação da monção asiática e aumento da precipitação [18 ], além do desenvolvimento em larga escala das geleiras [17]. Os padrões de declínios populacionais coincidentes nas três espécies são considerados uma resposta de um fundo comum após a intensa elevação do Planalto que pode ter sido desfavorável para eles (embora ainda não esteja claro que tipo de mudanças ambientais contribuíram mais) . No entanto, dois eventos de expansão populacional incomum também foram detectados após esses eventos. Um foi reconhecido em Sr durante o período interglacial (0,5-0,15 Ma), um período durante o qual Sg e Sa mantiveram suas populações baixas, o que sugere a presença de extensos sistemas de água subterrânea na Bacia de Luoping nativa do Sr nesta época. Outro foi observado para Sg de 0,023 Ma quando sua área de distribuição principal, o paleo-lago Dianchi, foi coincidentemente documentado a partir de sedimentos geológicos como sendo cerca de três vezes maior do que atualmente [19]. A expansão da extensão ao longo de novos canais de rio pode acompanhar a elevação do Platô, proporcionando, assim, a alguns peixes a oportunidade de aumentar o tamanho de suas populações, conforme relatado nos peixes esquizotoracinos típicos do Platô Schizopygopsis pylzovi [20] e Gymnocypris chilianensis [21].

Variações das estruturas do olho e respostas genéticas e de expressão relacionadas

Os peixes-caverna freqüentemente apresentam características regressivas, como a degeneração dos olhos, que freqüentemente se desenvolvem normalmente durante a embriogênese, mas subsequentemente param, degeneram ou afundam sob a pele [22]. Nos três adultos Sinocyclocheilus peixes neste estudo, Sg tem olhos de tamanho normal com lentes e estruturas retinais Sr tem olhos pequenos com lentes reduzidas e densidade celular retiniana e Sa perdeu seus globos oculares externos e lentes, e a retina degenerou para se tornar meramente desorganizada e indistinguível camadas celulares (Fig. 3). O publicado recentemente A. mexicanus O genoma identificou muitos genes candidatos específicos em QTL relacionados ao olho e revelou diferenças de expressão em vários estágios de desenvolvimento [6]. Em nosso estudo, analisamos as mudanças genéticas desses genes cristalinos e opsinas existentes e também apresentamos variações no número de cópias entre peixes que vivem em cavernas e na superfície. Nossos dados genômicos comparativos sugeriram que vários genes de opsina, incluindo Lws2 (sensível ao comprimento de onda longo), Rh2-1 e Rh2-2 (sensível ao comprimento de onda médio), foram perdidos em Sinocyclocheilus, e essa Rh2-4 foi perdido no Sa (arquivo adicional 2: Tabela S26). Em condições de pouca luz, a luz de comprimento de onda longo é rapidamente atenuada [23], e parece racional que os genes sensíveis a comprimentos de onda médio e longo foram perdidos especificamente em Sa. Os resultados das análises transcriptômicas de olhos também mostraram níveis de expressão significativamente mais baixos da maioria dos genes de opsina visuais em Sa quando comparados com Sg e Sr (arquivo adicional 2: Tabela S27). O desenvolvimento e a manutenção dos fotorreceptores requerem uma série de fatores de transcrição. Como esperado, nove fatores de transcrição importantes, incluindo Crx, Nrl, Otx2, Otx5, Nr2e3, Ggca1A, Gnat1, Gnat2 e Rorb, foram significativamente regulados para baixo em Sa (arquivo adicional 2: Tabela S27 e arquivo adicional 6: Figura S25). Esses resultados são consistentes com aqueles encontrados para Astyanax cavefishes [24] e para outros Sinocyclocheilus espécie [25, 26], que apóia a hipótese de que a regulação negativa da rodopsina pode desempenhar um papel crítico na degradação dos olhos de peixes-caverna [25, 26].

Comparação das estruturas da retina entre os três Sinocyclocheilus espécies. Fenótipos e seções de olhos manchadas com H & ampE de cima para baixo são aqueles em uma Sg, b Sr e c Sa, respectivamente. GCL, camada de células ganglionares INL, camada nuclear interna IPL, camada plexiforme interna IS, segmento interno ONL, camada nuclear externa OPL, camada plexiforme externa OS, segmento externo RCL, camada celular relict RPE, epitélio pigmentado da retina

Ao rastrear genes cristalinos nos três Sinocyclocheilus genomas, descobrimos que o número de cópias da maioria dos genes eram menores do que os do peixe-zebra diploide (arquivo adicional 2: Tabela S26 e arquivo adicional 6: Figura S28). Os dados transcriptômicos demonstraram ainda que os níveis de expressão da maioria dos genes cristalinos foram mantidos em níveis elevados em Sg, mas não foram expressos em Sa (arquivo adicional 2: Tabela S27). Também observamos que vários genes cristalinos em Sa (como Cryball1, Crygm2d12 e Crygm7) evoluíram para pseudogenes devido a códons de parada prematura existentes (arquivo adicional 2: Tabela S25E). Estudos anteriores em Astyanax descobriram que a expressão de genes cristalinos foi regulada negativamente no desenvolvimento de lentes de peixes cavernas [27], sugerindo que as lentes desempenham um papel crítico na promoção da sobrevivência celular no desenvolvimento dos olhos [28]. Em particular, β- e γ-as cristalinas desempenham um papel fundamental na remodelação e reparação do tecido retinal, e também aumentam fortemente a regeneração dos axônios das células ganglionares da retina [29]. Portanto, a falta, ou regulação negativa, da expressão do gene de cristalina em Sa apóia seu fenótipo de um sistema visual no qual o cristalino e a retina se degeneraram. Curiosamente, também descobrimos que Sa tem duas cópias de Hsp90α1.1 e Hsp90a1.2 (proteína de choque térmico 90α) genes, enquanto Sg e Sr têm apenas um. Enquanto isso, os níveis de expressão de Hsp90α em Sa os olhos eram muito mais elevados do que em Sg e Sr (Arquivo adicional 2: Tabela S27). Estas observações fornecem mais evidências para apoiar um novo papel de Hsp90α na apoptose do cristalino e degeneração ocular de peixes das cavernas [30].

Diferentes mecanismos de albinismo em comparação com Astyanax

A fim de verificar os mecanismos de perda de pigmentação na pele de Sa, comparamos genes relacionados à melanogênese nos três Sinocyclocheilus genomas. No Astyanax, o albinismo de algumas populações de cavernas é causado pelas deleções de Oca2 regiões do exon do gene, que perturba as etapas a montante da via de síntese da melanina [31]. Embora exclusões semelhantes de Oca2 genes não foram encontrados em nenhuma das duas cópias em Sa (arquivo adicional 6: Figura S21), nem foram quaisquer mutações idênticas especificamente presentes em Sa e Astyanax populações de cavernas, algumas outras novas mutações foram identificadas (arquivo adicional 6: Figura S21), e a análise do transcriptoma realizada na pele de Sg, Sr e Sa indicou que a expressão de Oca2 gene em Sa foi o mais baixo (Arquivo adicional 2: Tabela S20). Na via de síntese da melanina, várias enzimas atuam a jusante, como Tyr (tirosinase), uma enzima limitadora da taxa chave, e Tyrp1 (proteína 1 relacionada à tirosinase) [32]. Mais interessante, descobrimos que Tyr tem uma mutação de aminoácido (G420R) em Sa (arquivo adicional 6: Figura S18), que era idêntico ao identificado em pacientes humanos caucasianos (G419R , http://www.ifpcs.org/albinism/oca1mut.html) [33, 34]. Enquanto isso, os níveis de expressão dos genes Sa na via da melanogênese nos transcriptomas da pele foram os mais baixos, especialmente Tyr e Tyrp1, com níveis de expressão significativamente mais baixos em Sa em comparação com Sg (arquivo adicional 2: Tabela S20). Parece que fenótipos semelhantes em Sinocyclocheilus cavefish pode evoluir por diferentes mecanismos de Astyanax. Além disso, descobrimos que a proteína Mpv17 em Sa teve uma deleção na região de sinal em comparação com peixe-zebra, Sg e Sr (arquivo adicional 6: Figura S22), e o nível de expressão de Mpv17 em Sa é o mais baixo (Arquivo adicional 2: Tabela S20). Um estudo anterior mostra que a exclusão em Mpv17 pode causar o tra fenótipo mutante no peixe-zebra e causa uma perda (ou forte redução) de iridóforos ao longo dos estágios larvais e adultos [35]. Este estudo também apontou que iridóforos diferenciados eram necessários para o acúmulo e manutenção de melanóforos durante a formação do padrão de pigmento [35], e um estudo paralelo mostrou que a interação entre iridóforos e outros cromatóforos é crítica na formação de faixas do peixe-zebra [36]. Assim, inferimos que a exclusão de Mpv17 pode causar a perda de iridóforos, o que afetou a formação de melanóforos e, conseqüentemente, desempenhou um papel no albinismo de Sa.

Mutação genética e perda na degeneração de escama

Um estudo anterior indicou que as mutações no receptor da ectodisplasina-A (Edar) o locus de codificação pode levar à perda de escala completa em peixes como o medaka [37]. Por este motivo, duas cópias do Edar gene (denominado como Edar1 e Edar2, respectivamente) nos três Sinocyclocheilus genomas foram identificados e verificados. Curiosamente, uma das proteínas, Edar1, tem deleções no peptídeo sinal e regiões extracelulares parciais em todos os três Sinocyclocheilus espécies, o que pode levar a alterações funcionais ou perda nesta cópia (arquivo adicional 6: Figura S20). Para a outra cópia da proteína, Edar2, apenas Sa tem a região do peptídeo sinal e regiões extracelulares parciais totalmente deletadas quando comparadas com Sg e Sr (arquivo adicional 6: Figura S20). Esta deleção em Sa pode levar a um distúrbio funcional na orientação da transferência da proteína Edar através da membrana, gerando assim menos escamas na superfície da pele de Sa (arquivo adicional 7: Figura S29). Coincidentemente, dois genes importantes, Lamb3 e Col7a, também foram perdidos do genoma Sa, o que pode causar um defeito na ancoragem entre a epiderme e a derme, resultando em atrito e fragilidade da pele [38, 39] na cobertura das escamas.

Possível perda auditiva em Sa

A audição de cavefishes é interessante, mas menos estudada do que as outras funções discutidas acima. Encontramos a exclusão de Mpv17 gene, que mencionamos na seção sobre albinismo, também pode ter alguma influência na audição. Um estudo anterior relatou que Mpv17camundongos deficientes sofreram de degeneração da cóclea e perda da audição neurossensorial aos 2 meses de idade [40]. Outro gene, Ush2a, também mudou em Sa, especialmente dois locais de aminoácidos, R334S [41, 42] e V382A [43] (referido aos sites humanos), o que pode afetar o splicing e o códon de terminação (arquivo adicional 6: Figura S19). Foi provado que a proteína codificada de Ush é encontrado na membrana basal e pode estar relacionado ao desenvolvimento do ouvido interno [44, 45]. Essas mutações em Sa podem causar sua surdez neurossensorial. Não há mudanças semelhantes em Sg e Sr (arquivo adicional 6: Figura S22). Reconstruções da morfologia do otólito sacular usando microtomografia de raios-X síncrotron entre essas três espécies mostram que a superfície ventral deste otólito em Sa é seriamente aberrante, e o grau de corrosão aumentou distintamente na seguinte ordem: Sg & lt Sr & lt Sa (Fig. . 4). Tanto a anatomia da bexiga natatória (Arquivo adicional 7: Figura S30) e o número de neuromastos e escamas do sistema da linha lateral do tronco (Arquivo adicional 7: Figura S31) também indicam que esses órgãos relacionados à audição em Sa têm diferentes graus de fraqueza . Nossos dados juntos indicaram que a espécie Sa restrita a cavernas pode ter audição reduzida, o que pode ser semelhante ao demonstrado em peixes cavernas ambliopsídeos [46]. Além disso, uma comparação da distribuição dos neuromastos na cabeça (Fig. 4) também sugeriu que a resposta à vibração dessas três espécies era Sg & gt Sr & gt Sa, que é diferente do padrão geral em Astyanax [47].

eu As distribuições de neuromastos superficiais na cabeça e II morfologia do otólito sacular no ouvido interno entre os três Sinocyclocheilus espécies. Os neuromastos superficiais após a coloração DASPEI das placas I- (a – c), I- (d – f) e I- (g – i) representam Sg, Sr e Sa, respectivamente. As fotos da esquerda para a direita mostram a vista lateral, vista dorsal e vista ventral. Essas figuras mostram que o número de neuromastos nos peixes adultos diminui na seguinte ordem: Sg & gt Sr & gt Sa. A morfologia dos otólitos saculares foi reconstruída com base na microtomografia de raios-X síncrotron. As placas II- (a – c), II- (d – f) e II- (g – i) representam Sg, Sr e Sa, respectivamente. As fotos da esquerda para a direita mostram a localização dos otólitos saculares na orelha interna, as vistas dorsal e ventral de sua morfologia. A parte ventral do otólito sacular em Sa é gravemente aberrante, com uma fosseta central profunda e expandida, circundada por outro sulco lateral. O grau de aumento da corrosão está na seguinte ordem: Sg & lt Sr & lt Sa. Barra de escala: 1 mm

Diferentes respostas imunológicas a habitats específicos

As atividades imunológicas de Sa podem ser mais baixas do que suas contrapartes epígeas porque provavelmente vive em um ambiente microbiano menos diverso. O fato de Sa ser mais suscetível a doenças em cativeiro pode apoiar essa inferência (dados não publicados). Encontramos relativamente menos cópias de genes imunes em Sa quando comparados com aqueles em Sg e Sr (arquivo adicional 2: Tabela S22). No entanto, um importante grupo imune inato, o Tlr (receptor toll-like) da família de genes, mostrou algum grau de expansão em Sa (arquivo adicional 2: Tabela S23), através da duplicação de Tlr8 e Tlr18 no genoma Sa. Isso sugere que essas três espécies podem ter desenvolvido atividades imunes diferenciais para imunidade inata e imunidade adaptativa de acordo com seus diferentes habitats. Curiosamente, o Sr morador de semi-cavernas tinha substancialmente mais números de cópias de genes imunes do que Sg e Sa (arquivo adicional 2: Tabela S22), o que pode ser resultado de uma adaptação a elementos heterogêneos entre habitats epígeos e hipogênicos, conforme encontrado em os mudskippers anfíbios [48].

Falta de ritmos diurnos

Pesquisas anteriores relataram que alguns peixes-caverna não têm ritmos diurnos quando vivem em escuridão perpétua [49]. Por exemplo, populações de cavernas de A. mexicanus têm um fenótipo de sono reduzido em comparação com seus parentes de superfície [50]. Descobrimos que ambas as duas cópias de Skp1 em Sa tinha deleções na extremidade N-terminal de sua proteína (arquivo adicional 6: Figura S24). Uma vez que Skp1 é um dos componentes do complexo de proteína Skp1-Cul1-Fbxl3 (SCF), e o complexo SCF é mais relevante no mecanismo do relógio de mamíferos [51], as deleções em Skp1 podem levar a alguma disfunção no SCF, o que sugere ritmos de luz mais fracos em Sa. Enquanto isso, a análise transcriptômica do olho demonstrou que os níveis de expressão dos genes da via do ritmo diminuem na ordem Sg & gt Sr & gt Sa (arquivo adicional 2: Tabela S28 e arquivo adicional 6: Figura S26).

Baixa fecundidade em Sa

Embora a baixa fecundidade seja frequentemente considerada normal em espécies de cavernas [4], há pouca evidência empírica, e os diferentes níveis de fecundidade entre as formas de superfície e caverna às vezes parecem ser plásticos de habitat (por exemplo, [52]). Não conhecemos nenhum estudo sobre a fecundidade das cavernas Sinocyclocheilus espécies. Nossa análise da fecundidade absoluta (número de ovos maduros) de Sg e Sa (2.402,9 ± 881,9 em Sg [53] vs. 143 ± 116 em Sa (contagem de quatro espécimes com ovos maduros neste estudo)) indicou que a fecundidade em caverna Sinocyclocheilus espécie é muito menos do que congêneres da superfície. Curiosamente, um gene relacionado, Creb3l4, foi considerado perdido no genoma de Sa. Foi relatado que Creb3l4 pode regular a expressão de genes necessários para a sobrevivência das células germinativas, embora seja insuficiente para interromper a fertilidade normal em camundongos [54].

Aprimoramento do sabor

As papilas gustativas são realçadas em alguns peixes-caverna, como Astyanax [55]. Aplicamos as sequências de genes relacionados ao sabor do peixe-zebra ao BLAST aos três Sinocyclocheilus genomas, e inesperadamente descobriram que um gene receptor de sabor, o Tast1r2-1, foi significativamente expandido (quase quatro vezes) e um importante fator de transcrição, o Prox1 gene, tinha três cópias nessas três espécies em comparação com o peixe-zebra (arquivo adicional 8: Tabela S29). No entanto, se essas expansões fossem correlacionadas ao aprimoramento geral do sabor nas três Sinocyclocheilus espécies (bentônicas e preferenciais em cavernas), ainda precisamos de mais testes. Alguns genes do receptor de sabor, como Tas1r1 e Tas2r200-2, foram duplicados especificamente no genoma Sa (vs. Sg e Sr) (arquivo adicional 8: Tabela S29), o que sugere uma melhoria adicional no sentido do paladar no Sa restrito a cavernas. Um estudo preliminar da distribuição das papilas gustativas dentro das mandíbulas dessas três espécies também indicou que seu número aumenta em uma sequência de Sg & lt Sr & lt Sa (arquivo adicional 7: Figura S32).


Materiais e métodos

Aquisição e sequenciamento de materiais

Amostras de M. quadrilineatus foram coletados em campo em Yale West Campus, West Haven, CT, EUA, em Symphyotrichum lanceolatum (Asteraceae). Os espécimes foram identificados de acordo com Kwon (1988) e com o código de barras do locus mitocondrial Citocromo Oxidase I (seguindo Le Roux e Rubinoff 2009). A fim de confirmar a associação do bacterioma das linhagens bacterianas alvo, a hibridização fluorescente in situ de espécime inteiro foi realizada de acordo com Koga et al. (2009). As sondas fluorescentes foram projetadas da seguinte forma: Bet940 (5′-TTAATCCACATCATCCACCG-3 ′) para as Betaproteobactérias marcadas com modificação da sonda 5 ′ AlexaFlour-555 e Sulc664R (5′-CCMCACATTCCAGMTACTCC-3 ′) para Sulcia, rotulado com uma modificação 5 ′ AlexaFlour-647 (Invitrogen). Resumidamente, as amostras foram dissecadas em EtOH a 70%, fixadas em solução de Carnoy e incubadas em peróxido de hidrogênio alcoólico por 2 semanas. O material foi então enxaguado e armazenado em etanol 100%, reidratado em PBSTx e enxaguado com um tampão de hibridação. Os espécimes foram incubados em uma solução de sonda de hibridização, contendo as oligo-sondas e a contracoloração DAPI. As amostras foram fotografadas com um microscópio de epifluorescência Nikon Eclipse TE2000-U (fig. 2).

Hibridização fluorescente in situ do bacterioma de Macrosteles quadrilineatus (Cicadellidae: Deltocephalinae), alojamento Sulcia muelleri (Bacteroidetes verdes), e Nasuia deltocephalinicola (Betaproteobactérias vermelhas). A fluorescência azul mostra o DNA nuclear do hospedeiro. (uma) Localização do bacterioma ao longo dos segmentos abdominais ântero-laterais. (b) O bacterioma dissecado compreendendo dois tipos distintos de bacteriócitos que albergam Sulcia-ALF e Nasuia-ALF. Barras de escala branca igual a 100 μm (uma) e 50 μm. (b) Observação. —Autofluorescência vermelha das placas torácicas do hospedeiro.

Hibridização fluorescente in situ do bacterioma de Macrosteles quadrilineatus (Cicadellidae: Deltocephalinae), habitação Sulcia muelleri (Bacteroidetes verdes), e Nasuia deltocephalinicola (Betaproteobactérias vermelhas). A fluorescência azul mostra o DNA nuclear do hospedeiro. (uma) Localização do bacterioma ao longo dos segmentos abdominais ântero-laterais. (b) O bacterioma dissecado compreendendo dois tipos distintos de bacteriócitos que albergam Sulcia-ALF e Nasuia-ALF. Barras de escala branca igual a 100 μm (uma) e 50 μm. (b) Observação. —Autofluorescência vermelha das placas torácicas do hospedeiro.

Dez insetos individuais foram agrupados para sequenciamento de DNA genômico (gDNA). O gDNA total foi extraído usando o kit de extração Qiagen DNeasy (Qiagen Corp.) em um volume de 50 μl. O sequenciamento genômico foi feito usando a plataforma MiSeq da Illumina. O gDNA foi cortado em tamanhos de inserção de biblioteca de 500 pb, e a amplificação da biblioteca (oito ciclos de reação em cadeia da polimerase [PCR]) foi realizada com polimerase de alta fidelidade (KAPA Bio HiFi) para reduzir problemas conhecidos de amplificação enviesada em genomas simbiontes ricos em AT ( Aird et al., 2011, Sloan e Moran, 2012a). A biblioteca preparada foi sequenciada usando orientação de extremidade emparelhada em uma pista de 2 × 250 bp. A preparação da biblioteca e o sequenciamento foram feitos no Yale Center for Genome Analysis.

Conjunto

Como as amostras sequenciadas incluem uma mistura metagenômica complexa de hospedeiro e simbiontes bacterianos, implementamos uma abordagem em várias camadas para produzir contigs preliminares do genoma, coletar leituras bacterianas associadas e remontar e melhorar os andaimes (Sloan et al. 2013). Uma montagem de primeira passagem foi feita em 1/16 dos dados lidos (1.937.157 leituras) usando o Velvet v1.2.08 com um comprimento de kmer de 63 (Zerbino e Birney 2008). A montagem do genoma inteiro retornou quase 12.000 contigs maiores que 500 bp, a maioria dos quais com cobertura kmer relativamente baixa. O Velvet rendeu 10 grandes contigs de mais de 10 kb de comprimento, que foram identificados usando pesquisas BlastN no banco de dados NCBI nr. Os três maiores contigs, um em 190 kb e dois em ∼56 kb, foram inequivocamente atribuídos a Sulcia e para Betaproteobactérias, respectivamente (fig suplementar S1, Material suplementar online). Doravante nos referimos a essas linhagens simbiontes como Sulcia-ALF (da Cigarrinha Aster) e Nasuia-ALF.Os grandes contigs restantes representam o DNA nuclear do inseto e o genoma mitocondrial completo.

Para remover leituras derivadas de simbionte do conjunto de leitura total, os dados foram mapeados para os contigs Velvet usando SOAP2 v2.21 (configurações: -m 10 - × 1000 -g 3 -r 2 Li et al. 2009). As leituras de simbionte isoladas foram então remontadas usando MIRA (Chevreux et al. 1999) com tamanho de inserção de extremidade emparelhada definido para 100-600 bp e configurações de qualidade normais. MIRA confirmou o andaime de 190 kb de Sulcia-ALF, mas quebrou Nasuia-ALF sequencia em três grandes contigs: 12, 42 e ∼54 kb. O MIRA também produziu um contig de 5 kb incluindo uma repetição em tandem de 1,1 kb que se juntou às extremidades dos dois maiores contigs, sobrepondo cada extremidade em mais de 450 bp. Os contigs Velvet e Mira foram montados em um andaime de consenso que preencheu as seções mais ambíguas introduzidas pelo Velvet (por exemplo, cordas de Ns). Isso uniu os dois maiores Nasuia-ALF contigs, deixando dois andaimes grandes de ∼102 kb e ∼12 kb de comprimento. Estes foram montados usando PCR e sequenciamento Sanger (iniciadores: 98836F-ACGCCGCCGAGAATAAGTG e 100182R-ATACACAACGCGCCCTTCG). As pontas restantes do NasuiaO andaime -ALF continha uma sobreposição de 400 bp que era ainda suportada por dados de leitura de extremidades emparelhadas que ligavam as duas extremidades.

Para avaliar a qualidade dos andaimes mesclados, para melhorar os conjuntos do genoma e determinar a cobertura geral para os genomas simbiontes, o total de dados lidos foi mapeado para os andaimes simbiontes usando SOAP2. O mapeamento de leitura foi executado iterativamente até convergir em um mapa do genoma de consenso, usando scripts Perl personalizados (Sloan e Moran 2012a). Isso corrigiu indels e substituições de pares de bases nas montagens iniciais. Para verificar a cobertura completa dos genomas bacterianos circulares, os andaimes foram quebrados, reorientados e as leituras foram remapeadas para confirmar o fechamento. Sulcia-A cobertura de leitura ALF era relativamente uniforme, enquanto Nasuia-O mapeamento de ALF revelou um pico de cobertura de aproximadamente 3 vezes, começando na posição do nucleotídeo 55.964 e apoiando a região de repetição potencial montada por Mira. A repetição de 1,1 kb é muito grande para verificar com as leituras de 250 bp, então a amplificação por PCR e o sequenciamento Sanger da região foram usados ​​para confirmar os limites onde a montagem inicialmente quebrou (primers: 55201F-ATTCGCCTCATCCCCTCTCG + 56233R-AGCCATAACCTTTTGCGTCGT) e para confirmar o existência da repetição interna com primers inversos (primers: 56954F-AAATTAAGAGAGCTAGG + 56087R-TTTAACATCTATCGCTTG). O número de cópias de repetições genômicas é difícil de verificar e provavelmente varia dentro de insetos hospedeiros e entre os simbiontes que são poliploides (ver Woyke et al. 2010), como foi mostrado em Portiera, o endossimbionte de moscas brancas (Sloan e Moran 2013). Assim, o genoma relatado inclui uma única cópia do motivo de repetição sinalizado com uma anotação de repetição.

Para determinar se outros simbiontes estão presentes nas amostras, e para procurar por potencialmente não integrados Sulcia-ALF e NasuiaSequências -ALF, contigs Velvet com mais de 500 bp foram identificados usando pesquisas Blastx traduzidas contra o banco de dados NCBI nr e taxonomicamente categorizado com MEGAN4 (Huson et al. 2011). A grande maioria das leituras foram colocadas em grupos de insetos ou não podiam ser atribuídas; elas provavelmente representam regiões genômicas de insetos com alto número de cópias. Vinte e quatro contigs (500-700 bp de comprimento) eram correspondências próximas às regiões do genoma de Arsenophonus nasoniae (Gammaproteobacteria). Arsenophonus é um agrupamento de simbiontes bacterianos presentes em muitos grupos de insetos e em algumas plantas (Nováková et al. 2009). Dados os contigs genômicos extremamente fragmentados para Arsenophonus e sua baixa cobertura relativa, é improvável que represente um simbionte primário obrigatório de Macrosteles.

Anotação do genoma

As anotações da primeira passagem foram feitas com o RAST e os pipelines IMG ER do Joint Genome Institute (Aziz et al. 2008 Markowitz et al. 2009), usando a tabela geral de tradução bacteriana. Esses pipelines produziram uma anotação relativamente completa Sulcia-ALF sequência do genoma, mas rendeu muitos quadros de leitura curta aberta (ORFs) não identificáveis ​​para Nasuia-ALF. Pesquisas anteriores indicaram que os pequenos genomas de Hodgkinia e Zinderia usar um código genético alternativo que reatribuiu o códon de parada UGA para triptofano (McCutcheon et al. 2009b McCutcheon e Moran 2010). Para ver se este é o caso de Nasuia, Glimmer3 foi usado para prever regiões de codificação com a tabela de tradução modificada 4 (Delcher et al. 2007). O uso da tabela alternativa estendeu muitos genes codificadores de proteínas anteriormente truncados para seus comprimentos esperados, fornecendo fortes evidências de que Nasuia usa uma recodificação UGA Stop → Trp. Muitos genes utilizam códons UGA-Trp em UGG-Trp conservados em outras espécies com o código bacteriano padrão (por exemplo, hisI, rpoB, dnaN, etc. ver também McCutcheon e Moran 2010). Todos os genes inferidos para ambos os simbiontes foram verificados manualmente e selecionados usando pesquisas phmmer e hmmerscan com bancos de dados disponíveis (NCBI nr, TIGRfam, SwissProt e Pfam) em HMMER3 (Finn et al. 2011). Os bancos de dados EcoCyc e KEGG foram usados ​​posteriormente para determinar as vias e funções dos genes (Moriya et al. 2007 Keseler et al. 2011). As regiões codificadoras de RNA foram identificadas usando RNAammer, tRNAscan-SE e pesquisas no banco de dados Rfam (Schattner et al. 2005 Lagesen et al. 2007 Burge et al. 2012). Os genomas foram anotados manualmente com Geneious Pro v5.5.8 (Drummond et al. 2010).

Filogenômica

Para inferir relações filogenéticas de Nasuia-ALF, usamos Phyla_Amphora2, que identifica e alinha marcadores genômicos conservados de um conjunto de genes específicos do filo (Wang e Wu 2013). Ortólogos conservados foram determinados usando varredura de marcador de Amphora com HMMER3 (valor E de corte de 0,01), que gerou um alinhamento de aminoácidos de 42 genes (aproximadamente 10k colunas) para 102 táxons de betaproteobactérias (tabela suplementar S1, Material Suplementar online). O simbionte betaproteobacteriano da cochonilha Planococcus citri, Tremblaya princeps (colocado em Betaproteobacteria: Burkholderiaceae ver Alves et al. 2013), não foi incluído na análise porque muitos de seus genes estavam ausentes e nosso limite de correspondência excluiu quase metade dos genes disponíveis. Quatro grupos externos foram selecionados de Gammaproteobacteria e Alphaproteobacteria, e genes homólogos foram extraídos usando pesquisas de Blastp. Conjuntos de genes individuais foram alinhados usando MAFFT v7.017 com o modelo L-INS-i (Katoh e Standley 2013) e manualmente curados para remover grandes lacunas e regiões ambiguamente alinhadas. Modelos de substituição de probabilidade de aminoácidos foram determinados para cada matriz gênica com ProtTest3 (Darriba et al. 2011). Árvores filogenéticas foram inferidas usando critérios de máxima verossimilhança com RAxML v7.4.4 (Stamatakis 2006). Uma matriz concatenada foi particionada por loci e atribuída a um modelo de aminoácido baseado em GTR específico de gene. As buscas na árvore foram conduzidas para 1000 bootstraps com uma busca final de máxima verossimilhança.


Explorando genomas, podemos desenvolver uma compreensão biológica mais detalhada de nós mesmos. Este curso se concentra na construção de seu conhecimento do genoma, incluindo conceitos de herança genética e como as características são transmitidas de uma geração para a outra.

Você aprenderá o tipo de informação que o genoma fornece e as implicações sociais e filosóficas dos genomas no futuro. É recomendável, mas não obrigatório, que você conclua Por que a biologia é importante: conceitos básicos antes deste curso.

0:13 Pule para 0 minutos e 13 segundos Muitas vezes lemos nos jornais ou revistas informações de base biológica e, infelizmente, não entendemos o suficiente para termos uma opinião crítica. Palavras como determinismo genético, clonagem, manipulação genética, organismos geneticamente modificados (OGM), luta contra a morte, eugenia, seleção artificial, herança da inteligência, evolução do comportamento, medicina personalizada ... estão em nosso meio, mas sua interpretação requer algum conhecimento que podemos não ter.

0:57 Pule para 0 minutos e 57 segundos No primeiro MOOC, «Conceitos básicos» pretendeu-se, com uma linguagem simples e focada, explicar os fundamentos dos principais processos biológicos, considerando também as suas implicações sociais e éticas. Como objetivo geral, pretendemos fornecer a base para uma compreensão biológica dos humanos, a fim de responder a questões que vêm de fora da biologia e para as quais a biologia tem uma resposta. Neste segundo curso «O genoma e você» pretendemos centrar-nos nas questões específicas que o conhecimento que temos sobre o nosso genoma pode dar uma resposta, ou, pelo menos, uma forma de nos conhecermos profundamente. Começamos com os conceitos mais básicos da herança genética e como as características são transmitidas de uma geração para a seguinte.

1:53 Pule para 1 minuto e 53 segundos. Em seguida, fazemos uma visão ampliada do genoma, começando com uma explicação do genoma de um único indivíduo (meu próprio genoma, neste caso) e indo para o genoma da família, na comunidade, na perícia, nas populações e em toda a humanidade tentando entender as informações que o genoma fornece e até as questões que vêm dos bancos de dados que já temos sobre a informação genética de grandes quantidades de indivíduos. A manipulação de genomas e as implicações sociais e filosóficas das informações do genoma fecham o curso.

2:35 Pule para 2 minutos e 35 segundos Você pode estar interessado no curso como simples cidadãos: muitos assuntos humanos têm implicações relacionadas ao nosso genoma e seu conhecimento. Mas também porque muitas disciplinas deveriam levar mais em conta as bases biológicas dos humanos e as implicações que o conhecimento do genoma está proporcionando. Nos propomos a aceitar e compreender que estamos enraizados em nossa biologia, em nosso DNA. Isso permitirá ter uma visão mais profunda de nós mesmos e do mundo ao nosso redor.


Conclusão

Os genomas mitocondriais lineares e plasmídeos são altamente suscetíveis à duplicação e homogeneização de genes subteloméricos. Esses eventos mutacionais são provavelmente o produto da conversão recorrente de genes entre as extremidades dos cromossomos das organelas e parecem ocorrer com mais frequência em DNAs de organelas que abrigam grandes quantidades de diversidade de sítios silenciosos. As descobertas apresentadas aqui são semelhantes às dos estudos sobre a conversão gênica nos subtelômeros de vários genomas nucleares e as repetições invertidas de DNAs de cloroplasto (Goulding 1996) e, em última análise, destacam o poder da conversão gênica na modelagem da arquitetura do genoma da organela.


Resumo de Métodos

Sequenciamento de DNA

Seis A17 BAC e uma biblioteca fosmid foram usados ​​para criar Mt3.5 (Tabela Suplementar 1). A maioria foi processada pelo sequenciamento de extremidade emparelhada Sanger de bibliotecas shotgun de 3-6 kb. As sequências foram baixadas em fevereiro / março de 2009 com andaimes realizados alinhando todas as extremidades BAC e fosmid contra contigs e, em seguida, ancoradas e ordenadas principalmente por mapeamento óptico. Separadamente, 25 bilhões de pares de bases (Gb) da sequência Illumina foram gerados usando inserções curtas (375 nt) mais 2,1 Gb de uma biblioteca de pares de pares de 5 kb, então montados usando CLCbio (http://www.clcbio.com) e Soap (http://soap.genomics.org.cn/).

Sequenciamento de RNA

Cinco tecidos foram usados ​​para análise de RNA-seq com ∼ 10 milhões de leituras Illumina 36-bp por biblioteca (Tabela suplementar 12). Três tecidos foram usados ​​para análise de RNA pequeno com ∼ 3 milhões de leituras por biblioteca Illumina (Figs complementares 17–18, Tabela suplementar 16 e dados suplementares 9).


Tamanhos do genoma

O genoma de um organismo é o conjunto completo de genes que especificam como seu fenótipo se desenvolverá (sob um determinado conjunto de condições ambientais). Nesse sentido, então, diplóide organismos (como nós) contêm dois genomas, um herdado de nossa mãe e outro de nosso pai.

A tabela abaixo apresenta uma seleção de tamanhos de genoma representativos da lista de rápido crescimento de organismos cujos genomas foram sequenciados.

Apesar de Psilotum nudum (às vezes chamada de "samambaia whisk") é uma planta muito mais simples do que Arabidopsis (não tem folhas, flores ou frutos verdadeiros), tem 3.000 vezes mais DNA. Ninguém sabe por quê, mas 80% ou mais disso é DNA repetitivo contendo nenhuma informação genética. Este também é o caso de alguns anfíbios, que contêm 30 vezes mais DNA do que nós, mas certamente não são 30 vezes mais complexos.

A quantidade total de DNA no genoma haplóide é chamada de Valor C. A falta de uma relação consistente entre o valor C e a complexidade de um organismo (por exemplo, anfíbios vs. mamíferos) é chamada de Paradoxo do valor C.

Nem todos os genes são indispensáveis.

Os cientistas do Instituto de Pesquisa Genômica (agora conhecido como Instituto J. Craig Venter) que determinaram o Mycoplasma genitalium Sequência seguiram este trabalho destruindo sistematicamente seus genes (por mutação deles com inserções) para ver quais são essenciais para a vida e quais são dispensáveis. Dos 485 genes que codificam proteínas, eles concluíram que apenas 381 deles são essenciais para a vida. Em outras palavras, a perda de qualquer um dos 381 é letal, a perda de qualquer um dos outros não. (Isso não quer dizer que todas as necessidades do organismo são aquelas 381 & mdash, consulte "Um genoma mínimo?" Abaixo.)

Usando técnicas semelhantes, três grupos descobriram recentemente que apenas cerca de 10% dos genes do genoma humano (

2.000 deles) devem estar presentes para que as células humanas cresçam com sucesso em cultura. Esses genes codificam proteínas para funções essenciais como controle do ciclo celular, replicação de DNA, transcrição de DNA e tradução de RNA. As células podem tolerar a perda de qualquer uma das outras

18.000 genes. Assim, o genoma humano parece ter vias redundantes que muitas vezes podem compensar a perda de um único gene, pelo menos para células que crescem em cultura. Provavelmente, outras se revelarão essenciais para o desenvolvimento e funcionamento dos vários tipos de células diferenciadas no corpo intacto.

Um genoma mínimo?

Em março de 2016, funcionários do Instituto J. Craig Venter relataram que haviam criado uma cepa de micoplasma contendo apenas 473 genes. Este organismo sintético, que cresce vigorosamente em cultura, agora detém o recorde do menor genoma de um organismo de vida livre.


Resultados e discussão

O SDSE 167, portador do antígeno Lancefield do grupo C, foi isolado de um paciente humano infectado de forma invasiva em 2003. Descobrimos que era a cepa de SDSE mais virulenta isolada com um LD50 de 9,6 × 10 5 CFU / camundongo em nossa coleção SDSE com LD50 os valores variam de 9,6 × 10 5 a 4,5 × 10 7 CFU / mouse (tabela suplementar S1, material suplementar online).

O genoma SDSE 167 consiste em um único cromossomo circular de 2.076.397 pb com um conteúdo médio de GC de 39,57% (fig. 1 e tabela 1). O cromossomo mostrou conter um total de 2223 genes que codificam proteínas e 56 genes de tRNA para todos os aminoácidos. Além disso, o cromossomo abriga dois elementos semelhantes a profagos (fig. 1 e tabela 2). Para analisar a relação evolutiva de SDSE 167 com outras cepas de SDSE, os dados do genoma completo das cinco cepas de SDSE listadas na tabela 1, incluindo 167, foram comparados. A análise de cobertura do genoma usando o algoritmo Blast indicou que aproximadamente 90% do genoma é compartilhado entre as cinco cepas de SDSE (tabela suplementar S3, Material Suplementar online). A análise de rearranjo do genoma não mostrou nenhuma evidência de recombinação maciça entre essas cepas de SDSE (fig. 2uma) Algumas regiões que mostram diversidade estão localizadas nas regiões do profago, pois omitir as regiões do profago da análise resultou em rearranjos diminuídos (fig. 2b) A estabilidade relativa de todos os genomas das cepas de SDSE permitiu o alinhamento e a análise da evolução filogenética de SDSE usando sequências de genoma completo. Esta análise filogenética usando BEAST, que é projetada para reconstruir a história evolutiva ao longo do tempo a partir de sequências de DNA amostradas usando uma abordagem pós-probabilística (Drummond e Rambaut 2007), indicou que a distância genética de 167 é relativamente longe das outras, sugerindo que a maioria ancestral comum recente de todas as cinco cepas de SDSE apareceu cerca de 446 anos atrás (fig. 3uma) Essencialmente, os mesmos resultados foram obtidos da análise das sequências do genoma do núcleo, após omitir as regiões do fago (fig. 3b).

Representação circular do genoma de Streptococcus dysgalactiae subsp. equisimilis estirpe 167. Círculo 1 (círculo mais externo) indica as distâncias da origem putativa de replicação. Os círculos 2 e 3 mostram CDS anotado codificado pelas fitas cromossômicas direta (azul claro) e reversa (rosa), respectivamente. O círculo 4 mostra o rrs operons. O círculo 5 mostra profagos (verde). O círculo 6 mostra regiões únicas encontradas em 167 além de fagos, incluindo regiões que codificam enzimas envolvidas na transferência de açúcar e no metabolismo do açúcar e na região FCT. O círculo 7 (círculo mais interno) mostra o conteúdo de G + C com mais e menos que a média (0,40) em roxo e marrom, respectivamente.

Representação circular do genoma de Streptococcus dysgalactiae subsp. equisimilis estirpe 167. Círculo 1 (círculo mais externo) indica as distâncias da origem putativa de replicação. Os círculos 2 e 3 mostram CDS anotado codificado pelas fitas cromossômicas direta (azul claro) e reversa (rosa), respectivamente. O círculo 4 mostra o rrs operons. O círculo 5 mostra profagos (verde). O círculo 6 mostra regiões únicas encontradas em 167 além de fagos, incluindo regiões que codificam enzimas envolvidas na transferência de açúcar e no metabolismo do açúcar e na região FCT. O círculo 7 (círculo mais interno) mostra o conteúdo de G + C com mais e menos que a média (0,40) em roxo e marrom, respectivamente.

Mapas de rearranjo do genoma de S. dysgalactiae subsp. equisimilis 167 com quatro outras cepas SDSE. Os mapas de rearranjo do genoma foram preparados com genomas inteiros (uma) ou depois de omitir as regiões de fago (b) utilizando clonagem molecular in silico. As sequências foram alinhadas a partir da origem de replicação prevista de cada genoma. Vermelho e verde representam a identidade mais alta e mais baixa de sequências de nucleotídeos, respectivamente.

Mapas de rearranjo do genoma de S. dysgalactiae subsp. equisimilis 167 com quatro outras cepas SDSE. Os mapas de rearranjo do genoma foram preparados com genomas inteiros (uma) ou depois de omitir as regiões de fago (b) utilizando clonagem molecular in silico. As sequências foram alinhadas a partir da origem de replicação prevista de cada genoma. Vermelho e verde representam a identidade mais alta e mais baixa de sequências de nucleotídeos, respectivamente.

Árvores filogenéticas bayesianas do SDSE. As árvores filogenéticas foram preparadas com genomas inteiros (uma) ou depois de omitir as regiões de fago (b) usando BEAST (Drummond e Rambaut 2007) e visualizado usando FigTree. As idades estimadas dos subclados são mostradas como valores medianos. Os valores ESS de todos os parâmetros em BEAST são mais de 200. O valor de probabilidade posterior para cada ramo era 1.

Árvores filogenéticas bayesianas do SDSE. As árvores filogenéticas foram preparadas com genomas inteiros (uma) ou depois de omitir as regiões de fago (b) usando BEAST (Drummond e Rambaut 2007) e visualizado usando FigTree. As idades estimadas dos subclados são mostradas como valores medianos. Os valores ESS de todos os parâmetros em BEAST são mais de 200. O valor de probabilidade posterior para cada ramo era 1.

Distribuição de profagos entre cepas de SDSE e genes transportados por cada profago

Tensão . Fago No. Comprimento . Best Hit of Blast. Comente .
167 Φ1 37,972 Estreptodornase (Sdn)
Hidrolase putativa da parede celular, lisina
Holin putativo
Hialuronidase putativa
Protease de maturação de cabeça
Recombase específica do local
Ativador transcricional putativo
Metilase C5 putativa MarMP1
Proteína de ligação de fita simples
Organizador substituto putativo
Φ2 18,822 Defeituoso
AC-2713 Φ1 10,880 subunidade do carregador de grampo gp44 Defeituoso
Φ2 36,966 Recombase específica do local
Hidrolase putativa da parede celular, lisina
Holin
Proteína de ligação a plaquetas putativa
Protease semelhante a ClpP
Proteína portal putativa
Metilase de DNA putativa
Transferase
Helicase putativa
Domínio putativo da DNA polimerase A
Φ3 5,854 DNA citosina metilase Defeituoso
Regulador transcricional
Proteína repressora putativa
Φ4 38,710 Helicase putativa
Recombase específica do local
Hidrolase putativa da parede celular, lisina
Amidase
Holin
PblB
Metilase de DNA putativa
Endonuclease da família HNH com módulo de ligação ao DNA previsto no terminal C
Transferase
Helicase putativa
Proteína semelhante a Phi APSE P51
Domínio putativo da DNA polimerase A
Φ5 14,532 Defeituoso
Φ6 5,920 Csp Defeituoso
Subunidade suposta de DNA polimerase III delta prime
ATCC12394 Φ1 10,872 subunidade do carregador de grampo gp44 Defeituoso
Φ2 11,328 Proteína acessória de DNA polimerase Defeituoso
Φ3 11,990 IMPB Defeituoso
Metiltransferase-endonuclease putativa
Φ4 28,611 Subunidade suposta de DNA polimerase III delta prime
GGS_124 Φ1 10,897 subunidade do carregador de grampo gp44 Defeituoso
Φ2 18,298 Proteína de ligação ao DNA putativa Defeituoso
Metilase de DNA putativa
Φ3 41,484 Estreptodornase
Hidrolase de parede celular Defeituoso
Proteína holin putativa
Hialuronidase putativa
Proteína de ligação a plaquetas putativa
Ligação de plaquetas humanas putativa
Endodeoxirribonuclease putativa
Recombinase putativa
Φ4 10,774 Recombase específica do local Defeituoso
Φ5 35,572 Putativo N-acetilmuramoil-l-alanina amidase
Holin putativo
Endodeoxirribonuclease putativa
Proteína de ligação a plaquetas putativa
Proteína de recombinação
Φ6 19,428 Subunidade suposta de DNA polimerase III delta prime Defeituoso
RE378 Φ1 8,852 Helicase putativa Defeituoso
Tensão . Fago No. Comprimento . Best Hit of Blast. Comente .
167 Φ1 37,972 Estreptodornase (Sdn)
Hidrolase putativa da parede celular, lisina
Holin putativo
Hialuronidase putativa
Protease de maturação de cabeça
Recombase específica do local
Ativador transcricional putativo
Metilase C5 putativa MarMP1
Proteína de ligação de fita simples
Organizador substituto putativo
Φ2 18,822 Defeituoso
AC-2713 Φ1 10,880 subunidade do carregador de grampo gp44 Defeituoso
Φ2 36,966 Recombase específica do local
Hidrolase putativa da parede celular, lisina
Holin
Proteína de ligação a plaquetas putativa
Protease semelhante a ClpP
Proteína portal putativa
Metilase de DNA putativa
Transferase
Helicase putativa
Domínio putativo da DNA polimerase A
Φ3 5,854 DNA citosina metilase Defeituoso
Regulador transcricional
Proteína repressora putativa
Φ4 38,710 Helicase putativa
Recombase específica do local
Hidrolase putativa da parede celular, lisina
Amidase
Holin
PblB
Metilase de DNA putativa
Endonuclease da família HNH com módulo de ligação ao DNA previsto no terminal C
Transferase
Helicase putativa
Proteína semelhante a Phi APSE P51
Domínio putativo da DNA polimerase A
Φ5 14,532 Defeituoso
Φ6 5,920 Csp Defeituoso
Subunidade suposta de DNA polimerase III delta prime
ATCC12394 Φ1 10,872 subunidade do carregador de grampo gp44 Defeituoso
Φ2 11,328 Proteína acessória de DNA polimerase Defeituoso
Φ3 11,990 IMPB Defeituoso
Metiltransferase-endonuclease putativa
Φ4 28,611 Subunidade suposta de DNA polimerase III delta prime
GGS_124 Φ1 10,897 subunidade do carregador de grampo gp44 Defeituoso
Φ2 18,298 Proteína de ligação ao DNA putativa Defeituoso
Metilase de DNA putativa
Φ3 41,484 Estreptodornase
Hidrolase de parede celular Defeituoso
Proteína holin putativa
Hialuronidase putativa
Proteína de ligação a plaquetas putativa
Ligação de plaquetas humanas putativa
Endodeoxirribonuclease putativa
Recombinase putativa
Φ4 10,774 Recombase específica do local Defeituoso
Φ5 35,572 Putativo N-acetilmuramoil-l-alanina amidase
Holin putativo
Endodeoxirribonuclease putativa
Proteína de ligação a plaquetas putativa
Proteína de recombinação
Φ6 19,428 Subunidade suposta de DNA polimerase III delta prime Defeituoso
RE378 Φ1 8,852 Helicase putativa Defeituoso

N ota. — Regiões de Prophage das cepas de SDSE foram identificadas usando Prophage Finder (Bose e Barber 2006). As proteínas codificadas pelo profago foram analisadas pelo algoritmo Blast, com os melhores resultados listados. Apenas os resultados do Blast não categorizados como “proteína hipotética” são listados na tabela.

Distribuição de profagos entre cepas de SDSE e genes transportados por cada profago

Tensão . Fago No. Comprimento . Best Hit of Blast. Comente .
167 Φ1 37,972 Estreptodornase (Sdn)
Hidrolase putativa da parede celular, lisina
Holin putativo
Hialuronidase putativa
Protease de maturação de cabeça
Recombase específica do local
Ativador transcricional putativo
Metilase C5 putativa MarMP1
Proteína de ligação de fita simples
Organizador substituto putativo
Φ2 18,822 Defeituoso
AC-2713 Φ1 10,880 subunidade do carregador de grampo gp44 Defeituoso
Φ2 36,966 Recombase específica do local
Hidrolase putativa da parede celular, lisina
Holin
Proteína de ligação a plaquetas putativa
Protease semelhante a ClpP
Proteína portal putativa
Metilase de DNA putativa
Transferase
Helicase putativa
Domínio putativo da DNA polimerase A
Φ3 5,854 DNA citosina metilase Defeituoso
Regulador transcricional
Proteína repressora putativa
Φ4 38,710 Helicase putativa
Recombase específica do local
Hidrolase putativa da parede celular, lisina
Amidase
Holin
PblB
Metilase de DNA putativa
Endonuclease da família HNH com módulo de ligação ao DNA previsto no terminal C
Transferase
Helicase putativa
Proteína semelhante a Phi APSE P51
Domínio putativo da DNA polimerase A
Φ5 14,532 Defeituoso
Φ6 5,920 Csp Defeituoso
Subunidade suposta de DNA polimerase III delta prime
ATCC12394 Φ1 10,872 subunidade do carregador de grampo gp44 Defeituoso
Φ2 11,328 Proteína acessória de DNA polimerase Defeituoso
Φ3 11,990 IMPB Defeituoso
Metiltransferase-endonuclease putativa
Φ4 28,611 Subunidade suposta de DNA polimerase III delta prime
GGS_124 Φ1 10,897 subunidade do carregador de grampo gp44 Defeituoso
Φ2 18,298 Proteína de ligação ao DNA putativa Defeituoso
Metilase de DNA putativa
Φ3 41,484 Estreptodornase
Hidrolase de parede celular Defeituoso
Proteína holin putativa
Hialuronidase putativa
Proteína de ligação a plaquetas putativa
Ligação de plaquetas humanas putativa
Endodeoxirribonuclease putativa
Recombinase putativa
Φ4 10,774 Recombase específica do local Defeituoso
Φ5 35,572 Putativo N-acetilmuramoil-l-alanina amidase
Holin putativo
Endodeoxirribonuclease putativa
Proteína de ligação a plaquetas putativa
Proteína de recombinação
Φ6 19,428 Subunidade suposta de DNA polimerase III delta prime Defeituoso
RE378 Φ1 8,852 Helicase putativa Defeituoso
Tensão . Fago No. Comprimento . Best Hit of Blast. Comente .
167 Φ1 37,972 Estreptodornase (Sdn)
Hidrolase putativa da parede celular, lisina
Holin putativo
Hialuronidase putativa
Protease de maturação de cabeça
Recombase específica do local
Ativador transcricional putativo
Metilase C5 putativa MarMP1
Proteína de ligação de fita simples
Organizador substituto putativo
Φ2 18,822 Defeituoso
AC-2713 Φ1 10,880 subunidade do carregador de grampo gp44 Defeituoso
Φ2 36,966 Recombase específica do local
Hidrolase putativa da parede celular, lisina
Holin
Proteína de ligação a plaquetas putativa
Protease semelhante a ClpP
Proteína portal putativa
Metilase de DNA putativa
Transferase
Helicase putativa
Domínio putativo da DNA polimerase A
Φ3 5,854 DNA citosina metilase Defeituoso
Regulador transcricional
Proteína repressora putativa
Φ4 38,710 Helicase putativa
Recombase específica do local
Hidrolase putativa da parede celular, lisina
Amidase
Holin
PblB
Metilase de DNA putativa
Endonuclease da família HNH com módulo de ligação ao DNA previsto no terminal C
Transferase
Helicase putativa
Proteína semelhante a Phi APSE P51
Domínio putativo da DNA polimerase A
Φ5 14,532 Defeituoso
Φ6 5,920 Csp Defeituoso
Subunidade suposta de DNA polimerase III delta prime
ATCC12394 Φ1 10,872 subunidade do carregador de grampo gp44 Defeituoso
Φ2 11,328 Proteína acessória de DNA polimerase Defeituoso
Φ3 11,990 IMPB Defeituoso
Metiltransferase-endonuclease putativa
Φ4 28,611 Subunidade suposta de DNA polimerase III delta prime
GGS_124 Φ1 10,897 subunidade do carregador de grampo gp44 Defeituoso
Φ2 18,298 Proteína de ligação ao DNA putativa Defeituoso
Metilase de DNA putativa
Φ3 41,484 Estreptodornase
Hidrolase de parede celular Defeituoso
Proteína holin putativa
Hialuronidase putativa
Proteína putativa de ligação a plaquetas
Ligação de plaquetas humanas putativa
Endodeoxirribonuclease putativa
Recombinase putativa
Φ4 10,774 Recombase específica do local Defeituoso
Φ5 35,572 Putativo N-acetilmuramoil-l-alanina amidase
Holin putativo
Endodeoxirribonuclease putativa
Proteína de ligação a plaquetas putativa
Proteína de recombinação
Φ6 19,428 Subunidade suposta de DNA polimerase III delta prime Defeituoso
RE378 Φ1 8,852 Helicase putativa Defeituoso

N ota. — Regiões de Prophage das cepas SDSE foram identificadas usando Prophage Finder (Bose e Barber 2006). As proteínas codificadas pelo profago foram analisadas pelo algoritmo Blast, com os melhores resultados listados. Apenas os resultados do Blast não categorizados como “proteína hipotética” são listados na tabela.

Comparamos as regiões de profago entre as cepas SDSE (tabela 2). SDSE 167 abriga dois profagos, com um gene que codifica estreptodornase (sdzD), que presumivelmente contribui para o solicitado covRS mutação in vivo responsável pela conversão de GAS em fenótipo mais virulento (Walker et al. 2007) encontrado no profago 1. O sdzD gene foi compartilhado entre os isolados SDSE (tabela suplementar S2, Material Suplementar online). Uma pesquisa de homologia abrangente de profagos encontrada no SDSE mostrou que alguns dos profagos são compartilhados, enquanto os dois profagos em 167 mostraram valores de identidade relativamente baixos, indicando que esses profagos são essencialmente únicos (tabela suplementar S4, Material Suplementar online). Também analisamos os genomas quanto à presença de repetições palindrômicas curtas regularmente intercaladas (CRISPR) e proteínas de sequência associadas a CRISPR (CASs) (Bhaya et al. 2011 Wiedenheft et al. 2012). O CRISPR depende de pequenos RNAs para a detecção e clivagem específicas da sequência de ácidos nucléicos estranhos, incluindo bacteriófagos e plasmídeos. Todas as cepas de SDSE sequenciadas anteriormente abrigam pelo menos um CRISPR provável com mais de 20 espaçadores. Em contraste, o recém-sequenciado 167 não abriga qualquer CRISPR ou CAS provável. Assim, presumivelmente, não há interferência do sistema CRISPR em 167 e o SDSE 167 pode estar sujeito à infecção por fagos. A análise de um número maior de isolados de SDSE do grupo C é necessária para determinar se a ausência de interferência CRISPR é comum a esses isolados (tabela 3).

Distribuição de genes CRISPR e Cas entre as cepas SDSE

Tensão . CRISPR ID. Nº de espaçadores. Cas Genes.
167 tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_2 1 Sem acertos
AC-2713 tmp_1_Probable CRISPR_2 19 Csn1
tmp_1_Probable CRISPR_3 14 Cas3
tmp_1_Possible CRISPR_1 1 Csn1
ATCC12394 tmp_1_Probable CRISPR_2 25 Csn1
tmp_1_Probable CRISPR_3 29 Cas3
tmp_1_Possible CRISPR_1 2 Sem acertos
tmp_1_Possible CRISPR_4 1 Sem acertos
GGS_124 tmp_1_Probable CRISPR_2 18 Csn1
tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_3 1 Sem acertos
RE378 tmp_1_Probable CRISPR_2 7 Csn1
tmp_1_Probable CRISPR_3 13 Cas3
tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_4 1 Sem acertos
Tensão . CRISPR ID. Nº de espaçadores. Cas Genes.
167 tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_2 1 Sem acertos
AC-2713 tmp_1_Probable CRISPR_2 19 Csn1
tmp_1_Probable CRISPR_3 14 Cas3
tmp_1_Possible CRISPR_1 1 Csn1
ATCC12394 tmp_1_Probable CRISPR_2 25 Csn1
tmp_1_Probable CRISPR_3 29 Cas3
tmp_1_Possible CRISPR_1 2 Sem acertos
tmp_1_Possible CRISPR_4 1 Sem acertos
GGS_124 tmp_1_Probable CRISPR_2 18 Csn1
tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_3 1 Sem acertos
RE378 tmp_1_Probable CRISPR_2 7 Csn1
tmp_1_Probable CRISPR_3 13 Cas3
tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_4 1 Sem acertos

N ota. — Os genes CRISPR e Cas entre as cepas SDSE foram identificados usando CRISPRfinder (Grissa et al. 2007). São apresentados os possíveis CRISPR, provável CRISPR, número de espaçadores e tipo de Cas.

Distribuição de genes CRISPR e Cas entre as cepas SDSE

Tensão . CRISPR ID. Nº de espaçadores. Cas Genes.
167 tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_2 1 Sem acertos
AC-2713 tmp_1_Probable CRISPR_2 19 Csn1
tmp_1_Probable CRISPR_3 14 Cas3
tmp_1_Possible CRISPR_1 1 Csn1
ATCC12394 tmp_1_Probable CRISPR_2 25 Csn1
tmp_1_Probable CRISPR_3 29 Cas3
tmp_1_Possible CRISPR_1 2 Sem acertos
tmp_1_Possible CRISPR_4 1 Sem acertos
GGS_124 tmp_1_Probable CRISPR_2 18 Csn1
tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_3 1 Sem acertos
RE378 tmp_1_Probable CRISPR_2 7 Csn1
tmp_1_Probable CRISPR_3 13 Cas3
tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_4 1 Sem acertos
Tensão . CRISPR ID. Nº de espaçadores. Cas Genes.
167 tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_2 1 Sem acertos
AC-2713 tmp_1_Probable CRISPR_2 19 Csn1
tmp_1_Probable CRISPR_3 14 Cas3
tmp_1_Possible CRISPR_1 1 Csn1
ATCC12394 tmp_1_Probable CRISPR_2 25 Csn1
tmp_1_Probable CRISPR_3 29 Cas3
tmp_1_Possible CRISPR_1 2 Sem acertos
tmp_1_Possible CRISPR_4 1 Sem acertos
GGS_124 tmp_1_Probable CRISPR_2 18 Csn1
tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_3 1 Sem acertos
RE378 tmp_1_Probable CRISPR_2 7 Csn1
tmp_1_Probable CRISPR_3 13 Cas3
tmp_1_Possible CRISPR_1 1 Sem acertos
tmp_1_Possible CRISPR_4 1 Sem acertos

N ota. — Os genes CRISPR e Cas entre as cepas SDSE foram identificados usando CRISPRfinder (Grissa et al. 2007). São apresentados os possíveis CRISPR, provável CRISPR, número de espaçadores e tipo de Cas.

A análise de regiões únicas diferentes das regiões de profago no SDSE 167 mostrou que o SDSE 167 abriga dois grupos de genes únicos, que não são encontrados nas outras quatro cepas de SDSE. Um cluster codifica glicosil transferase e proteínas de membrana (tabela 1, locus_tag: SDSE167_0822 a SDSE167_0826). A descoberta de que este cluster está rodeado por outras enzimas modificadoras de carboidratos, como α- (1,2) -ramnosiltransferase e α-L-Rhaalpha-1,3-L-ramnosiltransferase (SDSE167_0813 a 0829). Esta região mostra 65% de identidade com seis genes de Streptococcus mutans (rgpA Através dos rgpF), cuja interrupção resulta em perda de antigenicidade específica do sorotipo, especificada pelas cadeias laterais de glicose do polissacarídeo ramnose-glicose da parede celular (Yamashita et al. 1998), sugerindo que esta região pode estar envolvida na síntese do grupo Lancefield Antígeno C. As análises de blast do cluster, bem como da região correspondente das outras cepas de SDSE, três no grupo Lancefield G e uma no grupo Lancefield A, indicaram que esses clusters mostraram identidade com os das bactérias portadoras dos antígenos do grupo C, G e A, respectivamente ( tabela 1). A análise de PCR usando os primers específicos de regiões mostrou que as regiões correspondentes de cada antígeno de grupo putativo foram transportadas pelos isolados de SDSE (tabela suplementar S1, Material Suplementar online). Embora a análise fenotípica seja necessária para elucidar os papéis funcionais desses agrupamentos, suas sequências podem ser usadas no lugar da sorotipagem para identificar os antígenos do grupo Lancefield.

A outra região única encontrada em SDSE 167 está localizada em SDSE167_0904 a SDSE167_0915. Esta região não apresentou homologia significativa com o genoma de Streptococcus pyogenes exceto para a primeira região de 1 kb, que codifica duas proteínas hipotéticas apenas ao nível do ácido nucleico. A região restante mostra identidade fraca com o sistema PTS, componente IIC específico de galactitol de Enterococcus faecium NRRL B-2354 e ribulose-fosfato 3-epimerase de Streptococcus agalactiae 09mas018883. Esta região contém enzimas de metabolização de açúcar, incluindo tagatose-6-fosfato quinase, açúcar dependente de fosfoenolpiruvato, o sistema de fosfotransferase, a proteína do sistema de fosfotransferase, o sistema PTS específico de galactitol componente IIC, sistema PTS componente específico de galactitol IIC, proteína prevista, classe II aldolase / aducina e alulose-6-fosfato 3-epimerase. Nossos resultados recentes de microarray sugeriram que, após a injeção nas cavidades peritoneais de camundongos, o SDSE degrada os polissacarídeos do tecido do hospedeiro secretando liases de poli / oligossacarídeo, enquanto usa simultaneamente a via Entner-Doudoroff para metabolizar carboidratos adquiridos (Watanabe et al. 2013), e esta região foi encontrado em 167 entre os isolados do SDSE (tabela suplementar S1, Material Suplementar online). Assim, esta região única contendo enzimas metabolizadoras de açúcar pode contribuir para a maior virulência do SDSE 167.

Em conclusão, determinamos, pela primeira vez, a sequência completa do genoma de uma cepa SDSE 167 do grupo C e a comparamos com as sequências do genoma de outras cepas de SDSE. Nossos resultados podem fornecer informações sobre o mecanismo patogênico do SDSE e podem formar a base da pesquisa epidemiológica molecular sobre essas bactérias altamente virulentas.


Assista o vídeo: Estrutura de Genomas (Novembro 2021).