Em formação

6.9: O Genoma Humano - Biologia


homem Vitruviano

O desenho na Figura ( PageIndex {2} ), denominado homem Vitruviano, foi criado por Leonardo da Vinci em 1490. Seu objetivo era mostrar as proporções normais do corpo humano. Vitruviano Cara é usado hoje para representar uma abordagem diferente do corpo humano. Ele simboliza um projeto de pesquisa científica iniciado em 1990, exatamente 500 anos depois de Da Vinci ter criado o desenho. Esse projeto, denominado Projeto Genoma Humano, é o maior projeto de pesquisa biológica colaborativa já realizado.

O que é o genoma humano?

o genoma humano refere-se a todo o DNA da espécie humana. O DNA humano consiste em 3,3 bilhões de pares de bases e é dividido em mais de 20.000 genes em 23 pares de cromossomos. O genoma humano também inclui sequências não codificantes (por exemplo, região intergênica) de DNA, como mostrado na Figura ( PageIndex {2} ).

Descobrindo o Genoma Humano

Os cientistas agora conhecem a sequência de todos os pares de bases do DNA em todo o genoma humano. Este conhecimento foi alcançado pelo Projeto Genoma Humano (HGP), um projeto de pesquisa científica internacional de US $ 3 bilhões que foi formalmente lançado em 1990. O projeto foi concluído em 2003, dois anos antes do prazo previsto de 15 anos.

Determinar a sequência dos bilhões de pares de bases que compõem o DNA humano era o principal objetivo do HGP. Outro objetivo era mapear a localização e determinar a função de todos os genes do genoma humano. Existem apenas cerca de 20.500 genes em seres humanos.

Um Esforço Colaborativo

O financiamento para o HGP veio do Departamento de Energia dos EUA e do National Institutes of Health, bem como de instituições estrangeiras. A pesquisa real foi realizada por cientistas em 20 universidades nos EUA, Reino Unido, Austrália, França, Alemanha, Japão e China. Uma empresa privada dos EUA chamada Celera também contribuiu para o esforço. Embora a Celera esperasse patentear alguns dos genes que descobriu, isso foi posteriormente negado.

Genoma de Referência do Projeto Genoma Humano

Em 2003, o HGP publicou os resultados de seu sequenciamento de DNA como genoma humano de referência. A Figura ( PageIndex {4} ) ilustra o processo de sequenciamento de DNA. Os detalhes desta imagem estão fora do escopo deste conceito e livro. A sequência do DNA humano é armazenada em bancos de dados disponíveis para qualquer pessoa na Internet. O Centro Nacional de Informações sobre Biotecnologia dos EUA (NCBI), parte do NIH, bem como organizações comparáveis ​​na Europa e no Japão, mantém as sequências genômicas em um banco de dados conhecido como Genbank. As sequências de proteínas também são mantidas neste banco de dados. As sequências nesses bancos de dados são sequências combinadas de doadores anônimos e, como tal, ainda não abordam as diferenças individuais que nos tornam únicos. No entanto, a sequência conhecida estabelece a base para identificar as diferenças únicas entre todos nós. A maioria das variações atualmente identificadas entre os indivíduos serão polimorfismos de nucleotídeo único ou SNPs. Um SNP (pronuncia-se "snip") é uma variação da sequência de DNA que ocorre em um único nucleotídeo no genoma. Por exemplo, dois fragmentos de DNA sequenciados de indivíduos diferentes, GGATCTA a GGATTTA, contêm uma diferença em um único nucleotídeo. Se isso ocorrer, a mudança na base de um gene, a mudança na base resultará em dois alelos: o alelo C e o alelo T. Lembre-se de que um alelo é uma forma alternativa de um gene. Quase todos os SNPs comuns têm apenas dois alelos. O efeito desses SNPs na estrutura e função das proteínas e qualquer efeito no fenótipo resultante são um extenso campo de estudo.

Benefícios do Projeto Genoma Humano

O sequenciamento do genoma humano traz benefícios para muitos campos, incluindo medicina molecular e evolução humana.

  • Conhecer a sequência do DNA humano pode nos ajudar a entender muitas doenças humanas. Por exemplo, está ajudando os pesquisadores a identificar mutações ligadas a diferentes formas de câncer. Também está produzindo insights sobre a base genética da fibrose cística, doenças do fígado, distúrbios da coagulação do sangue e doença de Alzheimer, entre outros.
  • A sequência de DNA humano também pode ajudar os pesquisadores a adequar os medicamentos aos genótipos individuais. Isso é chamado de medicina personalizada e levou a um campo inteiramente novo chamado farmacogenômica. Farmacogenômica, também chamada de farmacogenética, é o estudo de como nossos genes afetam a maneira como respondemos aos medicamentos. Você pode ler mais sobre farmacogenômica no recurso abaixo.
  • A análise de semelhanças entre sequências de DNA de diferentes organismos está abrindo novos caminhos no estudo da evolução. Por exemplo, espera-se que as análises esclareçam muitas questões sobre as semelhanças e diferenças entre os humanos e nossos parentes mais próximos, os primatas não humanos.

Questões Éticas, Legais e Sociais do Projeto Genoma Humano

Desde o seu lançamento em 1990, o HGP estabeleceu e financiou proativamente um comitê separado para supervisionar possíveis questões éticas, legais e sociais associadas ao projeto. Uma grande preocupação era a possível utilização do conhecimento gerado pelo projeto para discriminar as pessoas. Um dos problemas era o medo de que empregadores e seguradoras de saúde se recusassem a contratar ou segurar pessoas com base em sua composição genética, por exemplo, se elas tivessem genes que aumentassem o risco de contrair certas doenças. Em resposta, em 1996, os EUA aprovaram a Lei de Responsabilidade e Portabilidade de Seguro Saúde (HIPAA). Ele protege contra a liberação não autorizada e não consensual de informações de saúde individualmente identificáveis ​​para qualquer entidade que não esteja ativamente envolvida na prestação de cuidados de saúde a um paciente. Isso foi seguido em 2008 pela Lei de Não Discriminação de Informações Genéticas (GINA), que proíbe especificamente a discriminação genética por empresas de seguro saúde e locais de trabalho.

Análise

  1. Descreva o genoma humano.
  2. O que é o Projeto Genoma Humano?
  3. Identifique dois objetivos principais do Projeto Genoma Humano.
  4. Qual é o genoma de referência do Projeto Genoma Humano? Em que se baseia?
  5. Explique como o conhecimento da sequência de bases do DNA no genoma humano é benéfico para a medicina molecular.
  6. Qual foi uma descoberta surpreendente do Projeto Genoma Humano?
  7. Por que você acha que os cientistas não sequenciaram apenas o DNA de uma única pessoa para o Projeto Genoma Humano? Nesse sentido, por que você acha que é importante incluir amostras de diferentes grupos étnicos e gêneros nos esforços de sequenciamento do genoma?
  8. Verdadeiro ou falso. O genoma humano sequenciado não inclui regiões não codificantes - inclui apenas genes reais.
  9. Verdadeiro ou falso. Saber a sequência do genoma humano pode nos dar uma ideia da evolução humana.
  10. O que é farmacogenômica?
    1. Se um paciente tivesse que fazer farmacogenômica para otimizar sua medicação, qual você acha que seria o primeiro passo?
    2. Liste uma vantagem e uma desvantagem da farmacogenômica.
  11. Existem aproximadamente 20.000 humanos
    1. pares de bases
    2. nucleotídeos
    3. alelos
    4. genes
  12. Explique como o sequenciamento do genoma humano se relaciona com as preocupações éticas sobre a discriminação genética.

Explore mais

Durante anos, os cientistas tiveram o desafio de sequenciar o genoma humano. Saiba mais sobre o projeto genoma humano aqui:


O Projeto Genoma Humano

O Projeto Genoma Humano (HGP) foi um dos grandes feitos de exploração da história. Em vez de uma exploração externa do planeta ou do cosmos, o HGP foi uma viagem interna de descoberta liderada por uma equipe internacional de pesquisadores que buscavam sequenciar e mapear todos os genes - conhecidos como genoma - de membros de nossa espécie , Homo sapiens. Iniciado em 1º de outubro de 1990 e concluído em abril de 2003, o HGP nos deu a capacidade, pela primeira vez, de ler o projeto genético completo da natureza para a construção de um ser humano.

O Projeto Genoma Humano foi o esforço de pesquisa internacional para determinar a sequência de DNA de todo o genoma humano.

Em 2003, uma sequência precisa e completa do genoma humano foi concluída dois anos antes do previsto e a um custo menor do que o orçamento estimado original.

Momentos-chave e comunicados de imprensa da história do Projeto Genoma Humano.

15 de fevereiro de 2021 marca o aniversário de 20 anos das publicações relatando o rascunho da sequência do genoma humano.

Depoimentos em vídeo de membros proeminentes da comunidade genômica comemorando e celebrando o 30º aniversário do lançamento do Projeto Genoma Humano.

Explore as perguntas e respostas mais frequentes sobre o Projeto Genoma Humano e seu impacto no campo da genômica.


Gráficos do genoma e a evolução da inferência do genoma

O genoma de referência humano é parte da base da biologia humana moderna e uma conquista científica monumental. No entanto, porque exclui uma grande quantidade de variação humana comum, ele introduz um viés de referência generalizado no campo da genômica humana. Para reduzir esse viés, faz sentido recorrer a coleções representativas de genomas humanos, reunidas em coortes de referência. Existem várias técnicas para representar e organizar dados coletados dessas coortes, muitas usando ideias implícita ou explicitamente emprestadas de modelos baseados em gráficos. Aqui, examinamos vários projetos em andamento para construir e aplicar essas estruturas baseadas em gráficos - que coletivamente chamamos de gráficos de genoma - e discutimos as melhorias no mapeamento de leitura, chamada de variantes e determinação de haplótipos que os gráficos de genoma devem produzir.

© 2017 Paten et al. Publicado pela Cold Spring Harbor Laboratory Press.

Figuras

Representação esquemática de dois níveis populacionais ...

Representação esquemática de duas estruturas de referência em nível de população. ( UMA ) Uma coorte de referência, ...

Quatro tipos de gráficos de genoma, ...

Quatro tipos de gráficos de genoma, todos construídos a partir do par de sequências ATCCCCTA ...

Sites Ultrabubble em um ...

Sites ultrabubble em um gráfico de seqüência bied. Cada seta mostra o nó terminal ...

Um pangenome ordenando em um ...

Uma ordenação de pangenome em um gráfico construído a partir de dois genomas. As bordas vermelhas ...

Um exemplo esquemático de um ...

Um exemplo esquemático de um "Gráfico de sequência de matriz" do tipo usado para ...

Uma hierarquia de gráfico de genoma de referência ...

Uma hierarquia de gráfico de genoma de referência (gráfico mais recolhido no principal , menos…

Haplótipos distintos do Projeto 1000 Genomes ...

Haplótipos distintos do Projeto 1000 Genomes incorporados em um subgrafo de variação. Haplótipos são mostrados ...

Gráfico de sequência bidirecional ( UMA…

Gráfico de sequência bidirecional ( UMA ) sendo desdobrado em um gráfico acíclico direcionado ...


Mutações

Os humanos e os chimpanzés se originam de um ancestral comum, e os cientistas acreditam que eles divergiram há cerca de seis milhões de anos.

Dado esse tempo relativamente curto desde a divisão, é provável que algumas mutações importantes sejam responsáveis ​​pelas diferenças entre as duas espécies, de acordo com Wen-Hsiung Li, um evolucionista molecular da Universidade de Chicago em Illinois.

"Se você olhar para duas espécies de sapos com mais de 10 milhões de anos, provavelmente não verá muitas das diferenças morfológicas ou comportamentais que vê entre humanos e chimpanzés", disse Li, que escreveu um comentário sobre o sequenciamento do genoma do chimpanzé para Natureza.

Existem várias hipóteses que explicam a evolução das características humanas. Li acredita que essas características vêm de mudanças nas partes do genoma que regulam a atividade de outros genes.

Os cientistas concordam que muitas perguntas permanecem sem resposta, mas o genoma do chimpanzé fornece pistas importantes para entender o que nos torna humanos.

"Estamos em um ótimo estágio intermediário de compreensão das diferenças entre humanos e chimpanzés", disse Eichler. "Não podemos dizer, esta é a diferença que nos torna humanos, mas podemos dizer, estas são as regiões do genoma que mostram muito potencial e são excelentes candidatas para um trabalho posterior."


Reconhecimentos

Agradecemos à equipe de laboratório do Instituto Max Planck para a Ciência da História Humana em Jena, M. Rivollat ​​e K. Nägele pela preparação da biblioteca genética V. Kuželka, J. Dašková e T. Přikryl pela preparação de informações de base antropológica e geológica e M. O'Reilly pelo suporte ao design gráfico. Este trabalho foi financiado pela Max Planck Society. º. e T.D. são apoiados pelo subsídio ERC 324139 (PalaeoChron) e o Natural Environment Research Council. P.V. é apoiado pelo Ministério da Cultura da República Tcheca (DKRVO 2019-2023 / 7.I.c, 00023272).


Referências

Morton, N. E. Parameters of the human genome. Proc. Natl Acad. Sci. EUA 88, 7474–7476 (1991).

O consórcio de mapeamento e sequenciamento do cromossomo 21. A sequência de DNA do cromossomo humano 21. Natureza 405, 311–319 (2000).

Dunham, I. et al. A sequência de DNA do cromossomo humano 22. Natureza 402, 489–495 (1999).

Tilford, C. A. et al. Um mapa físico do cromossomo Y humano. Natureza 409, 943–945 (2001).

Montgomery, K. T. A mapa de alta resolução do cromossomo 12 humano. Natureza 409, 945–946 (2001).

Bruls, T. et al. Um mapa físico do cromossomo 14 humano. Natureza 409, 947–948 (2001).

Consórcio Internacional de Mapeamento do Genoma Humano. Um mapa físico do genoma humano. Natureza 409, 934–941 (2001).

Consórcio Internacional de Sequenciação do Genoma Humano. Sequenciamento e análise inicial do genoma humano. Natureza 409, 860–921 (2001).

Deloukas, P. et al. Um mapa físico de 30.000 genes humanos. Ciência 282, 744–746 (1998).

Riethman, H. C. et al. Integração de sequências de telômeros com o rascunho da sequência do genoma humano. Natureza 409, 948–951 (2001).

Jackson, M. S., Veja, C. G., Mulligan, L. M. & amp Lauffart, B. F. Um mapa de 9,75 Mb através do centrômero do cromossomo humano 10. Genômica 33, 258–270 (1996).


Novo gene humano reacende debate

Uma das primeiras tentativas de estimar o número de genes no genoma humano envolveu geneticistas embriagados, um bar em Cold Spring Harbor, Nova York, e pura suposição.

Isso foi em 2000, quando um rascunho da sequência do genoma humano ainda estava em andamento, os geneticistas estavam fazendo um sorteio sobre quantos genes os humanos têm, e as apostas variavam de dezenas de milhares a centenas de milhares. Quase duas décadas depois, os cientistas munidos de dados reais ainda não conseguem chegar a um acordo sobre o número - uma lacuna de conhecimento que eles dizem que dificulta os esforços para detectar mutações relacionadas a doenças.

A última tentativa de preencher essa lacuna usa dados de centenas de amostras de tecido humano e foi postada no servidor de pré-impressão BioRxiv em 29 de maio. Inclui quase 5.000 genes que não foram identificados anteriormente - entre eles, cerca de 1.200 que carregam instruções para a produção de proteínas. E a contagem geral de mais de 21.000 genes codificadores de proteínas é um salto substancial em relação às estimativas anteriores, que colocavam o número em cerca de 20.000.

Mas muitos geneticistas ainda não estão convencidos de que todos os genes recém-propostos resistirão a um exame minucioso. Suas críticas ressaltam o quão difícil é identificar novos genes, ou mesmo definir o que é um gene.

“As pessoas têm trabalhado muito nisso há 20 anos e ainda não temos a resposta”, diz Steven Salzberg, biólogo computacional da Universidade Johns Hopkins em Baltimore, Maryland, cuja equipe produziu a última contagem.

Em 2000, com a comunidade genômica agitada sobre a questão de quantos genes humanos seriam encontrados, Ewan Birney lançou o concurso GeneSweep. Birney, agora codiretor do European Bioinformatics Institute (EBI) em Hinxton, Reino Unido, fez as primeiras apostas em um bar durante um encontro anual de genética, e o concurso acabou atraindo mais de 1.000 inscrições e um jackpot de US $ 3.000. As apostas no número de genes variaram de mais de 312.000 a pouco menos de 26.000, com uma média de cerca de 40.000. Hoje em dia, o intervalo de estimativas encolheu - com a maioria agora entre 19.000 e 22.000 - mas ainda há desacordo (veja 'Gene Tally').

Fonte: M. Pertea & amp S. L. Salzberg

A contagem de genes pode variar dependendo dos dados que estão sendo analisados, as ferramentas usadas e os critérios para eliminar falsos positivos. A última contagem usou um conjunto de dados maior e diferentes métodos computacionais de esforços anteriores, bem como critérios mais amplos para definir um gene.

A equipe de Salzberg usou dados do projeto Genotype-Tissue Expression (GTEx), que sequenciou RNA de mais de 30 tecidos diferentes retirados de várias centenas de cadáveres. O RNA é o intermediário entre o DNA e as proteínas. Os pesquisadores queriam identificar genes que codificam uma proteína e aqueles que não, mas ainda desempenham um papel importante nas células. Então, eles montaram 900 bilhões de pequenos fragmentos de RNA da GTEx e os alinharam com o genoma humano.

Só porque um trecho de DNA é expresso como RNA, no entanto, não significa necessariamente que seja um gene. Portanto, a equipe tentou filtrar o ruído usando uma variedade de critérios. Por exemplo, eles compararam seus resultados com genomas de outras espécies, raciocinando que sequências compartilhadas por criaturas distantemente relacionadas foram provavelmente preservadas pela evolução porque servem a um propósito útil e, portanto, provavelmente são genes.

A equipe ficou com 21.306 genes codificadores de proteínas e 21.856 genes não codificantes - muitos mais do que os incluídos nos dois bancos de dados de genes humanos mais amplamente usados. O conjunto de genes GENCODE, mantido pela EBI, inclui 19.901 genes codificadores de proteínas e 15.779 genes não codificadores. RefSeq, um banco de dados administrado pelo Centro Nacional de Informações sobre Biotecnologia (NCBI) dos Estados Unidos, lista 20.203 genes codificadores de proteínas e 17.871 genes não codificantes.

Kim Pruitt, pesquisador do genoma do NCBI em Bethesda, Maryland, e ex-chefe da RefSeq, diz que a diferença provavelmente se deve em parte ao volume de dados que a equipe de Salzberg analisou. E há outra grande diferença. Ambos GENCODE e RefSeq contam com curadoria manual - uma pessoa analisa as evidências de cada gene e faz uma determinação final. O grupo de Salzberg confiava exclusivamente em programas de computador para filtrar os dados.

“Se as pessoas gostarem de nossa lista de genes, talvez daqui a alguns anos seremos o árbitro dos genes humanos”, diz Salzberg.

Mas muitos cientistas dizem que precisam de mais evidências para se convencer de que a lista é precisa. Adam Frankish, um biólogo computacional do EBI que coordena a anotação manual do GENCODE, diz que ele e seu grupo escanearam cerca de 100 genes codificadores de proteínas identificados pela equipe de Salzberg. Pela avaliação deles, apenas um deles parece ser um verdadeiro gene codificador de proteínas.

E a equipe de Pruitt examinou cerca de uma dúzia de novos genes codificadores de proteínas do grupo Salzberg, mas não encontrou nenhum que atendesse aos critérios do RefSeq. Alguns se sobrepõem a regiões do genoma que parecem pertencer a retrovírus que invadiram os genomas de nossos ancestrais, outros pertencem a outros trechos repetitivos, que raramente são traduzidos em proteínas.

Mas Salzberg diz que algumas sequências repetitivas podem ser consideradas genes. Um exemplo é ERV3-1, que aparece em RefSeq e codifica uma proteína que é superexpressada no câncer colorretal. Salzberg também reconhece que os novos genes na lista de sua equipe exigirão validação por sua equipe e por outros.

Outros esforços de contagem confusos são a definição imprecisa e mutável de um gene. Os biólogos costumavam ver os genes como sequências que codificam proteínas, mas então ficou claro que algumas moléculas de RNA não codificantes têm papéis importantes nas células. Julgar quais são importantes - e devem ser considerados genes - é controverso e pode explicar algumas das discrepâncias entre a contagem de Salzberg e outras.

Ainda assim, é provável que pelo menos alguns dos genes identificados pelo grupo de Salzberg venham a ser válidos, diz Emmanouil Dermitzakis, geneticista da Universidade de Genebra, na Suíça, que co-preside o projeto GTEx. Ele não está surpreso que a contagem da equipe para genes codificadores de proteínas seja um aumento de 5% em relação às contagens anteriores, dado o tamanho gigantesco do conjunto de dados GTEx.

Ter uma contagem precisa de todos os genes humanos é importante para os esforços de descobrir as ligações entre os genes e as doenças. Genes não contados costumam ser ignorados, mesmo que contenham uma mutação causadora de doenças, diz Salzberg. Mas adicionar genes às pressas à lista principal também pode representar riscos, diz Frankish. Um gene que acaba sendo incorreto pode desviar a atenção dos geneticistas do problema real.

Ainda assim, as inconsistências no número de genes de banco de dados para banco de dados são problemáticas para os pesquisadores, diz Pruitt. “As pessoas querem uma resposta”, acrescenta ela, “mas a biologia é complexa”.


Dez anos de análise do genoma antigo ensinou aos cientistas 'o que significa ser humano'

O falecido Jim Boyd das Tribos Confederadas de Colville falando na coletiva de imprensa em 2015, anunciando os resultados da análise de DNA do Homem Kennewick, o Ancião. Crédito: Linus Mørk / Magus Film

Uma bola de cabelo de 4.000 anos congelada no tempo e emaranhada em um pente de osso de baleia levou à primeira reconstrução de um antigo genoma humano há pouco mais de uma década.

O cabelo, que foi preservado em permafrost ártico na Groenlândia, foi coletado na década de 1980 e armazenado em um museu na Dinamarca. Não foi até 2010 que o biólogo evolucionista Professor Eske Willerslev foi capaz de usar o sequenciamento de DNA shotgun pioneiro para reconstruir a história genética do cabelo.

Ele descobriu que era proveniente de um homem dos primeiros povos que se estabeleceram na Groenlândia, conhecida como cultura Saqqaq. Foi a primeira vez que os cientistas recuperaram um genoma humano antigo inteiro.

Agora, uma revisão da primeira década da antiga genômica das Américas publicada em Natureza hoje escrito pelo Professor Willerslev, um Fellow do St John's College, University of Cambridge, e diretor do The Lundbeck Foundation GeoGenetics Center, University of Copenhagen, com um de seus colaboradores de longa data, o Professor David Meltzer, um arqueólogo baseado na Southern Methodist University, Texas, mostra como a primeira análise mundial de um genoma antigo desencadeou uma incrível 'década de descobertas'.

O professor Willerslev disse: "Os últimos dez anos foram cheios de surpresas na compreensão do povoamento das Américas - muitas vezes me sinto como uma criança no Natal esperando para ver que presente de DNA empolgante estou prestes a desembrulhar! O que realmente me surpreendeu mente é o quão resilientes e capazes eram os primeiros humanos dos quais sequenciamos o DNA - eles ocupavam ambientes extremamente diferentes e frequentemente os povoavam em um curto espaço de tempo.

“Fomos ensinados na escola que as pessoas ficariam quietas até que a população crescesse a um nível em que os recursos fossem exauridos. Mas descobrimos que as pessoas estavam se espalhando pelo mundo apenas para explorar, descobrir, ter aventuras.

"Os últimos 10 anos nos mostraram muito sobre nossa história e o que significa ser humano. Nunca mais veremos essa profundidade da experiência humana neste planeta novamente - as pessoas entraram em novas áreas sem absolutamente nenhuma ideia do que estava à frente deles. Isso nos diz muito sobre a adaptabilidade humana e como os humanos se comportam. "

Por décadas, os cientistas confiaram em descobertas arqueológicas para reconstruir o passado e as teorias nem sempre eram precisas. Anteriormente, pensava-se que havia primeiros povos não-nativos americanos nas Américas, mas a análise de DNA antigo até agora mostrou que todos os vestígios antigos encontrados estão mais intimamente relacionados aos nativos americanos contemporâneos do que a qualquer outra população em qualquer outro lugar no mundo.

Uma bola de cabelo de 4.000 anos congelada no tempo e emaranhada em um pente de osso de baleia levou à primeira reconstrução de um antigo genoma humano há pouco mais de uma década. O cabelo, que foi preservado em permafrost ártico na Groenlândia, foi coletado na década de 1980 e armazenado em um museu na Dinamarca. Não foi até 2010 que o biólogo evolucionista Professor Eske Willerslev foi capaz de usar o sequenciamento de DNA shotgun pioneiro para reconstruir a história genética do cabelo. Ele descobriu que era proveniente de um homem dos primeiros povos que se estabeleceram na Groenlândia, conhecida como cultura Saqqaq. Foi a primeira vez que os cientistas recuperaram um genoma humano antigo inteiro. Agora, uma revisão da primeira década da antiga genômica das Américas publicada em Natureza hoje (16 de junho de 2021) escrito pelo Professor Willerslev, um Fellow do St John's College, da Universidade de Cambridge, e diretor do The Lundbeck Foundation GeoGenetics Center, da Universidade de Copenhagen, com um de seus colaboradores de longa data, o Professor David Meltzer, arqueólogo residente em Southern A Universidade Metodista, no Texas, mostra como a primeira análise mundial de um genoma antigo desencadeou uma incrível 'década de descobertas'. Crédito: St John's College, University of Cambridge

O professor Meltzer, que trabalhou na revisão com o professor Willerslev enquanto o primeiro estava no St John's College como um Beaufort Visiting Scholar, acrescentou: "A evidência genômica mostrou conexões que não sabíamos que existiam entre diferentes culturas e populações e a ausência de conexões que pensávamos que existisse. A história da população humana é muito mais complexa do que se pensava.

“Muito do que foi descoberto sobre o povoamento das Américas não poderia ter sido previsto. Vimos como as pessoas se moviam rapidamente ao redor do mundo quando tinham um continente para si, não havia nada para contê-las. vantagem seletiva para ver o que havia na próxima colina. "

Em 2013, os cientistas mapearam o genoma de um menino de quatro anos que morreu no centro-sul da Sibéria 24.000 anos atrás. O sepultamento de uma criança siberiana do Paleolítico Superior foi descoberto na década de 1920 por arqueólogos russos perto da aldeia de Mal'ta, ao longo do rio Belaya. O sequenciamento do genoma de Mal'ta foi fundamental, pois mostrou a existência de uma população anteriormente sem amostragem que contribuiu para a ancestralidade das populações siberianas e nativas americanas.

Dois anos depois, o professor Willerslev e sua equipe publicaram o primeiro genoma antigo do nativo americano, sequenciado dos restos mortais de um menino enterrado cerimonialmente há mais de 12.000 anos em Anzick, Montana.

Em 2015, sua antiga análise genômica foi capaz de desvendar o mistério do Homem Kennewick, um dos esqueletos mais antigos e completos já encontrados nas Américas, e um dos mais polêmicos.

Os restos mortais de 9.000 anos foram cercados por uma tempestade de controvérsias quando a jurisdição legal sobre o esqueleto se tornou o foco de uma década de ações judiciais entre cinco tribos nativas americanas, que reivindicaram a propriedade do homem que chamavam de Ancião, e os Estados Unidos Corpo de Engenheiros do Exército.

O professor Willerslev, que aprendeu corretamente a estar atento às sensibilidades culturais ao pesquisar o DNA antigo, passou grande parte da última década conversando com membros da comunidade tribal para explicar seu trabalho em detalhes e buscar seu apoio.

Isso significa que ele foi capaz de concordar com os membros da tribo Colville, com base no estado de Washington, onde os restos mortais foram encontrados, que eles doariam parte de seu DNA para permitir que o professor Willerslev e sua equipe estabelecessem se havia uma ligação genética entre eles e Kennewick Man.

Professor Eske Willerslev com Donna e Joey, dois membros da tribo Fallon Paiute-Shoshone, discutindo sobre o indivíduo da Caverna do Espírito. Crédito: Linus Mørk / Magus Film.

Jackie Cook, descendente da Tribo Colville e especialista em repatriação das Tribos Confederadas da Reserva Colville, disse: "Passamos quase 20 anos tentando que o Ancião fosse repatriado para nós. Há uma longa história de desconfiança entre cientistas e nossas tribos nativas americanas, mas quando Eske nos apresentou sobre seu trabalho de DNA na criança Anzick, os pelos dos meus braços se arrepiaram.

"Sabíamos que não deveríamos ter que concordar com o teste de DNA, e havia a preocupação de que teríamos que fazer isso todas as vezes para provar a afiliação cultural, mas os membros do nosso Conselho discutiram isso com os anciãos e foi acordado que qualquer membro da tribo que queria fornecer DNA para o estudo, poderia. "

O genoma do Homem Kennewick, como o bebê Anzick, revelou que o homem era um ancestral direto dos nativos americanos vivos. O Ancião foi devidamente devolvido às tribos e enterrado novamente.

Cook acrescentou: "Corremos um risco, mas deu certo. Foi incrível trabalhar com Eske e nos sentimos honrados, aliviados e humildes por poder resolver um caso tão importante. Tivemos histórias orais que foram transmitidas de geração a geração por milhares de anos que chamamos de histórias de coiote - histórias de ensino. Essas histórias eram de nossos ancestrais sobre viver ao lado de mamutes peludos e testemunhar uma série de enchentes e erupções de vulcões. Como tribo, sempre abraçamos a ciência, mas nem toda a história é descoberta por meio da ciência . "

O trabalho liderado pelo Professor Willerslev também foi capaz de identificar as origens da múmia natural mais antiga do mundo chamada Spirit Cave. Os cientistas descobriram o antigo esqueleto humano em 1940, mas não foi até 2018 que uma descoberta surpreendente foi feita que desvendou os segredos da tribo da Idade do Gelo nas Américas.

A revelação veio como parte de um estudo que analisou geneticamente o DNA de uma série de vestígios antigos famosos e polêmicos nas Américas do Norte e do Sul, incluindo Spirit Cave, os esqueletos de Lovelock, os restos de Lagoa Santa, uma múmia inca e os vestígios mais antigos no Chile Patagônia.

Os cientistas sequenciaram 15 genomas antigos que vão do Alasca à Patagônia e foram capazes de rastrear os movimentos dos primeiros humanos conforme eles se espalharam pelas Américas em uma velocidade 'surpreendente' durante a Idade do Gelo e também como eles interagiram uns com os outros nos milênios seguintes.

A equipe de acadêmicos não apenas descobriu que a caverna do Espírito era um nativo americano, mas eles foram capazes de rejeitar uma teoria de longa data de que um grupo chamado Paleoamericanos existia na América do Norte antes dos nativos americanos. Spirit Cave foi devolvida à Tribo Fallon Paiute-Shoshone, um grupo de nativos americanos com base em Nevada, para o enterro.

O professor Willerslev acrescentou: "Na última década, a história humana mudou fundamentalmente graças à análise genômica antiga - e as incríveis descobertas apenas começaram."


Visão geral

Os dados de contabilidade de custos apresentados aqui são resumidos em relação a duas métricas: (1) "Custo por Megabase de Sequência de DNA" - o custo de determinar uma megabase (Mb de um milhão de bases) de sequência de DNA de uma qualidade especificada [ver abaixo] ( 2) "Custo por Genoma" - o custo de sequenciamento de um genoma de tamanho humano. Para cada um, é fornecido um gráfico mostrando os dados desde 2001, além disso, os números reais refletidos nos gráficos são fornecidos em uma tabela de resumo.

NHGRI convida as pessoas a baixar esses gráficos e usá-los em suas apresentações e materiais de ensino. O NHGRI planeja atualizar esses dados regularmente. Você pode visualizar os dados no Excel baixando o Sequencing Costs 2020.

Para ilustrar a natureza das reduções nos custos de sequenciamento de DNA, cada gráfico também mostra dados hipotéticos que refletem a Lei de Moore, que descreve uma tendência de longo prazo na indústria de hardware de computador que envolve a duplicação do 'poder de computação' a ​​cada dois anos (Ver: Lei [wikipedia.org]). As melhorias tecnológicas que 'acompanham' a Lei de Moore são amplamente consideradas como indo muito bem, o que a torna útil para comparação.

Em ambos os gráficos, observe: (1) o uso de uma escala logarítmica no eixo Y e (2) o súbito e profundo avanço da Lei de Moore começando em janeiro de 2008. Este último representa o momento em que os centros de sequenciamento fizeram a transição de Sanger- (sequenciamento de terminação de cadeia didesoxi) para tecnologias de sequenciamento de DNA de 'segunda geração' (ou 'próxima geração'). Detalhes adicionais sobre esses gráficos são fornecidos abaixo.

Esses dados, no entanto, não capturam todos os custos associados ao Programa de Sequenciamento do Genoma em Grande Escala NHGRI. Os centros de sequenciamento executam uma série de atividades adicionais cujos custos não são apropriados para incluir no cálculo de custos para sequenciamento de DNA orientado para a produção. In other words, NHGRI makes a distinction between 'production' activities and 'non-production' activities. Production activities are essential to the routine generation of large amounts of quality DNA sequence data that are made available in public databases the costs associated with production DNA sequencing are summarized here and depicted on the two graphs. Additional information about the other activities performed by the sequencing centers is provided below.

The cost-accounting data presented here are summarized relative to two metrics: (1) "Cost per Megabase of DNA Sequence" - the cost of determining one megabase (Mb a million bases) of DNA sequence of a specified quality [see below] (2) "Cost per Genome" - the cost of sequencing a human-sized genome. For each, a graph is provided showing the data since 2001 in addition, the actual numbers reflected by the graphs are provided in a summary table.

NHGRI welcomes people to download these graphs and use them in their presentations and teaching materials. NHGRI plans to update these data on a regular basis. You can view the data in in Excel by downloading the Sequencing Costs 2020.

To illustrate the nature of the reductions in DNA sequencing costs, each graph also shows hypothetical data reflecting Moore's Law, which describes a long-term trend in the computer hardware industry that involves the doubling of 'compute power' every two years (See: Moore's Law [wikipedia.org]). Technology improvements that 'keep up' with Moore's Law are widely regarded to be doing exceedingly well, making it useful for comparison.

In both graphs, note: (1) the use a logarithmic scale on the Y axis and (2) the sudden and profound out-pacing of Moore's Law beginning in January 2008. The latter represents the time when the sequencing centers transitioned from Sanger-based (dideoxy chain termination sequencing) to 'second generation' (or 'next-generation') DNA sequencing technologies. Additional details about these graphs are provided below.

These data, however, do not capture all of the costs associated with the NHGRI Large-Scale Genome Sequencing Program. The sequencing centers perform a number of additional activities whose costs are not appropriate to include when calculating costs for production-oriented DNA sequencing. In other words, NHGRI makes a distinction between 'production' activities and 'non-production' activities. Production activities are essential to the routine generation of large amounts of quality DNA sequence data that are made available in public databases the costs associated with production DNA sequencing are summarized here and depicted on the two graphs. Additional information about the other activities performed by the sequencing centers is provided below.


DISCUSSÃO

Previous reports (5-12) have counted the number of genes exhibiting the overlapping phenomenon, but no reports have enumerated the number of loci or exons that exhibit this overlap. Furthermore, previous reports (5-12) have only described this overlap phenomenon for opposite strands. The present strategy offers a valuable method for estimating the number of overlapping genes, as the total number of genes in the human genome is yet uncertain. Because the total number of genes in the human genome was estimated 32,000 in 2001 (1, 2), and subsequently estimated in 2004 to 22,000.

The total number of exons in the human genome has been estimated at approximately 320,000 (8.8/gene) (1, 2), whereas the present data indicate the existence of more than twice that number. This discrepancy is due to different methods of enumerating exons. We simply counted all of the exons in the human genome, without considering how many exons comprise a gene. This method can identify all exons (e.g., more than 2 exons identified in the same region) and avoids confusion due to splicing variants.

Overlapping genes may evolve as a result of extensions of open reading frames (ORF) caused by switching to an upstream start codon, substitutions in start or stop codons, or deletions and frame shifts that eliminate initiation or stop codons (13). The necessity for maintaining 2 functional overlapping genes inevitably constrains the extent to which both genes can become optimally adapted. However, such constraints can be alleviated by duplication of the overlapping gene pair, allowing for independent evolution of each gene in the resulting copies. This means that overlapping genes can thus only survive long evolutionary periods when the overlap confers a selective advantage upon the organism. In viruses, overlapping genes are thought to persist due to the considerable constraints on genome size (7). In non-viral organisms, the potential advantages of overlapping genes are less clear, although co-regulation may be involved (4). Results of a comparative study of overlapping genes in the genomes of two closely related bacteria revealed that many overlapping genes arise due to incidental elongation of the coding region (16). Overlapping genes have generally been thought to be relatively rare in the human genome, but the results of the present study show that they are more abundant than was previously thought. Interestingly, overlapping genes do not appear to be the result of evolutionary pressure to minimize the size of the human genome.

Yelin et al. (17) demonstrated by em vitro experiments that antisense transcription occurs widely in the human genome. The resulting data set of 2,667 sense-antisense pairs was evaluated by microarrays containing strand-specific oligonucleotide probes derived from the region of overlap. Verification of specific cases by Northern blot analysis with strand-specific riboprobes confirmed the occurrence of transcription from both DNA strands. While these authors also predicted the existence of approximately 1,600 sense-antisense transcriptional units, transcribed from both DNA strands (13), no overlapping patterns were elucidated.

Adachi-N et al. (18) reported that some genes overlap in a head-to-head manner (transcribed in opposite directions), while Koyanagi-KO et al. (19) recently reported the occurrence of bidirectional gene pairs in some species. However, they did not describe the patterns of the overlapping exons. In our study, this type of overlap was included in the overlapping loci identified. It has also been reported that divergence (bidirectionality) is frequently observed, particularly in genes involved in DNA repair or replication.(18). The functional significance of this is unclear, but divergence may permit two genes to share one CpG island for purposes of coordinated expression. In some bidirectional loci, expression of two divergent genes has been found to be coregulated, and promoters exhibiting bidirectional activity have often been observed (20, 21). To the best of our knowledge, the phenomenon of overlapping exons is not specific in DNA repair or replication, and further studies are needed to clarify the functional significance of overlapping genes.

Clarification of overlapping genes will facilitate the description of roles for each strand of the human genome and will provide insight into the mechanisms of evolution.

These results show that all overlapping types are distributed throughout the human genome, but that distributions differ for each chromosome.


Assista o vídeo: . Biología - Núcleo, Nucléolo, Genoma (Janeiro 2022).