Em formação

Em que parte do genoma estão localizadas as sequências de desenvolvimento da embriogênese?


Qual parte ou partes do genoma são as sequências localizadas. Eles estão espalhados pelos cromossomos? Em caso afirmativo, como eles são acessados ​​sequencialmente com precisão durante a embrigênese?


Esta é uma questão muito geral. As "sequências de desenvolvimento" são apenas genes como qualquer outro. Como todos os genes, eles são distribuídos de forma semi-aleatória pelo genoma. Embora existam áreas ricas e pobres em genes no genoma, com algumas exceções - notadamente os genes homeobox -, os genes não são agrupados por função.

Quanto a como eles são acessados ​​sequencialmente, essa é uma grande questão, mas não é específica da embriogênese. Os genes sempre precisarão ser ativados / desativados em momentos específicos e em resposta a estímulos específicos. Isso é particularmente óbvio durante o desenvolvimento, mas não é exclusivo dele.

A maneira básica como isso acontece é por meio de feedback e loops de controle. O gene A ativa a transcrição do gene B, que ativa o gene C, que então desativa A. Se você conseguir ligar A, o resto virá. Uma das maneiras pelas quais isso pode acontecer no desenvolvimento de embriões é por meio do mRNA materno. São moléculas de mRNA que estão presentes no ovo fertilizado e que começam a ser traduzidas. Isso nos dá um ponto de partida para ativar o gene A, que então liga o B etc.

Esta resposta é uma grande simplificação, mas uma resposta completa pode ocupar alguns (ou 40) projetos de doutorado.


Terdon está certo sobre o dinheiro quando se trata de como a coordenação é feita, e eu conheço pelo menos um aluno trabalhando nisso para sua tese. No entanto, para responder diretamente à sua outra pergunta, houve uma ótima revisão em 2010, que foi ministrada em minha aula de genética daquele ano.

É importante notar que ainda não conhecemos todos os genes que estão envolvidos com certeza significativa. Além disso, seria extremamente difícil financiar e conduzir o trabalho de Hong et al nos Estados Unidos.

Se você ler o artigo, notará que vários genes envolvidos são genes que estão ativos ao longo da vida em vários níveis. A Figura 4 dá um bom exemplo de como as informações são disseminadas.

Observe que as três categorias de genes que eles usaram eram até bastante diferentes: genes específicos de células-tronco, genes de músculos, gordura e tecido conjuntivo, termo GO significativamente enriquecido

Então, quando você pensa sobre como os genes são diversos, seria ainda mais estranho para eles estarem agrupados. Novamente, eles provavelmente não são verdadeiramente aleatórios, mas não parecem ter um padrão.

Para citar o que levam para casa:

Além disso, comparando com os dados publicados, identificamos três grupos de genes maternos com perfis de regulação distintos durante as semanas 4-9 de desenvolvimento, que forneceram uma base molecular para os eventos de desenvolvimento anatomicamente distintos que ocorrem entre a embriogênese inicial e subsequente organogênese e histogênese.

Mais importante, nosso perfil de desenvolvimento detalhado em todo o genoma dos padrões de expressão gênica revelou que os genes envolvidos nos mesmos processos biológicos são frequentemente regulados de forma coordenada. Essa descoberta nos levou a hipotetizar que os padrões de expressão gênica, se conhecidos em detalhes suficientes como no presente estudo, podem ser usados ​​para prever um papel para o gene em um processo de desenvolvimento.

Hong Yi, Lu Xue e Ming-Xiong Guo, et al. FASEB J. 2010 setembro; 24 (9): 3341-3350. doi: 10.1096 / fj.10-158782 PMCID: PMC2923361


Resumo

O desenvolvimento embrionário representa uma importante fase reprodutiva de espécies de plantas que se reproduzem sexualmente. A fusão do óvulo com o espermatozóide produz o zigoto vegetal, uma célula totipotente que, por meio da divisão celular e da especificação da identidade celular no início da embriogênese, estabelece as principais linhagens celulares e tecidos da planta adulta. A fase de morfogênese subsequente produz o embrião de tamanho normal, enquanto o processo de maturação da embriogênese tardia prepara a semente para a dormência e subsequente germinação, garantindo a continuação do ciclo de vida da planta. Nesta revisão sobre embriogênese, comparamos o modelo eudicot Arabidopsis thaliana com monocotiledôneas, com foco na ativação do genoma, regulação paterna e materna do desenvolvimento inicial do zigoto e organizadores-chave de padronização, como auxina e fatores de transcrição WOX. Embora os primeiros estágios do desenvolvimento do embrião sejam aparentemente conservados entre as espécies de plantas, os programas de maturação do embrião se diversificaram entre eudicotiledôneas e monocotiledôneas. Essa diversificação nas espécies de culturas reflete os prováveis ​​efeitos da domesticação nas características de qualidade das sementes, que são determinadas durante a maturação do embrião, e também garante a germinação das sementes em diferentes condições ambientais. Esta revisão descreve as características mais importantes do desenvolvimento embrionário em plantas, e o escopo e aplicações da genômica em estudos de embriões de plantas.


O que é C. elegans?

UMA INTRODUÇÃO PARA OS NÃO FAMILIARES COM “O SEM-FIM”.

C. elegans é um nematóide - um membro do filo Nematoda:

As lombrigas e lagartas, um filo de vermes de pele lisa e não segmentada com uma forma de corpo cilíndrica longa e afilada nas extremidades, inclui formas de vida livre e parasitas tanto aquáticas quanto terrestres. (Dicionário da Imprensa Acadêmica de Ciência e Tecnologia)

C. elegans é um organismo não perigoso, não infeccioso, não patogênico e não parasitário. É pequeno, crescendo até cerca de 1 mm de comprimento e vive no solo - especialmente na vegetação em decomposição - em muitas partes do mundo, onde sobrevive alimentando-se de micróbios como bactérias. Não tem importância econômica para o homem.

Por que estudar C. elegans?

Em todo o mundo, milhares de cientistas estão trabalhando em tempo integral investigando a biologia de C. elegans. Entre outubro de 1994 e janeiro de 1995, 73 artigos científicos sobre essa criatura apareceram em revistas científicas internacionais. Atualmente, um consórcio internacional de laboratórios está colaborando em um projeto para sequenciar todas as 100 milhões de bases de DNA do C. elegans genoma. Por que investir tanto esforço no estudo de um organismo tão insignificante?

C. elegans é um organismo primitivo que, não obstante, compartilha muitas das características biológicas essenciais que são os problemas centrais da biologia humana. O verme é concebido como uma única célula que passa por um complexo processo de desenvolvimento, começando com a clivagem embrionária, passando pela morfogênese e crescimento até o adulto. Tem um sistema nervoso com um "cérebro" (o anel nervoso circunfaríngeo). Ele exibe comportamento e é até capaz de aprendizado rudimentar. Produz esperma e óvulos, acasala e se reproduz. Após a reprodução, envelhece gradualmente, perde vigor e finalmente morre. Embriogênese, morfogênese, desenvolvimento, função nervosa, comportamento e envelhecimento, e como eles são determinados pelos genes: a lista inclui a maioria dos mistérios fundamentais da biologia moderna. (Devemos, infelizmente, assumir que o maior enigma biológico de todos, a consciência, está ausente de C. elegans- embora isso ainda precise ser demonstrado!) C. elegans exibe esses fenômenos, mas tem apenas 1 mm de comprimento e pode ser tratado como um microorganismo - geralmente é cultivado em placas de Petri semeadas com bactérias. Todas as 959 células somáticas de seu corpo transparente são visíveis ao microscópio e sua vida útil média é de apenas 2 a 3 semanas. Assim C. elegans fornece ao pesquisador o compromisso ideal entre complexidade e tratabilidade.

Como C. elegans O projeto foi iniciado pela bióloga sul-africana Sydney Brenner e pode ser encontrado no link que acompanha.

Um esboço biológico em miniatura de C. elegans

C. elegans é um nematóide de vida livre. Existem dois sexos: um hermafrodita autofecundante e um homem. O adulto compreende essencialmente um tubo, a cutícula externa, contendo dois tubos menores, a faringe e o intestino, e o sistema reprodutor. A maior parte do volume do animal é absorvida pelo sistema reprodutor. Das 959 células somáticas do hermafrodita, cerca de 300 são neurônios. As estruturas neurais incluem uma bateria de órgãos dos sentidos na cabeça que medeiam as respostas ao paladar, cheiro, temperatura e toque - e embora C. elegans não tem olhos, pode responder levemente à luz. Entre outras estruturas neurais está um anel nervoso anterior com um cordão nervoso ventral descendo pelo corpo. (Há também um cordão nervoso dorsal menor.) Existem 81 células musculares. C. elegans move-se por meio de quatro faixas longitudinais de músculos pareados sub-dorsal e subventralmente. Flexão e relaxamento alternativos geram ondas dorsal-ventrais ao longo do corpo, impulsionando o animal. O desenvolvimento e a função desse organismo diplóide são codificados por cerca de 17.800 genes distintos.


Os primeiros estágios da embriogênese foram estudados

Pela primeira vez, cientistas da Faculdade de Biologia da Lomonosov Moscow State University, em colaboração com seus colegas da Áustria e dos Estados Unidos, construíram mapas detalhados da organização tridimensional do genoma em células individuais e estudaram as características da organização tridimensional de genomas maternos e paternos em zigotos de camundongos. Os resultados obtidos foram publicados no Natureza Diário.

A equipe de pesquisa internacional, incluindo os biólogos da Lomonosov Moscow State University, provou um modelo proposto anteriormente, argumentando que o pacote de fibrilas de cromatina pode variar significativamente em células individuais. A obtenção desses resultados tornou-se possível devido ao desenvolvimento de uma nova abordagem experimental para estudar a organização tridimensional do genoma em núcleos de células individuais.

As moléculas de DNA nos núcleos das células são embaladas em estruturas especiais, cromossomos, que podem ser entendidos como complexos, mas não emaranhados aleatoriamente emaranhados de DNA genômico associado a proteínas e RNA. Os biólogos desenvolveram uma nova técnica, que permitiu estudar como esse complexo DNA-proteína chamado cromatina se acumula no núcleo de uma célula viva. Esta técnica é uma versão avançada da abordagem clássica para estudos de organização tridimensional do genoma, chamada Hi-C (captura de conformação cromossômica de alto rendimento).

Sergey Ulianov, membro da equipe de pesquisa, explicou: "Vamos pegar três fragmentos arbitrários de DNA: A, B, C. Os dois primeiros, sendo vizinhos, estão localizados um a um no genoma, e o terceiro - digamos - está localizado a uma distância de vários milhões de pares de bases dos dois anteriores. No entanto, um cromossomo pode ser empacotado de tal forma que o fragmento C ficará próximo no espaço de A ou B. Podemos identificar esse fato (não para esses três Fragmentos de DNA, mas simultaneamente para todo o genoma) e usar essa informação para construir mapas da organização tridimensional da cromatina em uma célula viva. É assim que o método Hi-C funciona. "

O método Hi-C padrão requer várias centenas de milhares e até milhões de células para realizar um experimento. No entanto, a nova técnica permite que os pesquisadores trabalhem com uma única célula e desenhem seu mapa individual de organização cromossômica tridimensional. A principal novidade dessa técnica é a seleção de núcleos únicos no estágio final do experimento Hi-C com subsequente amplificação do genoma inteiro. Esse processo oferece a possibilidade de obter dezenas de milhares de cópias de DNA de um único núcleo usando uma enzima especial.

Sergey Ulianov diz: "Esta é a etapa principal em nosso experimento. A amplificação do genoma inteiro torna possível operações diretas com genomas de células individuais. Podemos sequenciá-los e realizar qualquer outra manipulação, incluindo estudos da organização tridimensional da cromatina em uma única célula . As chamadas tecnologias de célula única, ou seja, estudos de células individuais e manipulações com elas, agora pertencem a um campo de rápido desenvolvimento da biologia molecular. "

Este novo método permitiu aos cientistas estudar separadamente núcleos maternos e paternos de zigotos de camundongos e examinar como a organização tridimensional do genoma materno difere da mesma do genoma paterno.

Ilya Flyamer, o primeiro autor do artigo, comenta: "Conduzimos a análise da organização tridimensional do genoma em zigotos de camundongos. Descobrimos que os núcleos materno e paterno coexistindo em uma célula, em um zigoto, diferiam consideravelmente em a forma de empacotamento do genoma. No pró-núcleo paterno, formado a partir de um núcleo de esperma, as partes ativas do genoma são separadas no espaço das inativas. Surpreendentemente, não vemos isso no pró-núcleo materno. Então, o pró-núcleo materno é o primeiro tipo de núcleo de mamífero em que os compartimentos de cromatina ativos e reprimidos não são segregados espacialmente um do outro. "

Assim, o novo método permite estudar os primeiros estágios da embriogênese - logo após a fertilização.

Ilya Flyamer acrescenta: "O zigoto é uma célula totipotente, que dá origem a qualquer tipo de célula em um organismo. É por isso que os resultados obtidos podem provavelmente ajudar a compreender a natureza da totipotência e fornecer uma oportunidade de abordar uma reprogramação mais completa de células somáticas , do que é possível pela criação de células-tronco pluripotentes induzidas. "

A organização tridimensional da cromatina é um importante instrumento regulatório, usado por uma célula para controlar a expressão gênica. Há cada vez mais relatos na literatura científica que revelam uma conexão entre o empacotamento anormal de DNA no núcleo da célula e o desenvolvimento de várias doenças humanas, incluindo alguns cânceres. No futuro, a tecnologia de célula única Hi-C permitirá aos cientistas estudar certas subpopulações de células tumorais, incluindo as raras. Além disso, provavelmente nos aproximará do entendimento dos mecanismos de emergência de tumores malignos.

O projeto foi realizado em cooperação com o Instituto de Biologia Genética da Academia Russa de Ciências e colegas da Áustria e dos EUA.

Isenção de responsabilidade: AAAS e EurekAlert! não são responsáveis ​​pela precisão dos comunicados à imprensa postados no EurekAlert! por instituições contribuintes ou para o uso de qualquer informação por meio do sistema EurekAlert.


O que um transcriptoma pode nos dizer?

Uma sequência de RNA reflete a sequência do DNA a partir do qual foi transcrita. Conseqüentemente, ao analisar toda a coleção de sequências de RNA em uma célula (o transcriptoma), os pesquisadores podem determinar quando e onde cada gene é ativado ou desativado nas células e tecidos de um organismo.

Dependendo da técnica usada, muitas vezes é possível contar o número de transcritos para determinar a quantidade de atividade gênica - também chamada de expressão gênica - em uma determinada célula ou tipo de tecido.

Em humanos e outros organismos, quase todas as células contêm os mesmos genes, mas células diferentes apresentam padrões diferentes de expressão gênica. Essas diferenças são responsáveis ​​por muitas propriedades e comportamentos diferentes de várias células e tecidos, tanto na saúde quanto na doença.

Ao coletar e comparar transcriptomas de diferentes tipos de células, os pesquisadores podem obter uma compreensão mais profunda do que constitui um tipo específico de célula, como esse tipo de célula funciona normalmente e como as mudanças no nível normal de atividade do gene podem refletir ou contribuir para a doença. Além disso, os transcriptomas podem permitir aos pesquisadores gerar uma imagem abrangente do genoma de quais genes estão ativos em quais células.

Uma sequência de RNA reflete a sequência do DNA a partir do qual foi transcrita. Conseqüentemente, ao analisar toda a coleção de sequências de RNA em uma célula (o transcriptoma), os pesquisadores podem determinar quando e onde cada gene é ativado ou desativado nas células e tecidos de um organismo.

Dependendo da técnica usada, muitas vezes é possível contar o número de transcritos para determinar a quantidade de atividade gênica - também chamada de expressão gênica - em uma determinada célula ou tipo de tecido.

Em humanos e outros organismos, quase todas as células contêm os mesmos genes, mas células diferentes mostram padrões diferentes de expressão gênica. Essas diferenças são responsáveis ​​por muitas propriedades e comportamentos diferentes de várias células e tecidos, tanto na saúde quanto na doença.

Ao coletar e comparar transcriptomas de diferentes tipos de células, os pesquisadores podem obter uma compreensão mais profunda do que constitui um tipo específico de célula, como esse tipo de célula funciona normalmente e como as mudanças no nível normal de atividade do gene podem refletir ou contribuir para a doença. Além disso, os transcriptomas podem permitir aos pesquisadores gerar uma imagem abrangente do genoma de quais genes estão ativos em quais células.


Conteúdo

Os produtos dos genes Hox são proteínas Hox. As proteínas Hox são um subconjunto de fatores de transcrição, que são proteínas capazes de se ligar a sequências de nucleotídeos específicas no DNA, chamadas de intensificadores, por meio dos quais ativam ou reprimem centenas de outros genes. A mesma proteína Hox pode atuar como repressora em um gene e ativadora em outro. A capacidade das proteínas Hox de se ligar ao DNA é conferida por uma parte da proteína conhecida como homeodomínio. O homeodomínio é um domínio de ligação ao DNA de 60 aminoácidos (codificado por sua sequência de DNA de 180 pares de bases correspondente, a homeobox). Esta sequência de aminoácidos se dobra em um motivo de "hélice-volta-hélice" (isto é, dobra homeodomínio) que é estabilizado por uma terceira hélice. A cadeia polipeptídica de consenso é mostrada abaixo :. [8] As proteínas Hox geralmente atuam em parceria com cofatores, como as proteínas PBC e Meis codificadas por tipos muito diferentes de genes homeobox. [9]

Os genes homeobox e, portanto, o motivo da proteína do homeodomínio, são encontrados na maioria dos eucariotos. Os genes Hox, sendo um subconjunto de genes homeobox, surgiram mais recentemente na evolução dentro do reino animal ou Metazoa. Dentro do reino animal, os genes Hox estão presentes em toda a bilateria [10] (animais com um eixo claro da cabeça à cauda), e também foram encontrados em Cnidários, como anêmonas do mar. [11] Isso implica que os genes Hox surgiram há mais de 550 milhões de anos. Na bilateria, os genes Hox são frequentemente organizados em grupos de genes, embora haja muitas exceções em que os genes foram separados por rearranjos cromossômicos. [12] A comparação de sequências de homeodomínio entre proteínas Hox geralmente revela maior similaridade entre as espécies do que dentro de uma espécie. Essa observação levou à conclusão de que os agrupamentos de genes Hox evoluíram no início da evolução animal a partir de um único gene Hox via duplicação em tandem e divergência subsequente, e que um gene Hox prototípico O agrupamento de genes Hox contendo pelo menos sete genes Hox diferentes estava presente no ancestral comum de todos os animais bilaterais. [10] [13]

Na maioria dos animais bilaterais, os genes Hox são expressos em domínios escalonados ao longo do eixo cabeça-cauda do embrião, sugerindo que seu papel na especificação da posição é uma característica antiga compartilhada. [14] A conservação funcional das proteínas Hox pode ser demonstrada pelo fato de que uma mosca pode funcionar em grande parte com uma proteína Hox de galinha no lugar da sua. [15] Portanto, apesar de ter um último ancestral comum que viveu há mais de 550 milhões de anos, [16] a versão galinha e mosca do mesmo gene Hox são semelhantes o suficiente para atingir os mesmos genes downstream em moscas.

Drosophila melanogaster é um modelo importante para a compreensão da geração e evolução do plano corporal. Os princípios gerais da função e lógica do gene Hox elucidados em moscas se aplicarão a todos os organismos bilaterais, incluindo humanos. Drosófila, como todos os insetos, tem oito genes Hox. Estes estão agrupados em dois complexos, ambos localizados no cromossomo 3. O complexo Antenapedia (não deve ser confundido com o Antp gene) consiste em cinco genes: labial (laboratório), proboscipedia (pb), deformado (Dfd), os pentes sexuais reduzidos (Scr) e Antennapedia (Antp) O complexo Bithorax, em homenagem ao gene Ultrabithorax, consiste nos três genes restantes: Ultrabithorax (Ubx), abdominal-A (abd-A) e abdominal-B (abd-B).

Edição Labial

o laboratório gene é o gene expresso mais anteriormente. É expresso na cabeça, principalmente no segmento intercalar (um segmento sem apêndice entre a antena e a mandíbula) e também no intestino médio. Perda de função de laboratório resulta no fracasso do Drosófila embrião para internalizar as estruturas da boca e da cabeça que inicialmente se desenvolvem do lado de fora de seu corpo (um processo denominado involução da cabeça). A falha da involução da cabeça interrompe ou exclui as glândulas salivares e a faringe. o laboratório gene foi inicialmente assim denominado porque interrompeu o apêndice labial; no entanto, o gene do laboratório não é expresso no segmento labial e o fenótipo do apêndice labial é provavelmente o resultado da ampla desorganização resultante da falha da involução da cabeça. [17]

Proboscipedia Edit

o pb gene é responsável pela formação dos palpos labial e maxilar. Algumas evidências mostram pb interage com Scr. [18]

Edição Deformada

o Dfd gene é responsável pela formação dos segmentos maxilares e mandibulares na cabeça da larva. [19] Os fenótipos mutantes de Dfd são semelhantes aos labiais. Perda de função de Dfd no embrião resulta em falha de involução da cabeça (ver gene labial), com perda das estruturas da cabeça da larva. As mutações no adulto podem ter deleções de partes da cabeça ou transformações da cabeça em identidade torácica. [17]

Sex combs reduzidos Editar

o Scr gene é responsável pelo desenvolvimento cefálico e torácico em Drosófila embrião e adulto. [20]

Editar Antennapedia

O segundo segmento torácico, ou T2, desenvolve um par de pernas e um par de asas. o Antp gene especifica essa identidade, promovendo a formação da perna e permitindo (mas não ativando diretamente) a formação da asa. Um dominante Antp mutação, causada por uma inversão cromossômica, causa Antp a ser expressa no disco imaginal antenal, de forma que, ao invés de formar uma antena, o disco faça uma perna, resultando em uma perna saindo da cabeça da mosca. [ citação necessária ]

Editar Ultrabithorax

O terceiro segmento torácico, ou T3, carrega um par de pernas e um par de halteres (asas altamente reduzidas que funcionam no equilíbrio durante o vôo). Ubx padrões T3 em grande parte reprimindo genes envolvidos na formação de asas. A lâmina da asa é composta por duas camadas de células que aderem firmemente uma à outra e são fornecidas com nutrientes por várias veias das asas. Um dos muitos genes que Ubx reprime é empolado, que ativa as proteínas envolvidas na adesão célula-célula, e spalt, que padroniza a colocação das veias das asas. No Ubx mutantes de perda de função, Ubx não reprime mais os genes das asas, e os halteres se desenvolvem como um segundo par de asas, resultando nas famosas moscas de quatro asas. Quando Ubx é mal expresso no segundo segmento torácico, como ocorre em moscas com a mutação potenciadora "Cbx", reprime genes de asas e as asas se desenvolvem como halteres, resultando em uma mosca de quatro halteres. [ citação necessária ]

Edição Abdominal-A

No Drosófila, abd-A é expressa ao longo da maior parte do abdômen, dos segmentos abdominais 1 (A1) a A8. Expressão de abd-A é necessário especificar a identidade da maioria dos segmentos abdominais. A principal função de abd-A em insetos é reprimir a formação de membros. No abd-A mutantes de perda de função, os segmentos abdominais A2 a A8 são transformados em uma identidade mais parecida com A1. Quando abd-A é ectopicamente expresso em todo o embrião, todos os segmentos anteriores de A4 são transformados em uma identidade abdominal semelhante a A4. [17] O gene abd-A também afeta o padrão de geração de cutícula no ectoderma e o padrão de geração de músculo no mesoderma. [18]

Edição Abdominal-B

Gene abd-B é transcrito em duas formas diferentes, uma proteína reguladora e uma proteína morfogênica. Regulatório abd-B suprimir estruturas epidérmicas ventrais embrionárias no oitavo e nono segmentos do Drosófila abdômen. Tanto a proteína reguladora quanto a proteína morfogênica estão envolvidas no desenvolvimento do segmento da cauda. [18]

As proteínas com um alto grau de similaridade de sequência também são geralmente assumidas como exibindo um alto grau de similaridade funcional, isto é, proteínas Hox com homeodomínios idênticos são assumidas como tendo propriedades de ligação de DNA idênticas (a menos que sequências adicionais sejam conhecidas por influenciar a ligação de DNA). Para identificar o conjunto de proteínas entre duas espécies diferentes que são mais provavelmente semelhantes em função, são usados ​​esquemas de classificação. Para proteínas Hox, existem três esquemas de classificação diferentes: baseado em inferência filogenética, baseado em sintenia e baseado em similaridade de sequência. [21] Os três esquemas de classificação fornecem informações conflitantes para proteínas Hox expressas no meio do eixo do corpo (Hox6-8 e Antp, Ubx e abd-A) Uma abordagem combinada usou informações baseadas em inferência filogenética das diferentes espécies e plotou os tipos de sequência de proteínas na árvore filogenética das espécies. A abordagem identificou as proteínas que melhor representam as formas ancestrais (Hox7 e Antp) e as proteínas que representam novas versões derivadas (ou foram perdidas em um ancestral e agora estão ausentes em várias espécies). [22]

Os genes Hox atuam em muitos níveis dentro das hierarquias de genes de desenvolvimento: no nível "executivo", eles regulam genes que, por sua vez, regulam grandes redes de outros genes (como a via gênica que forma um apêndice). Eles também regulam diretamente os chamados genes realisadores ou genes efetores que atuam na base dessas hierarquias para formar os tecidos, estruturas e órgãos de cada segmento. A segmentação envolve processos como a morfogênese (diferenciação de células precursoras em suas células especializadas terminais), a associação estreita de grupos de células com destinos semelhantes, a escultura de estruturas e limites de segmento por meio de morte celular programada e o movimento das células de onde estão nascidos primeiro onde irão funcionar, portanto, não é surpreendente que os genes-alvo dos genes Hox promovam a divisão celular, a adesão celular, a apoptose e a migração celular. [5]

necessário para morfologia visceral normal

limite entre a maxila e a mandíbula da cabeça

membro distal que formará os ossos do dedo, do carpo e do tarso

monócitos (glóbulos brancos), com parada do ciclo celular

A sequência de DNA ligada pela proteína do homeodomínio contém a sequência de nucleotídeos TAAT, com o T terminal 5 'sendo o mais importante para a ligação. [27] Esta sequência é conservada em quase todos os locais reconhecidos pelos homeodomínios e provavelmente distingue tais locais como locais de ligação ao DNA. Os pares de bases que seguem esta sequência inicial são usados ​​para distinguir entre as proteínas do homeodomínio, todas as quais têm locais de reconhecimento semelhantes. Por exemplo, o nucleotídeo após a sequência TAAT é reconhecido pelo aminoácido na posição 9 da proteína homeodomínio. Na proteína materna Bicoide, essa posição é ocupada pela lisina, que reconhece e se liga ao nucleotídeo guanina. Na Antennapedia, essa posição é ocupada pela glutamina, que reconhece e se liga à adenina. Se a lisina no Bicoid for substituída por glutamina, a proteína resultante reconhecerá os locais intensificadores de ligação do Antennapedia. [28]

No entanto, todos os fatores de transcrição contendo homeodomínio se ligam essencialmente à mesma sequência de DNA. A sequência ligada ao homeodomínio de uma proteína Hox tem apenas seis nucleotídeos de comprimento, e tal sequência curta seria encontrada ao acaso muitas vezes em todo o genoma, muito mais do que o número de locais funcionais reais. Especialmente para proteínas Hox, que produzem mudanças dramáticas na morfologia quando mal expressas, isso levanta a questão de como cada fator de transcrição pode produzir resultados tão específicos e diferentes se todos eles se ligarem à mesma sequência. Um mecanismo que introduz uma maior especificidade de sequência de DNA para proteínas Hox é ligar-se a cofatores de proteínas. Dois desses cofatores Hox são Extradenticle (Exd) e Homotórax (Hth). Exd e Hth ligam-se às proteínas Hox e parecem induzir mudanças conformacionais na proteína Hox que aumentam sua especificidade. [29]

Assim como os genes Hox regulam os genes realisadores, eles, por sua vez, são regulados por outros genes. Na Drosophila e em alguns insetos (mas não na maioria dos animais), os genes Hox são regulados por genes gap e genes pair-rule, que por sua vez são regulados por mRNA fornecido pela mãe. Isso resulta em uma cascata de fatores de transcrição: os fatores maternos ativam o gap ou o gap dos genes pair-rule e os genes pair-rule ativam os genes Hox, então, finalmente, os genes Hox ativam os genes realizadores que fazem com que os segmentos no embrião em desenvolvimento se diferenciem. A regulação é alcançada por meio de gradientes de concentração de proteínas, chamados de campos morfogênicos. Por exemplo, altas concentrações de uma proteína materna e baixas concentrações de outras irão ativar um conjunto específico de genes gap ou pair-rule. Em moscas, a faixa 2 no embrião é ativada pelas proteínas maternas Bicoid e Hunchback, mas reprimida pelas proteínas gap Giant e Kruppel. Assim, a faixa 2 só se formará onde houver bicóide e corcunda, mas não onde há Giant e Kruppel. [30]

Foi demonstrado que as fitas de microRNA localizadas em clusters Hox inibem mais genes hox anteriores ("fenômeno de prevalência posterior"), possivelmente para ajustar melhor seu padrão de expressão. [31]

O RNA não codificante (ncRNA) demonstrou ser abundante em clusters Hox. Em humanos, 231 ncRNA podem estar presentes. Um deles, HOTAIR, silencia em trans (é transcrito a partir do agrupamento HOXC e inibe os genes HOXD tardios) ao se ligar a proteínas do grupo Polycomb (PRC2). [32]

A estrutura da cromatina é essencial para a transcrição, mas também requer que o cluster saia do território cromossômico. [33]

Em animais superiores, incluindo humanos, o ácido retinóico regula a expressão diferencial dos genes Hox ao longo do eixo ântero-posterior. [34] Os genes nas extremidades 3 'dos ​​agrupamentos Hox são induzidos pelo ácido retinóico, resultando em domínios de expressão que se estendem mais anteriormente no corpo em comparação com os genes 5' Hox que não são induzidos pelo ácido retinóico, resultando em domínios de expressão que permanecem mais posteriores.

A PCR quantitativa mostrou várias tendências em relação à colinearidade: o sistema está em equilíbrio e o número total de transcritos depende do número de genes presentes de acordo com uma relação linear. [35]

Em alguns organismos, especialmente vertebrados, os vários genes Hox estão situados muito próximos uns dos outros no cromossomo em grupos ou clusters. A ordem dos genes no cromossomo é a mesma que a expressão dos genes no embrião em desenvolvimento, com o primeiro gene sendo expresso na extremidade anterior do organismo em desenvolvimento. A razão para essa colinearidade ainda não é completamente compreendida, mas pode estar relacionada à ativação de genes Hox em uma sequência temporal por desempacotamento gradual da cromatina ao longo de um agrupamento de genes. O diagrama acima mostra a relação entre os genes e a expressão de proteínas em moscas. [ citação necessária ]

Os genes Hox são nomeados para os fenótipos homeóticos que resultam quando sua função é interrompida, em que um segmento se desenvolve com a identidade de outro (por exemplo, pernas onde as antenas deveriam estar). Os genes Hox em diferentes filos receberam nomes diferentes, o que gerou confusão sobre a nomenclatura. O complemento dos genes Hox em Drosófila é composto por dois clusters, o complexo Antennapedia e o complexo Bithorax, que juntos eram historicamente referidos como HOM-C (para Complexo Homeótico). Embora historicamente os genes HOM-C tenham se referido Drosófila homólogos, enquanto os genes Hox se referiam a homólogos de vertebrados, essa distinção não é mais feita, e ambos os genes HOM-C e Hox são chamados de genes Hox. [ citação necessária ]

Vertebrados Editar

Camundongos e humanos têm 39 genes Hox em quatro grupos: [36] [37]

Cacho Cromossomo Humano Genes
HOXA @ cromossomo 7 HOXA1, HOXA2, HOXA3, HOXA4, HOXA5, HOXA6, HOXA7, HOXA9, HOXA10, HOXA11, HOXA13
HOXB @ cromossomo 17 HOXB1, HOXB2, HOXB3, HOXB4, HOXB5, HOXB6, HOXB7, HOXB8, HOXB9, HOXB13
[email protected] chromosome 12 HOXC4, HOXC5, HOXC6, HOXC8, HOXC9, HOXC10, HOXC11, HOXC12, HOXC13
[email protected] chromosome 2 HOXD1, HOXD3, HOXD4, HOXD8, HOXD9, HOXD10, HOXD11, HOXD12, HOXD13

The ancestors of vertebrates had a single Hox gene cluster, [38] [39] [ citação necessária ] which was duplicated (twice) early in vertebrate evolution by whole genome duplications to give four Hox gene clusters: Hoxa, Hoxb, Hoxc and Hoxd. It is currently unclear whether these duplications occurred before or after divergence of lampreys and hagfish from the rest of vertebrates. [40] Most mammals, amphibians, reptiles and birds have four HOX clusters, while most teleost fish, including zebrafish and medaka, have seven or eight Hox gene clusters because of an additional genome duplication which occurred in their evolutionary history. [41] [36] In zebrafish, one of the eight Hox gene clusters (a Hoxd cluster) has lost all protein-coding genes, and just a single microRNA gene marks the location of the original cluster. [42] In some teleost fish, such as salmon, an even more recent genome duplication occurred, doubling the seven or eight Hox gene clusters to give at least 13 clusters [43]

Hox genes, especially those of the HoxA and HoxD clusters, are implicated in the limb regeneration abilities of Amphibians and Reptiles. [44] In addition, one of the bat accelerated regions (analogous to human accelerated regions) called BAR116 is an enhancer that defines a unique expression pattern of HoxD genes in the fore and hind limbs, possibly playing a role in the evolution of wings. [45]

Amphioxus Edit

Amphioxus such as Branchiostoma floridae have a single Hox cluster with 15 genes, known as AmphiHox1 para AmphiHox15. [46]

Other Invertebrates Edit

Six Hox genes are dispersed in the genome of Caenorhabditis elegans, a roundworm. [10] ( fig. 3 ) Hidra e Nematostella vectensis, both in the Phylum Cnidaria, have a few Hox/ParaHox-like homeobox genes. [47] [11] Hox gene expression has also been studied in brachiopods, [48] annelids, [49] and a suite of molluscs. [50]

The Hox genes are so named because mutations in them cause homeotic transformations. Homeotic transformations were first identified and studied by William Bateson in 1894, who coined the term "homeosis". After the rediscovery of Mendel's genetic principles, Bateson and others realized that some examples of homeosis in floral organs and animal skeletons could be attributed to variation in genes.

Definitive evidence for a genetic basis of some homeotic transformations was obtained by isolating homeotic mutants. The first homeotic mutant was found by Calvin Bridges in Thomas Hunt Morgan's laboratory in 1915. This mutant shows a partial duplication of the thorax and was therefore named Bithorax (bx) It transforms the third thoracic segment (T3) toward the second (T2). Bithorax arose spontaneously in the laboratory and has been maintained continuously as a laboratory stock ever since. [51]

The genetic studies by Morgan and others provided the foundation for the systematic analyses of Edward B. Lewis and Thomas Kaufman, which provided preliminary definitions of the many homeotic genes of the Bithorax and Antennapedia complexes, and also showed that the mutant phenotypes for most of these genes could be traced back to patterning defects in the embryonic body plan.

Ed Lewis, Christiane Nüsslein-Volhard and Eric F. Wieschaus identified and classified 15 genes of key importance in determining the body plan and the formation of body segments of the fruit fly D. melanogaster in 1980. [52] For their work, Lewis, Nüsslein-Volhard, and Wieschaus were awarded the Nobel Prize in Physiology or Medicine in 1995. [53]

In 1983, the homeobox was discovered independently by researchers in two labs: Ernst Hafen, Michael Levine, and William McGinnis (in Walter Gehring's lab at the University of Basel, Switzerland) and Matthew P. Scott and Amy Weiner (in Thomas Kaufman's lab at Indiana University in Bloomington).

Hox genes play critical roles in the development of structures such as limbs, lungs, the nervous system, and eyes. As T. R. Lappin and colleagues observed in 2006, "Evolutionary conservation provides unlimited scope for experimental investigation of the functional control of the Hox gene network which is providing important insights into human disease." In the future, more research can be done in investigating the roles of Hox genes in Leukaemia and cancer (such as EOC). [36]


Métodos

Database Searches and Retrieval of Protein Sequences

Thorough TBlastN searches with several divergent homeodomain proteins of plants and animals were performed to retrieve homeobox genes of Arabidopsis through the TAIR database server (http://www.arabidopsis.org) and of rice through the Gramene database server (http://www.gramene.org). Likewise, analogous searches were performed for the maize genome, through the TAIR maize genome server (http://tigrblast.tigr.org/tgi_maize/) as well as the Plant Genome Database server (http://www.plantgdb.org/PlantGDB-cgi/blast/PlantGDBblast). The plant genome database server was also used to retrieve homeodomain sequences from other plants. The JGI Blast server (http://genome.jgi-psf.org/Poptr1/) was used to retrieve all the Selaginella, moss, and poplar homeobox genes using TBlastN searches against the genomic sequence. Similarly, the TIGR Medicago genome server (http://tigrblast.tigr.org/er-blast/index.cgi?project=mtbe) was used to retrieve Medicago homeodomain sequences. A local database was created using Filemaker Pro 5 (Filemaker, Inc.) to store the retrieved sequences, annotations, accession numbers, expressed sequence tags (ESTs), and chromosomal location. o National Center for Biotechnology Information (NCBI) version of Mac Os X Blast (ftp.ncbi.nih.gov) was installed on a PowerMacG4 computer. The protein sequences in the Filemaker Pro 5 database were exported and reformatted for the local Blast. In order to remove the redundancy in the database, each sequence in the database was blasted against the database, and redundant entries were consolidated. New rounds of BlastP and TBlastN searches of the nr protein and GenBank databases at NCBI restricted to Arabidopsis thaliana using default values were carried out using representative homeodomains of different classes from plants and animals as a query (e.g., POU, LIM, CUT, Antp, HD-ZIP, BEL [ Bürglin 1994]). Hits from these searches were checked against data in the local Filemaker database using the “Search” feature (e.g., accession numbers, or N-terminal protein sequences), or a local Blast search of a retrieved hit was performed against the local database. New sequences identified in this fashion were added to the database. A preliminary Neighbor-Joining tree was generated, and PSI-Blast searches with a member of each evolutionary group used as a query were carried out against the nr protein database at NCBI, and iterations were stopped when no new sequences were detected. Every hit for the BlastP, TBlastN, and PSI-Blast searches was manually examined for its potential to be a homeodomain, according to the criteria outlined in the text. No particular e value was taken as an automatic cut-off point, as the goal was to detect as many homeobox genes as possible. In a few instances, Blast matrix and expected value were relaxed to include additional sequences, which were then checked manually for their potential as homeodomain sequences. Arabidopsis thaliana ESTs at NCBI were searched using each entry of our local database as a query using TBlastN. Searches of newly discovered conserved domains/motifs linked to homeobox genes were carried out using BlastP with default values and without species restriction, unless the results would lead to too many hits (e.g., PHD, DDT). All A. thaliana homeodomain protein entries (mislabeled as Hox) in the SMART database were also checked against the local database.

For rice, maize, and poplar, the genomic sequences of the few thousand nucleotides upstream and downstream of the homeodomain were analyzed to predict the complete homeodomain protein sequences using either the MIT Genescan server or the softberry FGENESH+ server, using the most similar plant gene from the blast searches as a guide. In the multiple sequence alignment, if the homeodomain showed obvious misalignment, the most similar plant sequence was used as a guide to correct the homeodomain following a three-frame translation of the sequence and manual determination of potential intron and exon boundaries. A similar procedure was used in some sequences that showed obvious gaps and misalignments within conserved domains upon sequence alignment. In those cases, the genomic sequence was examined, and it was compared either as three-frame translation with a closely related protein sequence or as DNA against a closely related DNA sequence, using the dot matrix program PPCMatrix ( Bürglin 1998b). The genomic sequence was translated in all three frames in PPCMatrix and examined for splice sites in the regions where the sequence similarity terminated. In the case of maize, part of the homeodomain could be found in one contig and the other part in a different contig. In this case, manual contig assemblies were carried out and finally confirmed by Blast searches. In several cases, Arabidopsis homeobox genes were repredicted with FGENSH+ using the most similar gene ortholog as a guide to obtain the full-length protein.

The European Molecular Biology Open Software suite was used for pairwise alignment and for locating the homeodomain sequence within a protein sequence. Sequences were submitted also to the SMART and NCBI CDD ( Schultz et al. 1998 Marchler-Bauer et al. 2003) to identify conserved domains. These databases did not contain or identify many of the conserved motifs and unusual homeodomain sequences.

The homeodomain DNA from representative members of each class were blasted against the JGI Chlamydomonas project Blast server (http://genome.jgi-psf.org/Chlre3/Chlre3.home.html) to retrieve the Chlamydomonas reinhardtii homeodomain sequences. Similarly, to recover the homeodomain protein sequences of Physcomitrella patens, TBlastN searches were performed at JGI (http://genome.jgi-psf.org/).

Multiple Sequence Alignment and Phylogenetic Analysis

The multiple sequence alignment tool MUSCLE ( Edgar 2004) was used for multiple protein sequence alignment. Sequences were further edited and aligned manually, when necessary, using the “Seaview” multiple sequence editor ( Galtier et al. 1996). For phylogenetic analyses of conserved domains, sequences were trimmed so that only the relevant protein domains remained in the alignment. Phylogenetic relationships were inferred using the maximum likelihood (ML) method as implemented in PHYML ( Guindon and Gascuel 2003). For the ML trees, the JTT ( Jones et al. 1992) substitution model was used and results were evaluated with 100 or 1,000 bootstrap replicates. Use of alternative substitution models (WAG, LG) did not affect the results in any of the cases tested (results not shown). The generated trees were displayed using TREEVIEW 1.6.6 (http://taxonomy.zoology.gla.ac.uk/rod/treeview.html) and NJPLOT by M. Gouy (http://pbil.univ-lyon1.fr/software/njplot.html).

Secondary Structure Prediction and Protein Homology Modeling

We predicted the secondary structures of several divergent homeodomain sequences using the PHD, JPRED, and Predict Protein servers ( Rost and Sander 1993 Cuff et al. 1998). For homology modeling, the crystal structure of the engrailed homeodomain (PDB id: 1enh) obtained from Protein Data Bank (PDB) was used as a template. The aligned sequences were submitted to SWISS-MODEL (http://www.expasy.org/swissmod/) to obtain the 3D structure of some of the atypical homeodomains. The model was viewed in Swiss-PDB Viewer ( Kaplan and Littlejohn 2001), and the quality of the model was judged by the phi–psi angle represented in Ramachandran Plots.


GPS for chromosomes: Reorganization of the genome during development

The spatial arrangement of genetic material within the cell nucleus plays an important role in the development of an organism. A research team from the University of Basel, in collaboration with scientists from Harvard University, has developed a method to trace the chromosomes in individual cells. Using this method, they have now been able to demonstrate that chromosomes reorganize during embryonic development. The study has recently been published in Molecular Cell.

Our body is made up of a wide variety of cells with the most diverse functions. Irrespective of being heart, liver or nerve cells, however, they all contain the same genetic information. The reason why cells develop differently is that only parts of their chromosomes are read. This results in some genes being active while others, in contrast, are silent.

For gene activation, both the way the genes are packaged as well as their spatial organization in the cell nucleus play a decisive role. Prof. Susan Mango's team at the Biozentrum of the University of Basel has now investigated this 3D architecture more closely. Using a novel technique, they were able to trace individual chromosomes during embryonic development in nematodes and show that they rearrange themselves during the early phase.

Chromosome arrangement is not random

If stretched out, all the DNA molecules of a cell would reach about two meters in length. So the DNA must be densely packed to fit into a cell nucleus of only few micrometers in size. The DNA strands are very tightly coiled and twisted to form space-saving structures, called chromosomes. The packaging and the arrangement of the DNA of the chromosomes determines the activity of genes.

In their study, the researchers led by Prof. Susan Mango traced individual chromosomes and investigated their organization during early embryonic development. Embryonic cells of the nematode C. elegans served as a model. "Using a novel technique, we were able to follow the spatial rearrangement of chromosomes in single cells at the beginning of embryogenesis," says Mango. "The advantage of this method is that the cells and tissue remain completely intact."

Early chromosomes resemble a barbell

It is well know that chromosome regions with similar functional properties contact each other and interact. This means that chromosome domains segregated into two compartments, active and inactive. "During early embryogenesis, however, the chromosomes are organized differently," says Ahilya Sawh, first author of the study. "In the early embryo, they are organized into an unconventional barbell-like structure, with inactive compartments separated by a central active region." The researchers discovered that the nuclear lamina -- a protein mesh lining the inner surface of the cell nucleus -- is required to achieve this barbell arrangement. The lamina is attached to the inactive sections and stretches the chromosome.

Chromosomes reorganize during embryogenesis

"Only at a later stage of embryonic development, when the germ layers develop, we actually see the well-known segregation into an active and inactive region," explains Mango. "Using chromosome tracing, we were able to map the whole 3D chromosome architecture and could show for the first time that chromosomes rearrange during early development, a maturation process that requires the nuclear lamina."

The reorganization of the chromosomes accompanies cell maturation and represents a milestone in the development of a complex organism. The correct chromosomal architecture is crucial to prevent developmental disorders.


Cell Growth and Cell Division

Growth is defined as an irreversible increase in mass that is typically associated with an increase in volume. Plant cell growth is associated with meristems and must be carefully regulated in order for organogensis and histogenesis to occur in the appropriate patterns. The plant regulates growth by regulating the extensibility of its cell walls. A cell that has nonextensible cells walls can take up some water, but eventually the physical pressure of the water inside the cell pressing out on the cell wall (the turgor pressure) prevents the entry of additional water and any further change in volume. In contrast, a cell that has extensible cell walls can take up a substantial volume of water and thus increase in size. Turgor pressure that would otherwise prevent water entry momentarily decreases because the walls keep stretching.

Typically cell growth occurs in small increments: (1) wall extensibility increases, reducing turgor pressure (2) reduced turgor pressure allows water to enter the cell, increasing cell volume (3) wall extensibility decreases, allowing the cell to build up turgor and preventing further water entry and (4) the cell undergoes a cycle of synthesis of cytoplasmic and wall components, adding to the cell's mass. This cycle of incremental growth is repeated many times until the cell reaches its final size.

The plant hormones auxin and gibberellin are produced in the vicinity of the apical meristems and usually act in concert to induce cell growth. Both hormones regulate wall extensibility, but carry out this function in different ways. Auxin induces the activity of cell membrane H + adenosine triphosphatase (ATPase) molecules. Proton (H + ) extrusion lowers the pH of the cell wall, thus activating the cell wall enzyme expansin. Expansin cleaves the hydrogen bonds between two cell wall components: The celulose microfibrils and the hemicellulose molecules that link adjacent cellulose microfibrils. Breakage of these bonds allows these structural wall components to reposition themselves farther apart, increasing wall extensibility. Gibberellic acid, on the other hand, stimulates the activity of another cell wall enzyme called xyloglucan endotransglycosylase (XET). Xyloglucans are a type of hemicellulose that is cleaved by the XET enzyme. Breakage of the

Cell division and cell growth are often tightly linked. When the rate of cell division is balanced by cell growth, as in the apical meristems, average cell size does not increase. As the meristem grows away from earlier formed cells, the ratio of growth to division increases, resulting in overall cell enlargement. As the tissues mature further, cell division ceases completely, giving rise to zones of pure cell enlargement where most of the visible growth of the plant occurs. This relationship between division and growth, coupled with observations of the predictable planes of cell division during histogenesis, indicates that cell division is carefully regulated during plant development.

Molecules called cyclin-dependent kinases (CDKs) are key regulators of cell cycling (including cell division) in plants. CDKs are activated by association with a regulatory subunit called a cyclin and by fosforilação and dephosphorylation events. The plant hormone cytokinin appears to regulate the cell cycle by interacting with the CDKs. Cytokinins enhance the synthesis of the cyclin subunits that are required for the cell to enter the deoxyribonucleic acid (DNA) synthesis phase of the cell cycle. Cytokinins also enhance the CDK dephosphorylation step that is required for the cell to progress into mitosis . Both of these processes are inhibited by the hormone abscisic acid thus a ⋞velopmental tug-of-war" occurs between a division-enhancing hormone and a division-suppressing hormone. The delicate balance between them determines the rate of cell division and this type of interaction is probably typical of the hormonal regulation of many aspects of plant development.


DNA Sequencing Techniques

DNA sequencing techniques are used to determine the order of nucleotides (A,T,C,G) in a DNA molecule.

Objetivos de aprendizado

Differentiate among the techniques used to sequence DNA

Principais vantagens

Pontos chave

  • Genome sequencing will greatly advance our understanding of genetic biology and has vast potential for medical diagnosis and treatment.
  • DNA sequencing technologies have gone through at least three “generations”: Sanger sequencing and Gilbert sequencing were first-generation, pyrosequencing was second-generation, and Illumina sequencing is next-generation.
  • Sanger sequencing is based on the use of chain terminators, ddNTPs, that are added to growing DNA strands and terminate synthesis at different points.
  • Illumina sequencing involves running up to 500,000,000 different sequencing reactions simultaneously on a single small slide. It makes use of a modified replication reaction and uses fluorescently-tagged nucleotides.
  • Shotgun sequencing is a technique for determining the sequence of entire chromosomes and entire genomes based on producing random fragments of DNA that are then assembled by computers which order fragments by finding overlapping ends.

Termos chave

  • DNA sequencing: a technique used in molecular biology that determines the sequence of nucleotides (A, C, G, and T) in a particular region of DNA
  • dideoxynucleotide: any nucleotide formed from a deoxynucleotide by loss of an a second hydroxyl group from the deoxyribose group
  • em vitro: any biochemical process done outside of its natural biological environment, such as in a test tube, petri dish, etc. (from the Latin for “in glass”)

DNA Sequencing Techniques

While techniques to sequence proteins have been around since the 1950s, techniques to sequence DNA were not developed until the mid-1970s, when two distinct sequencing methods were developed almost simultaneously, one by Walter Gilbert’s group at Harvard University, the other by Frederick Sanger’s group at Cambridge University. However, until the 1990s, the sequencing of DNA was a relatively expensive and long process. Using radiolabeled nucleotides also compounded the problem through safety concerns. With currently-available technology and automated machines, the process is cheaper, safer, and can be completed in a matter of hours. The Sanger sequencing method was used for the human genome sequencing project, which was finished its sequencing phase in 2003, but today both it and the Gilbert method have been largely replaced by better methods.

Sanger Method: In Frederick Sanger’s dideoxy chain termination method, fluorescent-labeled dideoxynucleotides are used to generate DNA fragments that terminate at each nucleotide along the template strand. The DNA is separated by capillary electrophoresis on the basis of size. From the order of fragments formed, the DNA sequence can be read. The smallest fragments were terminated earliest, and they come out of the column first, so the order in which different fluorescent tags exit the column is also the sequence of the strand. The DNA sequence readout is shown on an electropherogram that is generated by a laser scanner.

Sanger Sequencing

The Sanger method is also known as the dideoxy chain termination method. This sequencing method is based on the use of chain terminators, the dideoxynucleotides (ddNTPs). The dideoxynucleotides, or ddNTPSs, differ from deoxynucleotides by the lack of a free 3′ OH group on the five-carbon sugar. If a ddNTP is added to a growing DNA strand, the chain is not extended any further because the free 3′ OH group needed to add another nucleotide is not available. By using a predetermined ratio of deoxyribonucleotides to dideoxynucleotides, it is possible to generate DNA fragments of different sizes when replicating DNA in vitro.

A Sanger sequencing reaction is just a modified in vitro DNA replication reaction. As such the following components are needed: template DNA (which will the be DNA whose sequence will be determined), DNA Polymerase to catalyze the replication reactions, a primer that basepairs prior to the portion of the DNA you want to sequence, dNTPs, and ddNTPs. The ddNTPs are what distinguish a Sanger sequencing reaction from just a replication reaction. Most of the time in a Sanger sequencing reaction, DNA Polymerase will add a proper dNTP to the growing strand it is synthesizing in vitro. But at random locations, it will instead add a ddNTP. When it does, that strand will be terminated at the ddNTP just added. If enough template DNAs are included in the reaction mix, each one will have the ddNTP inserted at a different random location, and there will be at least one DNA terminated at each different nucleotide along its length for as long as the in vitro reaction can take place (about 900 nucleotides under optimal conditions.)

The ddNTPs which terminate the strands have fluorescent labels covalently attached to them. Each of the four ddNTPs carries a different label, so each different ddNTP will fluoresce a different color.

After the reaction is over, the reaction is subject to capillary electrophoresis. All the newly synthesized fragments, each terminated at a different nucleotide and so each a different length, are separated by size. As each differently-sized fragment exits the capillary column, a laser excites the flourescent tag on its terminal nucleotide. From the color of the resulting flouresence, a computer can keep track of which nucleotide was present as the terminating nucleotide. The computer also keeps track of the order in which the terminating nucleotides appeared, which is the sequence of the DNA used in the original reaction.

Second Generation and Next-generation Sequencing

The Sanger and Gilbert methods of sequencing DNA are often called “first-generation” sequencing because they were the first to be developed. In the late 1990s, new methods, called second-generation sequencing methods, that were faster and cheaper, began to be developed. The most popular, widely-used second-generation sequencing method was one called Pyrosequencing.

Today a number of newer sequencing methods are available and others are in the process of being developed. These are often called next-generation sequencing methods. The most widely-used sequencing method currently is one called Illumina sequencing (after the name of the company which commercialized the technique), but numerous competing methods are in the developmental pipeline and may supplant Illumina sequencing.

In Illumina sequencing, up to 500,000,000 separate sequencing reactions are run simultaneously on a single slide (the size of a microscope slide) put into a single machine. Each reaction is analyzed separately and the sequences generated from all 500 million DNAs are stored in an attached computer. Each sequencing reaction is a modified replication reaction involving flourescently-tagged nucleotides, but no chain-terminating dideoxy nucleotides are needed.

When the human genome was first sequenced using Sanger sequencing, it took several years, hundreds of labs working together, and a cost of around $100 million to sequence it to almost completion. Next generation sequencing can sequence a comparably-sized genome in a matter of days, using a single machine, at a cost of under $10,000. Many researchers have set a goal of improving sequencing methods even more until a single human genome can be sequenced for under $1000.

Shotgun Sequencing

Sanger sequence can only produce several hundred nucleotides of sequence per reaction. Most next-generation sequencing techniques generate even smaller blocks of sequence. Genomes are made up of chromosomes which are tens to hundreds of millions of basepairs long. They can only be sequenced in tiny fragments and the tiny fragments have to put in the correct order to generate the uninterrupted genome sequence. Most genomic sequencing projects today make use of an approach called whole genome shotgun sequencing.

Whole genome shotgun sequencing involves isolating many copies of the chromosomal DNA of interest. The chromosomes are all fragmented into sizes small enough to be sequenced (a few hundred basepairs) at random locations. As a result, each copy of the same chromosome is fragmented at different locations and the fragments from the same part of the chromosome will overlap each other. Each fragment is sequenced and sophisticated computer algorithms compare all the different fragments to find which overlaps with which. By lining up the overlapped regions, a process called tiling, the computer can find the largest possible continuous sequences that can be generated from the fragments. Ultimately, the sequence of entire chromosomes are assembled.

Whole genome shotgun sequencing.: In shotgun sequencing, multiple copies of the same chromosome are isolated and then fragmented in random locations. The different copies of the chromosome end up generating different length fragments. When the complete collection of fragments has been sequenced, comparing the sequences of all the fragments will reveal which fragments have ends that overlap with other fragments. The complete sequence from one end of the original DNA to the other can be assembled by following the sequence from the first overlapping fragment to the last.

Genome sequencing will greatly advance our understanding of genetic biology. It has vast potential for medical diagnosis and treatment.


The Late Embryogenesis Abundant Protein Family in Cassava ( Manihot esculenta Crantz): Genome-Wide Characterization and Expression during Abiotic Stress

Late embryogenesis abundant (LEA) proteins, as a highly diverse group of polypeptides, play an important role in plant adaptation to abiotic stress however, LEAs from cassava have not been studied in cassava. In this study, 26 LEA members were genome-wide identified from cassava, which were clustered into seven subfamily according to evolutionary relationship, protein motif, and gene structure analyses. Chromosomal location and duplication event analyses suggested that 26 MeLEAs distributed in 10 chromosomes and 11 MeLEA paralogues were subjected to purifying selection. Transcriptomic analysis showed the expression profiles of MeLEAs in different tissues of stem, leaves, and storage roots of three accessions. Comparative transcriptomic analysis revealed that the function of MeLEAs in response to drought may be differentiated in different accessions. Compared with the wild subspecies W14, more MeLEA genes were activated in cultivated varieties Arg7 and SC124 after drought treatment. Diversos MeLEA genes showed induction under various stresses and related signaling treatments. Taken together, this study demonstrates the transcriptional control of MeLEAs in tissue development and the responses to abiotic stress in cassava and identifies candidate genes for improving crop resistance to abiotic stress.

Palavras-chave: abiotic stress cassava characterization genome-wide analysis late embryogenesis abundant (LEA) protein.

Declaração de conflito de interesse

Os autores declaram não haver conflito de interesses.

Bonecos

Evolutionary analysis of the LEAs…

Evolutionary analysis of the LEAs from cassava, rice, and Arabidopsis . A total…

The conserved motifs of the…

The conserved motifs of the MeLEAs according to the evolutionary classification. The conserved…

The exon-intron structure of the…

The exon-intron structure of the MeLEAs based on the evolutionary relationship. Exon-intron analysis…

Distribution of the MeLEAs on…

Distribution of the MeLEAs on chromosomes. The 26 MeLEAs were mapped to 10…

Segmental duplication of LEA genes…

Segmental duplication of LEA genes in cassava. Chromosomes are illustrated in different colour…

Expression patterns of MeLEAs in…

Expression patterns of MeLEAs in different tissues and in response to drought stress.…

Expression profiles of the MeLEAs…

Expression profiles of the MeLEAs in leaves under salt, osmotic, cold, H 2…


Assista o vídeo: EMBRIOLOGIA - DESENVOLVIMENTO EMBRIONÁRIO. Biologia com Samuel Cunha (Novembro 2021).