Em formação

Um gene e muitas proteínas


Imagine um gene com $ n $ exons e $ m $ introns. Quantas proteínas são possíveis desse gene? Todas as proteínas seriam isoformas?


Posso estar errado, mas os números $ n $ e $ m $ não estão conectados como $ n = m + 1 $?

A resposta parece ser combinatória: quantas combinações de $ n $ objetos podem ser montadas sob certas restrições? Ou seja, quantas isoformas determinado gene pode ter.

As restrições incluem: quantas junções exon-íntron no códon (ou precisamente entre os códons), quantos exons contêm realmente a sequência codificadora de proteínas do mRNA (alguns exons estão codificando a região não traduzida, 3'- ou 5'-UTR, por exemplo) , como determinado gene processa splicing alternativo.

Portanto, como você pode ver, a resposta dependerá muito da sequência de um determinado gene. Pelo que eu sei, o número máximo de isoformas é limitado por 5, embora haja genes com centenas de exons.


Para a maioria dos genes eucarióticos (e alguns procarióticos), o RNA inicial que é transcrito de um modelo de DNA de gene & # 8217s deve ser processado antes de se tornar um RNA mensageiro maduro (mRNA) que pode direcionar a síntese de proteínas. Desta forma, o mRNA primário transcrição torna-se o transcrito de mRNA maduro. Este processo é conhecido como emenda.
O splicing de RNA envolve a remoção ou & # 8220splicing & # 8221 de certas sequências no mRNA, referidas como sequências intervenientes, ou íntrons. O mRNA final ou maduro consiste, portanto, nas sequências restantes, chamadas exons, que são conectados uns aos outros durante o processo de emenda.
Emendando diferentes combinações de exon juntos podem levar à produção de uma variedade de proteínas diferentes a partir de um único gene. No diagrama abaixo, três proteínas diferentes foram produzidas a partir do mesmo gene, como resultado da combinação de diferentes exons.

Exemplos de genes onde o splicing alternativo leva à produção de diferentes produtos de proteína incluem o gene CGRP (Calcitonin Gene Related Peptide), que pode produzir CGRP ou calcitonina, dependendo de qual atividade de splicing ocorre. Normalmente, o CGRP, um neurotransmissor, é o produto encontrado nos neurônios e a calcitonina, um hormônio relacionado com a regulação dos níveis de cálcio no sangue, é produzido em células não neuronais, como a glândula tireóide.


Conceito de polipeptídeo de um gene

É fato que caracteres hereditários são mantidos e transmitidos de uma geração a outra por meio de moléculas de DNA, porque o DNA pode se duplicar e as moléculas duplicadas podem ser transmitidas aos descendentes. A atividade geral dos genes produz a expressão de traços hereditários no organismo.

Agora as principais questões são como os genes (moléculas de DNA) governam os processos biossintéticos das células e como esses genes controlam as propriedades fenotípicas dos organismos. As respostas a essas questões básicas foram buscadas na relação entre genes e reações bioquímicas específicas.

As mudanças hereditárias que os geneticistas primeiro estudaram eram necessariamente aquelas que podiam ser mais facilmente observadas. Um médico inglês, Sir Archibald Garrod, fez um estudo penetrante de algumas doenças hereditárias raras em humanos e reconheceu que certas deficiências bioquímicas eram causadas por anormalidades enzimáticas. Com base em seus estudos sobre doenças congênitas (existentes desde o nascimento) de humanos.

Sir Garrod sugeriu com segurança a relação entre genes e enzimas. A ideia de que a ação de um gene está relacionada à formação de uma enzima específica foi ignorada pela maioria dos geneticistas por cerca de trinta anos.

James B. Summer da Cornel University e John H. North Rop do Rockefeller Institute entre 1926 e 1930 mostraram que as enzimas são proteínas. A ideia sobre a relação gene e enzima foi revivida por George W. Beadle e Edward L. Tatum (1941).

A partir dos estudos sobre as anormalidades metabólicas hereditárias do fungo Neurospora crassa, eles concluíram que todas as etapas biossintéticas intermediárias de um processo metabólico eram governadas por genes distintos. Beadle e Tatum formularam o conceito de um gene - uma enzima em 1944. A teoria afirma que um gene exerce sua influência no fenótipo por meio de seu papel na produção de uma enzima.

Beadle e Tatum estudaram a ação do gênio em neurospora crassa. Normalmente, o fungo pode crescer em meio de cultura mínimo contendo ágar, sacarose, nitrato, minerais inorgânicos e a única vitamina biotina. Isso significa que este organismo pode sintetizar todas as outras vitaminas e aminoácidos necessários ao seu metabolismo.

Quando os conídios desse fungo são tratados com agentes mutagênicos (digamos, raios-X), alguns deles tornam-se incapazes de crescer em meio mínimo.

Esses esporos mutantes são então testados sistematicamente adicionando vitaminas, aminoácidos, etc., ao meio mínimo para determinar que substância ou substâncias eles são incapazes de sintetizar. Os mutantes podem ser cruzados com o tipo normal ou selvagem e seus produtos da meiose, os 8 ascósporos, podem ser testados individualmente quanto às suas necessidades nutricionais.

Se uma cepa que requer arginina (a -) é cruzada com a cepa normal (a +), todos os 8 ascósporos podem crescer em um meio contendo arginina, mas apenas 4 ascósporos podem crescer em um meio sem arginina. Isso indica que um único gene sofreu mutação.

A arginina que requer mutante pode ser mais complexa porque, como mostrado na cadeia a seguir, a síntese de arginina envolve uma cadeia de etapas intermediárias em que cada reação é controlada por um gene. Três etapas foram observadas na conversão do ácido glutâmico em arginina e cada uma delas foi controlada por um gene.

A mutação de um único gene leva à supressão de uma etapa. Isso pode ser demonstrado pelo crescimento de mutantes em meio mínimo com aquela substância que não pode ser sintetizada. Em vários estudos bioquímicos, os extratos de neurospora mostraram que o triptofano, como a arginina, é sintetizado em uma sequência de reações químicas.

Mutações no triptofano requerem mapeamento de cepas em vários locais genéticos. Cada mutante é defeituoso em uma das etapas da sequência biossintética. A mutação em uma região cromossômica específica é refletida pela perda de atividade de uma enzima. Assim, a relação básica do gene enzima é clara.

Pesquisas recentes verificaram a conclusão básica sobre a relação gene-enzima. Atualmente, o conceito de Beadle and Tatum & # 8217s de um gene-uma enzima foi revisado para um gene-um polipeptídeo de cadeia (proteína) em vista da complexidade nas estruturas e funções das enzimas. As pesquisas modernas provaram que o gene é o DNA que está diretamente relacionado com a síntese de determinada proteína.

A expressão de genes por transcrição genética em sequências complementares de RNA e subsequente tradução da informação hereditária contida no mRNA em cadeia polipeptídica que forma o produto final da ação do gene é chamada de ação do gene primário.

A análise além da ação primária do gene é muito complicada pelo estado integrado do metabolismo celular e de desenvolvimento, pelo afastamento do fenótipo da ação do gene primário e o número de etapas intervenientes influenciadas por outros genes (interação do gene) e por fatores ambientais ( ativação do gene).

Em procariotas, a transcrição e tradução da informação genética ocorre em um compartimento de célula, enquanto em eucariotos os dois processos são realizados em dois compartimentos separados de uma célula, isto é, núcleo e citoplasma. Além disso, algumas informações genéticas (DNA de organela) também estão presentes e são utilizadas em certas organelas citoplasmáticas, particularmente plastídeos e mitocôndrias.

A operação dos genomas nucleares e extra-nucleares é coordenada por algum mecanismo que ainda não é totalmente compreendido. A regulação genética da ação do gene primário no sentido estrito do termo ocorre apenas no nível da transcrição.

Toda a série de processos bioquímicos que conduzem de um gene à expressão fenotípica pela qual ele é reconhecido é chamada de sistema de ação gênica (Waddington, 1962).

Assim, o gene tem duas funções essenciais:

(i) Replicação ou auto-reprodução e

(ii) Intervenção no mecanismo pelo qual o fenótipo do organismo é produzido em um determinado ambiente (fenogênese).

Ação do gene primário (síntese de genes e proteínas):

O genótipo (material genético total) da célula determina o tipo potencial de proteínas e também determina suas quantidades relativas na célula. As proteínas atuam como componentes estruturais das células que constituem a estrutura do corpo vivo. Tipos especiais de proteínas que atuam como catalisadores em provocar inúmeras reações químicas e as controlam com precisão são chamados de enzimas.

Na verdade, todas as funções do sistema vivo são realizadas por proteínas. Assim, tanto do ponto de vista estrutural quanto funcional, as proteínas são constituintes importantes das células, ou, em outras palavras, as proteínas constituem a maquinaria molecular fundamental da célula.

Os genes atuam controlando a estrutura e a taxa de produção de proteínas específicas (enzimas). Os genes são segmentos da molécula de DNA. O DNA de cada gene forma uma fita de mRNA complementar que se liga aos ribossomos, onde serve para codificar uma proteína (enzima).

A sequência de aminoácidos na proteína (isto é, a estrutura da proteína ou enzima) é determinada pela sequência de nucleotídeos no mRNA que por sua vez é determinada pela sequência de nucleotídeos do DNA (gene).

Uma série de reações controladas por enzimas determinam as características de um organismo. Uma vez que a estrutura dessas enzimas é controlada por genes, segue-se que os genes determinam as características.

Todos os eventos podem ser resumidos da seguinte forma:

Os blocos de construção básicos das proteínas são os aminoácidos. Com exceção da prolina, todos os outros aminoácidos têm uma estrutura comum que consiste em um átomo de carbono central (o carbono a) ao qual está ligado o grupo a-amino (- NH2), um α-carboxil (-COOH) e um átomo de hidrogênio (próton). A outra parte do aminoácido é chamada de grupo R, que varia de um aminoácido para outro. É o grupo R que dá ao aminoácido suas propriedades químicas.

A fórmula geral de um aminoácido é ilustrada abaixo:

As proteínas são moléculas poliméricas e são formadas pela combinação de muitas moléculas de aminoácidos em sequência linear. Os aminoácidos são unidos uns aos outros por meio de um tipo especial de ligação, chamada ligação peptídica.

Esta ligação peptídica é estabelecida pela eliminação de uma molécula de água entre carboxil (- COOH) e amino (- NH2) grupos de aminoácidos adjacentes. A ligação peptídica é do tipo amida (- CONH -).

Um exemplo de formação de ligação peptídica é dado abaixo:

Desta forma, muitos aminoácidos são unidos ponta a ponta por ligações peptídicas formando uma longa cadeia. Uma extremidade da cadeia de proteína contém amino (NH2) (extremidade amino) e o outro contém o grupo carboxílico (- COOH) (extremidade carboxílica).

A cadeia linear de aminoácidos formada desta maneira é denominada como cadeia polipeptídica ou proteína. A formação da ligação polipeptídica requer a ação da enzima peptídeo polimerase e do composto trifosfato de guanosina (GTP) rico em energia.

No sistema vivo, cerca de 20 dos 22 aminoácidos diferentes são conhecidos por tomarem parte na síntese de proteínas. Eles são mencionados na Tabela 20.1.

O peso molecular da proteína depende do comprimento da molécula e do número de aminoácidos nela.

As proteínas são reconhecidas por quatro níveis estruturais:

É a sequência linear de aminoácidos em uma cadeia polipeptídica. A cadeia polipeptídica recém-sintetizada é chamada de proteína primária.

(ii) Estrutura secundária:

Quando as cadeias polipeptídicas primárias são torcidas ou enroladas em uma hélice, ligações eletrostáticas são formadas entre o grupo & # 8211 COOH e NH2 O grupo e as ligações de hidrogênio se desenvolvem entre os aminoácidos que se enfrentam devido ao enrolamento. Essas proteínas são chamadas de proteínas secundárias. Em proteínas biológicas, as cadeias polipeptídicas permanecem enroladas em uma forma semelhante ou em forma de p e, portanto, são chamadas de hélice e hélice P, respectivamente.

(iii) Estrutura terciária:

Quando a cadeia polipeptídica muito longa torna-se extensivamente dobrada e enrolada a fim de comprimir a longa cadeia espiral em uma forma globular e, subsequentemente, certas ligações intracadeia, especialmente pontes dissulfeto (- S & # 8211 S -) entre os resíduos de cisteína da cadeia polipeptídica ao longo de uma vasta superfície para criar interstícios entre as cadeias polipeptídicas, uma estrutura terciária de proteína é resultante.

A estrutura terciária de uma proteína frequentemente coloca grupos hidrofóbicos (que odeiam água) do lado de fora e grupos hidrofílicos (que amam a água) do lado de dentro. Os exemplos são a enzima insulina, a enzima ribonuclease, etc. As proteínas mais terciárias atuam como catalisadores ou enzimas.

(iv) Estrutura quaternária:

A associação de mais de uma cadeia polipeptídica para formar uma unidade estável corresponde à estrutura quaternária. As proteínas quaternárias resultam quando ligações entre cadeias ou pontes são estabelecidas de modo a ligar duas ou mais cadeias polipeptídicas independentes. A maioria das proteínas com peso molecular superior a 20.000 possuem estrutura quaternária e são compostas por mais de uma cadeia polipeptídica.

O melhor exemplo de proteína quaternária é a hemoglobina (peso molecular 1,00.000), que é formada por duas cadeias α e duas cadeias P. A individualidade química e biológica de uma proteína depende da ordem em que os aminoácidos estão ligados a ela. Portanto, em uma determinada cadeia de proteínas, os aminoácidos são organizados na ordem correta.

Mas esses aminoácidos podem ser arranjados com tanta precisão? Sim, é verdade, e essa precisão na sequência de aminoácidos durante a síntese da proteína é controlada pela molécula de DNA que ela mesma não está diretamente envolvida na síntese. Na verdade, as moléculas de DNA enviam sua mensagem aos locais de síntese de proteínas por meio de um tipo especial de RNA chamado RNA mensageiro ou mRNA.

A informação para a estrutura do polipeptídeo (proteína) é armazenada em uma cadeia polinucleotídica. A sequência de bases em uma cadeia polinucleotídica determina a sequência de aminoácidos em um polipeptídeo específico.

A transferência de informação do DNA para o wRNA e depois do wRNA para a proteína (sequência de aminoácidos) é unidirecional de acordo com Francis Crick (1956) e não flui na direção reversa, isto é, da proteína para o RNA para o DNA.

A molécula de DNA recebe as informações para sua própria replicação. Francis Crick denominou esse fluxo de informações do DNA para o RNA e para a molécula de proteína como dogma central. Isso é mostrado na Fig. 20.1.

O dogma central da biologia molecular, portanto, envolve os seguintes três processos principais para preservação e transmissão da informação genética:

Um processo que é indicado pela seta que envolve o DNA, significando que o DNA é o modelo para a auto-replicação.

A seta entre o DNA e o RNA indica que todos os RNAs celulares são sintetizados em modelos de DNA.

Este é o processo pelo qual todas as proteínas são determinadas por modelos de RNA nos ribossomos.

Em certas células infectadas com vírus de RNA, por exemplo, TMV, φMS2, φR17 etc., o RNA viral produz novas cópias de si mesmo com a ajuda da RNA replicase. O RNA genético de alguns vírus, por exemplo, RSV, às vezes atua como um modelo para a produção de fita complementar de DNA (transcrição reversa).

Com base nisso, Barry Commoner (1968), entretanto, sugeriu que o fluxo de informações deveria ser cíclico, e não de uma maneira, mas tais reversões do fluxo normal de informações são eventos raros.


Uma flexibilidade secreta encontrada nos projetos da vida

A lombriga milimétrica Caenorhabditis elegans tem cerca de 20.000 genes - e você também. Claro, apenas o humano nesta comparação é capaz de criar um sistema circulatório ou um soneto, um estado de coisas que tornou essa equivalência genética um dos insights mais confusos que surgiram do Projeto Genoma Humano. Mas há maneiras de explicar parte de nossa complexidade além do nível dos genes e, como mostra um novo estudo, elas podem ser muito mais importantes do que as pessoas supõem.

Por muito tempo, uma coisa parecia bastante sólida na mente dos biólogos: cada gene no genoma produzia uma proteína. O código do gene era a receita para uma molécula que entraria na célula e faria o trabalho necessário, fosse gerar energia, eliminar resíduos ou qualquer outra tarefa necessária. A ideia, que data de um artigo de 1941 de dois geneticistas que mais tarde ganharam o Prêmio Nobel de Medicina por seu trabalho, tem até um nome conciso: “um gene, uma proteína”.

Ao longo dos anos, os biólogos perceberam que as regras não eram tão simples. Descobriu-se que alguns genes estavam sendo usados ​​para fazer vários produtos. No processo de passagem do gene à proteína, a receita nem sempre foi interpretada da mesma forma. Algumas das proteínas resultantes pareciam um pouco diferentes das outras. E às vezes essas mudanças importavam muito. Existe um gene, famoso em certos círculos de biólogos, cujas duas proteínas fazem coisas completamente opostas. Um forçará uma célula a cometer suicídio, enquanto o outro interromperá o processo. E em um dos exemplos mais extremos conhecidos pela ciência, um único gene da mosca da fruta fornece a receita para mais de 38.000 proteínas diferentes.

Mas esses são casos dramáticos. Nunca ficou claro o quão comum é para os genes produzirem proteínas múltiplas e o quanto essas diferenças importam para o funcionamento diário da célula. Muitos pesquisadores presumiram que as proteínas feitas por um determinado gene provavelmente não diferem muito em suas funções. É uma suposição razoável - muitos testes em pequena escala de proteínas irmãs não sugeriram que deveriam ser totalmente diferentes.

Ainda é uma suposição, entretanto, e testá-la é um grande esforço. Os pesquisadores teriam que fazer um inventário tecnicamente complicado das proteínas em uma célula e executar vários testes para ver o que cada uma faz. Em um artigo recente em Célula, no entanto, pesquisadores do Dana-Farber Cancer Institute em Boston e seus colaboradores revelam os resultados de tal esforço. Eles descobriram que, em muitos casos, as proteínas feitas por um único gene não são mais semelhantes em seu comportamento do que as proteínas feitas por genes completamente diferentes. As proteínas irmãs geralmente agem como estranhas. É um insight que abre um novo conjunto interessante de possibilidades para pensar sobre como a célula - e o corpo humano - funciona.

Compartilhe este artigo

Copiado!

Boletim de Notícias

Receba a Quanta Magazine entregue na sua caixa de entrada

Lucy Reading-Ikkanda para a Quanta Magazine

As proteínas realizam grande parte dos negócios diários de uma célula. As mensagens são enviadas de uma parte da célula para outra, por exemplo, por uma brigada de balde de proteína - uma se liga a outra, que então liga outra, que então modifica outra, e assim por diante, culminando em uma série de alterações que entregam o mensagem. A forma particular de uma proteína ajuda a determinar a que ela pode se ligar e, portanto, o que pode fazer. Descobrir a quais proteínas uma outra proteína se manterá é frequentemente o primeiro passo para entender seu papel na célula.

Marc Vidal, biólogo da Dana-Farber, tem uma longa história de rastreamento dessas parcerias de proteínas em grande escala. Seu laboratório procura ver como um grande número de proteínas interage umas com as outras e como essas interações podem mudar em alguém com uma doença. Mas pode ser frustrante fazer isso quando você não tem certeza se deve assumir que as proteínas do mesmo gene fazem a mesma coisa. Mesmo que entendamos perfeitamente uma sequência particular do genoma, "ainda não temos um conhecimento perfeito dos componentes que são codificados pelo genoma", disse Vidal. “E a razão é que as boas e velhas regras não valem.”

Para ver com que frequência as regras antigas podem ser quebradas, o laboratório Vidal e seus colaboradores reuniram um conjunto de proteínas feitas de cerca de 1.500 genes - cerca de 8% de nosso complemento total. Eles determinaram quais proteínas vinham dos mesmos genes, descobrindo que cerca de 500 dos genes formavam pelo menos dois. Em seguida, eles executaram vários testes nos quais cada uma das proteínas teve a chance de se ligar a mais de 15.000 outras proteínas frequentemente encontradas na célula. Finalmente, eles compararam os resultados de cada proteína aos de suas proteínas irmãs - todas aquelas proteínas feitas pelo mesmo gene. Com que frequência as proteínas irmãs se ligam aos mesmos parceiros? Quantas vezes eles não fizeram?

A resposta foi bastante inesperada. “Foi tão impressionante”, disse David Hill, um cientista da Dana-Farber, que pensou: “Isso não pode estar certo, temos que descobrir o que fizemos de errado”. Mas os resultados resistiram ao estímulo. Eles descobriram que 61 por cento dos pares de proteínas de irmãos compartilham algumas, mas não todas as suas interações. Além disso, quase um em cada cinco pares de proteínas de irmãos não tinha nada em comum. Comparando as proteínas em seu conjunto de dados com proteínas feitas por genes separados, a equipe descobriu que em muitos casos as interações das proteínas irmãs eram tão diferentes como se elas tivessem origens totalmente não relacionadas.

Lucy Reading-Ikkanda para a Quanta Magazine

Como este artigo sugere que funções diferentes para proteínas do mesmo gene são relativamente comuns, isso implica que o fenômeno provavelmente importa para a vida cotidiana da célula, disse Neil Kelleher, biólogo da Northwestern University que não esteve envolvido na pesquisa. “Não sabemos quanto da complexidade das células e tecidos do nosso corpo decorre disso”, disse ele. Mas é possível que essas diferentes proteínas façam parte do que está por trás dos diferentes tipos de células do corpo. Talvez as células do pulmão prefiram fazer uma proteína, enquanto outra proteína predomina em uma célula do coração.

Algumas doenças podem ter suas raízes em uma proteína dominando onde não deveria. Por exemplo, um artigo de 2014 sugere que certas formas alternativas de proteínas podem desempenhar um papel no autismo. Além disso, a nova pesquisa sugere que, quando os pesquisadores estão tentando entender as bases biológicas de uma doença, eles não devem presumir que será o suficiente para localizar os genes envolvidos. Se um gene produz várias proteínas, os biólogos precisarão deduzir qual proteína é responsável pelo problema.

No entanto, resta ver o quão relevantes as novas descobertas serão para a compreensão do comportamento celular típico. Stefan Stamm, biólogo da Universidade de Kentucky, observa que o estudo não avalia se todas as interações de proteínas observadas acontecem regularmente na vida real. Trabalhos anteriores sugerem que algumas dessas proteínas existem apenas em pequeno número na natureza. Mas Stamm concorda que não sabemos muito sobre a variedade de proteínas no mundo. “Pessoalmente, acho que existem mais [versões alternativas] do que estão sendo relatadas”, disse ele.

Hill estima que a equipe aumentou o número de genes conhecidos por fazerem várias proteínas substancialmente. Mas “esta ainda é a ponta do iceberg”, observa ele. A equipe começou com apenas 1.500 genes. Observar 10.000 - metade de todos os genes humanos - deixaria mais claro o quão difundidos os genes multiproteínas estão. A equipe também pode optar por olhar mais profundamente para um pequeno punhado de genes, obtendo uma imagem melhor do que sua multiplicidade de proteínas está fazendo e observar o quão importante eles realmente são dentro da célula. De qualquer forma, ainda há muito mais para saber.

A complexidade implícita nesta descoberta pode parecer um pouco esmagadora: como podemos começar a desvendar a biologia das células e tecidos se há tantas proteínas diferentes vindo dos genes que, não muito tempo atrás, as pessoas pensavam que poderiam fazer apenas uma? Mas Kelleher disse que, de certa forma, esses resultados são tranquilizadores. Teoricamente, levando em consideração todas as maneiras como uma receita fornecida por um gene pode ser interpretada - todas as chances de substituir o açúcar por sal, digamos, ou todas as vezes em que o bicarbonato de sódio pode substituir o fermento em pó - pode haver até 50 proteínas diferentes por gene.

Este estudo sugere que, na realidade, apenas uma pequena fração dessas possibilidades é feita. E apenas algumas dessas proteínas se comportam de maneira diferente umas das outras. “As pessoas dizem‘ Oh meu Deus, é tão vasto ’. Mas podemos medir isso”, disse ele, esperançoso. “Não é tão complicado a ponto de ser desconhecido.”


Termos chave

  • DNA: um biopolímero de ácidos desoxirribonucléicos (um tipo de ácido nucléico) que possui quatro grupos químicos diferentes, chamados de bases: adenina, guanina, citosina e timina
  • RNA mensageiro: O RNA mensageiro (mRNA) é uma molécula de RNA que codifica um produto químico & ldquoblueprint & rdquo para um produto proteico.
  • proteína: qualquer uma das inúmeras moléculas grandes e complexas produzidas naturalmente compostas por uma ou mais longas cadeias de aminoácidos, nas quais os grupos de aminoácidos são mantidos juntos por ligações peptídicas

Transcrição

O RNA é muito semelhante ao DNA, com as seguintes exceções:

é de cadeia simples | tem uracila em vez de timina | tem o açúcar ribose, em vez de desoxirribose

A regra do par de bases é seguida durante a transcrição, exceto, em vez de emparelhar timina com adenina, ao criar uma fita de RNA, uracila é usada

Cadeia de DNA: T G C A T C A G A
Cadeia de RNA: A C G U A G U C U

Veja a seguinte animação: Transcrição

A transcrição começa na área do DNA que contém o gene. Cada gene possui três regiões:

1. Promotor - liga ou desliga o gene, define o início de um gene
2. Região de codificação - contém as informações sobre como construir a proteína
3. Sequência de terminação - sinaliza o fim do gene

A RNA polimerase é responsável por ler o gene e construir a fita de mRNA. Ele lê apenas a fita de 3 'a 5'.
Introns - áreas do RNA que não serão expressas ("DNA lixo") e são unidas
Exons - áreas de RNA que serão expressas


Ainda confuso: Verifique estas animações:


Por que tantos cientistas interpretam mal o Dogma Central da Biologia Molecular?

Os cientistas são pessoas cuidadosas que não fazem afirmações sem conhecer os fatos. Eles se esforçam para acertar as coisas. Portanto, pensamos em esperança.

Mas há um caso muito curioso em que cientistas inteligentes e bem informados parecem entender as coisas erradas com uma frequência alarmante. É bastante interessante, porque o mal-entendido não é tão difícil de evitar. É um mistério por que os cientistas continuam reprovando. Em uma reviravolta de ironia diabólica, o próprio artigo publicado para demolir explicitamente o mal-entendido é frequentemente citado em apoio disso!

Estou pensando no assim chamado Dogma Central da Biologia Molecular, uma declaração sobre o fluxo de informações entre DNA, RNA e proteína. Foi publicado em 1958 por Francis Crick, co-descobridor da estrutura em dupla hélice do DNA, ganhador do Prêmio Nobel de 1962 e um verdadeiro gigante da ciência do século XX.

A incompreensão do Dogma Central pode ser expressa de diferentes maneiras. Alega-se que, por exemplo:

  • O Dogma Central é uma simplificação, pois agora existem muitas exceções conhecidas a ele.
  • A presença de loops de feedback na sinalização celular a invalida.
  • Fenômenos como a regulação e expressão de RNA não codificantes o violam.
  • É amplamente válido para procariotos, mas não para eucariotos devido à regulação genética mais complexa nestes últimos.

Todas essas afirmações estão erradas. Não sobre os fatos dos fenômenos biológicos em si, mas na afirmação de que afetam o Dogma Central.

O que diz o Dogma Central? Aqui está a declaração completa do artigo de Crick & # 8217s 1958 (Symp. Soc. Exp. Biol. 1958, vol 12, pp 138-163):

O Dogma Central

Isso afirma que uma vez que a informação & # 8216 & # 8217 passou para a proteína não pode sair de novo. Em mais detalhes, a transferência de informações do ácido nucleico para o ácido nucleico ou do ácido nucleico para a proteína pode ser possível, mas a transferência da proteína para a proteína ou da proteína para o ácido nucleico é impossível. Informação significa aqui o preciso determinação da sequência, quer de bases no ácido nucleico, quer de resíduos de aminoácidos na proteína.

É importante notar que, como afirmado aqui, o Dogma Central ainda hoje está exatamente correto! Nada nesta declaração mostrou estar errado.

Aliás, o papel que contém a primeira afirmação do Dogma Central é um verdadeiro fogo de artifício de ideias, interpretações e hipóteses. É uma alegria ler. É um instantâneo de um campo científico em um momento de fascinante confusão e progresso. Para ter certeza, ele apresenta uma série de hipóteses que se revelaram totalmente erradas ou sutilmente erradas. Mas o Dogma Central não é um deles.

Em 1970, Crick publicou um artigo (Nature 1970, vol 227, número 5258, pp 561-563) para combater explicitamente os conceitos errôneos generalizados do Dogma Central. É este artigo que é tão frequentemente citado em apoio às mesmas interpretações equivocadas do Dogma Central que Crick tentou erradicar. Raramente um artigo científico brilhante falhou tão miseravelmente! Referindo-se a um artigo contendo o mal-entendido, ele escreveu:

Não é a primeira vez que a ideia do dogma central é mal compreendida, de uma forma ou de outra. Neste artigo, explico por que o termo foi originalmente introduzido, seu verdadeiro significado, e declaro por que considero que, bem compreendido, ainda é uma ideia de fundamental importância.

E ele ilustrou o Dogma Central da seguinte maneira:

A mensagem essencial desta imagem é a falta de setas de proteína para RNA, DNA ou proteína. Crick escreveu:

Estas são as três transferências que os postulados do dogma central nunca ocorrem:

Proteína - & gt Proteína
Proteína - & gt DNA
Proteína - & gt RNA

Ou, em outras palavras, não há enzima que possa ser chamada de & # 8221 translatase reversa dirigida por proteína & # 8221 ou & # 8221ribossomo reverso & # 8221, nem há qualquer & # 8221 polimerase de proteína dirigida por proteína & # 8221. Isso é perfeito e exatamente verdadeiro até hoje.

Qual é a base do mal-entendido? Por que tantos acreditam que o Dogma Central foi substituído? Basicamente, é uma confusão de fluxo de informações na cela com fluxo de informação das sequências de DNA em RNA e proteína.

O erro consiste em acreditar que o Dogma Central trata do fluxo de informações em geral na célula. Não é. O Dogma Central é sobre a sequência de informações específicas do DNA, que é transformada em RNA e proteína.

Assim que se tornou razoavelmente claro quais papéis desempenhavam o DNA e as proteínas, nem Crick nem ninguém realmente considerou que o fluxo de informações na célula não envolvia proteínas que afetassem a expressão do DNA. Na verdade, a noção de que qualquer cientista experiente, quanto mais Francis Crick, poderia ter acreditado que a expressão do DNA pode ocorrer sem ser regulada direta ou indiretamente pelo ambiente é, francamente, ridícula.

Recentemente, deparei com vários casos de mal-entendidos sobre o Dogma Central no doutorado. teses. Na Suécia, um Ph.D. tese nas ciências biomédicas na maioria das vezes consiste em 3-5 artigos científicos regulares, já publicados em revistas científicas, ou na forma de manuscrito destinado a publicação. Além disso, a tese também contém uma introdução que coloca os resultados de artigos científicos regulares em perspectiva. Esta introdução geralmente contém uma breve visão geral dos fatos fundamentais da biologia molecular e da bioquímica. Sua função é em parte mostrar que o aluno entende da área em geral. É aqui que o mal-entendido geralmente aparece.

Citarei aqui um recente Ph.D. tese que mostra claramente o mal-entendido. The name of the author is uninteresting, since I am concerned about the general phenomenon, not the individual scientist.

The central dogma of molecular biology […] is often stated in its popular form as ”DNA is transcribed into RNA and RNA is translated into proteins in the ribosomes”. The dogma in this form postulates that the information flow in a cell is essentially a one way process […]

Exceptions to this central flow are however numerous […]

Moreover, may proteins called transcription factors [..] bind to the DNA and influence the rate of transcription of genes, thus modifying how information is read.

In this example, there is even an illustration showing ”a more realistic representation” than the Central Dogma. Which is incorrect, because Crick’s Central Dogma is still exactly right, and there is no need of a ”more realistic representation”. The basis of the misunderstanding is clearly present in the last sentence of the first paragraph, where it is claimed that ”the central dogma postulates that the information flow in the cell…”. This is wrong. The Central Dogma does no such thing.

So how serious is this problem? In a rather simplistic exercise, I gathered a bunch of Ph.D. theses from 2009 to 2015 that were lying around at my place of work, SciLifeLab. In 9 of them, there was no mention of the Central Dogma, mostly because they focused on technology rather than basic science. In the remaining 8 thesis, 4 mention the Central Dogma and describe it correctly. The final 4 either get it completely wrong, or make statements that show evidence of the misunderstanding. Out of 16 (or 8, depending on how one sees it), 4 fail. That is not a very good statistic.

It should be noted that a possible explanation – that there is something wrong with the education leading up to the Ph.D. theses – does not seem likely. The pattern is not very consistent, so it is more likely that the young scientists have formed these views on their own. It would be interesting to figure out what the root cause is, but I have no idea how to do that.

What is the moral of this? It can be condensed into two rules:

  1. If you cite a paper, make sure that you have read it.
  2. Before making a judgement about a hypothesis, make sure you first understand it.

If you think morals is boring, then have a look at this wonderful film made in 1971 at Stanford, which illustrates how the ribosome acts to translate mRNA into protein, one of the transfers of sequence information allowed by the Central Dogma.

Addition: Casey Bergman (@caseybergman) made me aware of a blog post from 15 Jan 2007 by Laurence A. Moran which traces the origin of the misunderstanding all the way back to Jim Watson, of all people! He apparently messed up the vital distinction in the first edition of his textbook The Molecular Biology of the Gene (1965). And there are other textbooks that provide confusion on the subject as well. Sigh…

Correction: In the sentence ”In fact, the notion that…”, it now says ”without” rather than ”with”! Thanks James Gilbert for spotting!


One Gene and many proteins - Biology

The information content of DNA is in the form of specific sequences of nucleotides.

DNA dictates the synthesis of proteins, which are the links between genotype and phenotype.

The symptoms of an inherited disease reflect a person's inability to synthesize a particular enzyme.

The one gene - one enzyme hypothesis, but not all proteins are enzymes and yet their synthesis depends on specific genes.
The one gene - one protein hypothesis but many proteins are composed of several polypeptides, each of which has its own gene.

Therefore, the hypothesis has been restated as the one gene - one polypeptide hypothesis .

Transcription and translation are the two main processes linking gene to protein
The bridge between DNA and protein synthesis is RNA .

RNA is chemically similar to DNA, except that it contains ribose as its sugar and substitutes the nitrogenous base uracil for thymine.

An RNA molecule almost always consists of a single strand .

The specific sequence of hundreds or thousands of nucleotides in each gene carries the information for the primary structure of a protein, the linear order of the 20 possible amino acids.

To get from DNA, written in one chemical language, to protein, written in another, requires two major stages, transcription and translation .

During transcription , a DNA strand provides a template for the synthesis of a complementary RNA strand. Fig. 17.2

This process is used to synthesize any type of RNA from a DNA template.

Transcription of a gene produces a messenger RNA ( mRNA ) molecule.

During translation , the information contained in the order of nucleotides in mRNA is used to determine the amino acid sequence of a polypeptide.

Translation occurs at ribosomes .

The basic mechanics of transcription and translation are similar in eukaryotes and prokaryotes.

Because bacteria lack nuclei, transcription and translation are coupled.

In a eukaryotic cell, almost all transcription occurs in the nucleus and translation occurs mainly at ribosomes in the cytoplasm.

In addition, before the primary transcript can leave the nucleus it is modified in various ways during RNA processing before the finished mRNA is exported to the cytoplasm.

Nucleotide triplets specify amino acids

In the triplet code , three consecutive bases specify an amino acid, creating 43 (64) possible code words. Fig. 17.3.

During transcription, one DNA strand, the template strand , provides a template for ordering the sequence of nucleotides in an RNA transcript.

Uracil is the complementary base to adenine.

During translation, blocks of three nucleotides, codons , are decoded into a sequence of amino acids. The codons are read in the 5'->3' direction along the mRNA.

Each codon specifies which one of the 20 amino acids will be incorporated at the corresponding position along a polypeptide.

Nirenberg determined the first match: UUU coded for the amino acid phenylalanine.

He created an artificial mRNA molecule entirely of uracil and added it to a test tube mixture of amino acids, ribosomes, and other components for protein synthesis.

This "poly(U)" translated into a polypeptide containing a single amino acid, phenyalanine, in a long chain.

By the mid-1960s the entire code was deciphered. Fig 17.4.

61 of 64 triplets code for amino acids.

The codon AUG not only codes for the amino acid methionine but also indicates the start of translation.

Three codons do not indicate amino acids but signal the termination of translation.

To extract the message from the genetic code requires specifying the correct starting point .

This establishes the reading frame and subsequent codons are read in groups of three nucleotides.

The genetic code must have evolved very early in the history of life

The genetic code is nearly universal, shared by organisms from the simplest bacteria to the most complex plants and animals.

In laboratory experiments, genes can be transcribed and translated after they are transplanted from one species to another.

This has permitted bacteria to be programmed to synthesize certain human proteins after insertion of the appropriate human genes.

Transcription is the DNA-directed synthesis of RNA. Fig 17.6a

Messenger RNA is transcribed from the template strand of a gene.

RNA polymerase separates the DNA strands and bonds the RNA nucleotides to the 3' end of the growing polymer as they base-pair along the DNA template.

Genes are read 3'->5', creating a 5'->3' RNA molecule.

Specific sequences of nucleotides along the DNA mark where gene transcription begins and ends.

RNA polymerase attaches and initiates transcription at the promotor , "upstream" of the information contained in the gene, the transcription unit . Fig 17.7

The terminator signals the end of transcription.

Bacteria have a single type of RNA polymerase that synthesizes all RNA molecules.

Eukaryotes have three RNA polymerases (I, II, and III) in their nuclei.

RNA polymerase II is used for mRNA synthesis.

Transcription can be separated into three stages : initiation, elongation, and termination .

Initiation - The presence of a promotor sequence determines which strand of the DNA helix is the template.

Within the promotor is the starting point for the transcription of a gene.

The promotor also includes a binding site for RNA polymerase upstream of the start point.

In eukaryotes, proteins called transcription factors recognize the promotor region, especially a TATA box , and bind to the promotor.

After they have bound to the promotor, RNA polymerase binds to transcription factors to create a transcription initiation complex .

Elongation - RNA polymerase then starts transcription. Fig 17.6b

As RNA polymerase moves along the DNA, it untwists the double helix, and adds nucleotides to the 3' end of the growing strand.

Behind the point of RNA synthesis, the double helix re-forms and the RNA molecule peels away.

A single gene can be transcribed simultaneously by several RNA polymerases at a time. This helps the cell make the encoded protein in large amounts.

Termination - Transcription proceeds until after the RNA polymerase transcribes a terminator sequence in the DNA.

Transcription, the movie!
Eukaryotic cells modify RNA after transcription

At the 5' end of the pre-mRNA molecule, a modified form of guanine is added, the 5' cap, which helps protect mRNA from hydrolytic enzymes. Fig 17. 8.

At the 3' end, an enzyme adds, the poly(A) tail .

It inhibits hydrolysis, and enables ribosome attachment and the export of mRNA from the nucleus.

Most eukaryotic genes and their RNA transcripts have long noncoding stretches of nucleotides.

Noncoding segments, introns , lie between coding regions, exons , which are translated into amino acid sequences, plus the leader and trailer sequences.

RNA splicing removes introns and joins exons to create a mRNA molecule with a continuous coding sequence.

This splicing is accomplished by a spliceosome . Fig 17.10.

Spliceosomes consist of a variety of proteins and several small nuclear ribonucleoproteins ( snRNPs ).

Each snRNP has several protein molecules and a small nuclear RNA molecule ( snRNA ).

In this process, the snRNA acts as a ribozyme , an RNA molecule that functions as an enzyme.

RNA splicing appears to have several functions.

1. Some introns contain sequences that control gene activity in some way.

2. May regulate the passage of mRNA from the nucleus to the cytoplasm.

3. Enables one gene to encode for more than one polypeptide.

Alternative RNA splicing gives rise to two or more different polypeptides, depending on which segments are treated as exons. Fig 19.11.

Proteins often have a modular architecture with discrete structural and functional regions called domains . Fig 17.11.

In many cases, different exons code for different domains of a protein.

Introns increase the opportunity for recombination between two alleles of a gene.

Exon shuffling could lead to new proteins through novel combinations of functions.

Translation is the RNA-directed synthesis of a polypeptide. Fig 17.12.

Transfer RNA ( tRNA ) (2-dimensional image Fig 17.13a 3-dimensional and symbol Fig 17.13b) transfers amino acids from the cytoplasm's pool to a ribosome.

The ribosome adds each amino acid carried by tRNA to the growing end of the polypeptide chain.

During translation, each type of tRNA links a mRNA codon with the appropriate amino acid.

Each tRNA arriving at the ribosome carries a specific amino acid at one end and has a specific nucleotide triplet, an anticodon , at the other.

Codon by codon, tRNAs deposit amino acids in the prescribed order and the ribosome joins them into a polypeptide chain.

tRNA molecules are transcribed from DNA templates in the nucleus. Each tRNA is used repeatedly.

To pick up its designated amino acid in the cytosol.

To deposit the amino acid at the ribosome.

To return to the cytosol to pick up another copy of that amino acid.

The anticodons of some tRNAs recognize more than one codon. The rules for base pairing between the third base of the codon and anticodon are relaxed (called wobble ).

At the wobble position, U on the anticodon can bind with A or G in the third position of a codon.

Each amino acid is joined to the correct tRNA by aminoacyl-tRNA synthetase . Fig 17.14. The 20 different synthetases match the 20 different amino acids.

The synthetase catalyzes a covalent bond between them, forming aminoacyl-tRNA or activated amino acid .

Ribosomes facilitate the specific coupling of the tRNA anticodons with mRNA codons.

Each ribosome has a large and a small subunit. Fig 17.15

These are composed of proteins and ribosomal RNA ( rRNA ), the most abundant RNA in the cell.

Each ribosome has a binding site for mRNA and three binding sites for tRNA molecules.

The P site holds the tRNA carrying the growing polypeptide chain.

The A site carries the tRNA with the next amino acid.

Discharged tRNAs leave the ribosome at the E site .

RNA is the catalyst for peptide bond formation.

Translation can be divided into three stages : Initiation , Elongation , and Termination

Initiation brings together mRNA, a tRNA with the first amino acid, and the two ribosomal subunits. Fig 17.17.

First, a small ribosomal subunit binds with mRNA and a special initiator tRNA, which carries methionine and attaches to the start codon. AUG = initiator codon

Initiation factors bring in the large subunit such that the initiator tRNA occupies the P site.

Elongation consists of a series of three-step cycles as each amino acid is added to the proceeding one. Fig 17.18.

Termination occurs when one of the three stop codons reaches the A site. Fig 17.19.

Typically a single mRNA is used to make many copies of a polypeptide simultaneously.

Multiple ribosomes, polyribosomes , may trail along the same mRNA. Fig 17.20.

During and after synthesis, a polypeptide coils and folds to its three-dimensional shape spontaneously.

In addition, proteins may require posttranslational modifications .

This may require additions like sugars, lipids, or phosphate groups to amino acids.

Enzymes may remove some amino acids or cleave whole polypeptide chains.

Two or more polypeptides may join to form a protein.

Free ribosomes are suspended in the cytosol and synthesize proteins that reside in the cytosol.

Bound ribosomes are attached to the cytosolic side of the endoplasmic reticulum. Fig. 17.21.

They synthesize proteins of the endomembrane system as well as proteins secreted from the cell.

Translation in all ribosomes begins in the cytosol, but a polypeptide destined for the endomembrane system or for export has a specific signal peptide region at or near the leading end.

A signal recognition particle ( SRP ) binds to the signal peptide and attaches it and its ribosome to a receptor protein in the ER membrane.

After binding, the SRP leaves and protein synthesis resumes with the growing polypeptide snaking across the membrane into the cisternal space via a protein pore.

Other kinds of signal peptides are used to target polypeptides to mitochondria, chloroplasts, the nucleus, and other organelles that are not part of the endomembrane system.

In these cases, translation is completed in the cytosol before the polypeptide is imported into the organelle.

RNA plays multiple roles in the cell: a review Table 17.1.

Comparing protein synthesis in prokaryotes (Fig 17.22) and eukaryotes (Fig 17.25)

One big difference is that prokaryotes can transcribe and translate the same gene simultaneously.

The new protein quickly diffuses to its operating site.

In eukaryotes, the nuclear envelope segregates transcription from translation.

In addition, extensive RNA processing is inserted between these processes.

Point mutations can affect protein structure and function

Mutations are changes in the genetic material of a cell (or virus).

These include large-scale mutations in which long segments of DNA are affected (for example, translocations, duplications, and inversions).

A chemical change in just one base pair of a gene causes a point mutation .

If these occur in gametes or cells producing gametes, they may be transmitted to future generations.

For example, sickle-cell disease is caused by a mutation of a single base pair in the gene that codes for one of the polypeptides of hemoglobin. Fig 17.23

A point mutation that results in the replacement of a pair of complementary nucleotides with another nucleotide pair is called a base-pair substitution . Fig 17.24a.

Some base-pair substitutions have little or no impact on protein function.

Missense mutations are those that still code for an amino acid but change the indicated amino acid.

Nonsense mutations change an amino acid codon into a stop codon, nearly always leading to a nonfunctional protein.

Insertions and deletions are additions or losses of nucleotide pairs in a gene. Fig 17.24b.

These have a disastrous effect on the resulting protein more often than substitutions do.

Unless these mutations occur in multiples of three, they cause a frameshift mutation .

All the nucleotides downstream of the deletion or insertion will be improperly grouped into codons.

Mutations can occur during DNA replication, DNA repair, or DNA recombination.

These are called spontaneous mutations .

Mutagens are chemical or physical agents that interact with DNA to cause mutations.

Physical agents include high-energy radiation like X-rays and ultraviolet light.

This makes sense because most carcinogens are mutagenic and most mutagens are carcinogenic.

The Mendelian concept of a gene views it as a discrete unit of inheritance that affects phenotype.

A gene is a specific nucleotide sequence along a region of a DNA molecule.

A gene is a region of DNA whose final product is either a polypeptide or an RNA molecule.


You’ve probably heard about GMOs or Genetically Modified Organisms but what exactly is a gene and what does it mean to modify the genes of a plant or animal?

This short film is designed to help. Here we discuss a basic definition of a gene, show what a gene looks like, what it is that genes actually code for, and the basic idea behind Genetically Modified Organisms.

For Teachers

The content of this video meets criteria in the following Disciplinary Core Ideas defined by Next Generation Science Standards. Use our videos to supplement classroom curriculum.

High School, Life Science 1

From Molecules to Organisms: Structures and Processes.

High School, Life Science 3

Heredity: Inheritance and Variation of Traits.

High School, Life Science 4

Biological Evolution: Unity and Diversity.

Georgia Biology 2

How genetic information is expressed in cells.

Georgia Biology 3

How biological traits are passed on to successive generations.

Georgia Biology 6

Contribuidores

Our videos benefit from guidance and advice provided by experts in science and education. This animation is the result of collaboration between the following scientists, educators, and our team of creatives.

Advisors

Transcrição

Each one of our cells contains 46 strands of DNA. A single strand is made of millions of particles called nucleotides and these Nucleotides come in 4 different types which scientists have labeled A C T and G.

A gene is a special stretch of DNA, a sequence of As Cs Ts and Gs that codes for something.

A gene contains information for a cell to read and use but what exactly does that information do?

You might of heard that there’s a blue eye gene, a freckle gene, or possibly even an anger gene, but single genes don’t literally make things like eyeballs or freckles or temper tantrums. Genes make proteins. Those proteins then interact with each other and all sorts of chemicals inside the body, to build things like eye pigments, freckles, and mood altering hormones.

A single strand of DNA contains thousands of genes (or unique protein recipes). Humans have roughly 20,000 altogether. Some genes are small, only about 300 letters long. Others are well over a million.

The length and sequence of a gene determine the size and shape of the protein it builds. The size and shape of a protein determine the function that protein will have inside the body.

hemoglobin for example is a protein structure found in red blood cells. It’s unique shape and size allow it to capture oxygen molecules when blood flows near the lungs, and then release em later when blood flows near oxygen starved tissues.

Pepsin is a digestive protein. Its unique shape allows it to break down food inside your stomach so it can be absorbed in the body.

Keratin is a structural protein. It’s unique shape and size allow it to link together with other keratin proteins to form hard structures like fingernails, claws, and beaks.

Different creatures have different genes which is ultimately why their bodies look and function differently. But one of the many reasons that scientists believe all life on earth is related, is that the basic DNA code, the language of As Cs Ts and Gs is pretty much the same for all living things. Many creatures even share some of the same genes.

You might not be too surprised to learn that humans and chimps (which are closely related) share 96% or their genetics code but what would you think a lowely fruit fly has in common with a beautiful swimsuit model? Surprisingly, about half of its genes.

Because all creatures use DNA in pretty much the same way, genetic engineers have found that if they take a gene from say a bacteria cell and insert it into the DNA of an animal or plant cell. That animal or plant cell will then read the new gene and produce the bacterial protein.

Engineers have mixed and matched the genes of different organisms to produce many new creatures including corn that is toxic to insects but supposedly safe for human consumption, tomatoes that last up to twice as long in the grocery store before going bad and a new form of bacteria that produce the human protein insulin which we then collect from these bacteria and sell to people with Diabetes who need extra insulin to survive.

So just to sum things up a bit, what exactly is a gene? A gene is a special stretch of of DNA, not the entire strand of DNA, just a segment, that codes for something. Each gene is like a unique recipe which usually tells a cell how to make a protein or a group of proteins.

Different creatures have different genes, but all genes are written in the same basic DNA language of As Cs Ts and Gs.


What is the relationship between a gene and a protein?

The terminology can be somewhat confusing. Dysferlin is a protein, and "the dysferlin gene" means "the gene which contains the instructions for producing the dysferlin protein." Each gene tells the cell how to put together the building blocks for one specific protein. However, the gene (DNA) sits inside a different compartment of the cell (the nucleus) from the location of the cellular machines that make proteins (ribosomes). Therefore, the gene must first make a copy of itself (called messenger RNA - mRNA), which is smaller and more portable than DNA and is able to leave the nucleus to reach the ribosomes. A ribosome then reads each set of three nucleotides in the mRNA code and converts the instructions into a chain of amino acids that attach together to form a protein. The mRNA also tells the ribosome where to start the protein and when the protein is finished namely, when it should stop attaching new amino acids to the protein. Because the nucleotides are read in groups of three, it is important for the ribosome to know how to group the nucleotides. If the nucleotides are grouped incorrectly, the ribosome will choose the wrong amino acids and the protein will not function. Usually, when a protein is not properly produced, it is because there is some mutation in the gene which contains its instructions.