Em formação

1.1.1: Temas e conceitos de Biologia - Biologia


Biologia é a ciência que estuda a vida. O que exatamente é vida? Pode parecer uma pergunta boba com uma resposta óbvia, mas não é fácil definir a vida. Por exemplo, um ramo da biologia chamado vírus de estudos de virologia, que exibe algumas das características de entidades vivas, mas carece de outras. Acontece que, embora os vírus possam atacar organismos vivos, causar doenças e até mesmo se reproduzir, eles não atendem aos critérios que os biólogos usam para definir a vida.

Desde o início, a biologia lutou com quatro questões: Quais são as propriedades compartilhadas que tornam algo “vivo”? Como funcionam essas várias coisas vivas? Diante da notável diversidade da vida, como organizamos os diferentes tipos de organismos para melhor entendê-los? E, finalmente - o que os biólogos procuram entender - como essa diversidade surgiu e como continua? À medida que novos organismos são descobertos todos os dias, os biólogos continuam buscando respostas para essas e outras perguntas.

Propriedades da Vida

Todos os grupos de organismos vivos compartilham várias características ou funções principais: ordem, sensibilidade ou resposta a estímulos, reprodução, adaptação, crescimento e desenvolvimento, regulação, homeostase e processamento de energia. Quando vistas juntas, essas oito características servem para definir a vida.

Pedido

Os organismos são estruturas altamente organizadas que consistem em uma ou mais células. Mesmo organismos unicelulares muito simples são notavelmente complexos. Dentro de cada célula, os átomos formam moléculas. Estes, por sua vez, constituem componentes celulares ou organelas. Os organismos multicelulares, que podem consistir em milhões de células individuais, têm uma vantagem sobre os organismos unicelulares, pois suas células podem ser especializadas para desempenhar funções específicas e até mesmo sacrificadas em certas situações para o bem do organismo como um todo. Como essas células especializadas se unem para formar órgãos como o coração, pulmão ou pele em organismos como o sapo mostrado na Figura 1.1.1 será discutido mais tarde.

Sensibilidade ou Resposta a Estímulos

Os organismos respondem a diversos estímulos. Por exemplo, as plantas podem se curvar em direção a uma fonte de luz ou responder ao toque (Figura 1.1.2) Até mesmo bactérias minúsculas podem mover-se para perto ou para longe de produtos químicos (um processo chamado quimiotaxia) ou da luz (fototaxia). O movimento em direção a um estímulo é considerado uma resposta positiva, enquanto o movimento para longe de um estímulo é considerado uma resposta negativa.

Assista a este vídeo para ver como a planta sensível responde a um estímulo de toque.

Reprodução

Os organismos unicelulares se reproduzem primeiro duplicando seu DNA, que é o material genético, e depois dividindo-o igualmente, à medida que a célula se prepara para se dividir para formar duas novas células. Muitos organismos multicelulares (aqueles compostos por mais de uma célula) produzem células reprodutivas especializadas que formarão novos indivíduos. Quando ocorre a reprodução, o DNA contendo genes é passado para a prole de um organismo. Esses genes são a razão pela qual a prole pertencerá à mesma espécie e terá características semelhantes às do progenitor, como cor do pelo e tipo sanguíneo.

Adaptação

Todos os organismos vivos se adaptam ao meio ambiente. Os biólogos se referem a esse ajuste como adaptação e é uma consequência da evolução por seleção natural, que opera em todas as linhagens de organismos reprodutores. Os exemplos de adaptações são diversos e únicos, desde Archaea resistentes ao calor que vivem em fontes termais ferventes até o comprimento da língua de uma mariposa que se alimenta de néctar que corresponde ao tamanho da flor da qual se alimenta. Todas as adaptações aumentam o potencial reprodutivo do indivíduo que as exibe, incluindo sua capacidade de sobreviver para se reproduzir. As adaptações não são constantes. À medida que um ambiente muda, a seleção natural faz com que as características dos indivíduos em uma população acompanhem essas mudanças.

Crescimento e desenvolvimento

Os organismos crescem e se desenvolvem de acordo com instruções específicas codificadas por seus genes. Esses genes fornecem instruções que irão direcionar o crescimento e o desenvolvimento celular, garantindo que os filhotes de uma espécie (Figura 1.1.3) cresçam para exibir muitas das mesmas características de seus pais.

Regulamento

Mesmo os menores organismos são complexos e requerem múltiplos mecanismos reguladores para coordenar as funções internas, como o transporte de nutrientes, a resposta a estímulos e o enfrentamento de estresses ambientais. Por exemplo, sistemas orgânicos, como o digestivo ou circulatório, desempenham funções específicas, como transportar oxigênio por todo o corpo, remover resíduos, fornecer nutrientes a todas as células e resfriar o corpo.

Homeostase

Para funcionar adequadamente, as células requerem condições adequadas, como temperatura, pH e concentrações adequadas de diversos produtos químicos. Essas condições podem, no entanto, mudar de um momento para o outro. Os organismos são capazes de manter as condições internas dentro de uma faixa estreita quase constantemente, apesar das mudanças ambientais, por meio de um processo denominado homeostase ou “estado estacionário” - a capacidade de um organismo de manter constantes as condições internas. Por exemplo, muitos organismos regulam sua temperatura corporal em um processo conhecido como termorregulação. Organismos que vivem em climas frios, como o urso polar (Figura 1.1.4), têm estruturas corporais que os ajudam a suportar baixas temperaturas e conservar o calor corporal. Em climas quentes, os organismos possuem métodos (como a transpiração em humanos ou respiração ofegante em cães) que os ajudam a liberar o excesso de calor corporal.

Processamento de Energia

Todos os organismos (como o condor da Califórnia mostrado na Figura 1.1.5) usam uma fonte de energia para suas atividades metabólicas. Alguns organismos captam energia do Sol e a convertem em energia química nos alimentos; outros usam energia química de moléculas que absorvem.

Níveis de organização das coisas vivas

Os seres vivos são altamente organizados e estruturados, seguindo uma hierarquia em uma escala de pequeno a grande. O átomo é a menor e mais fundamental unidade da matéria. Consiste em um núcleo rodeado por elétrons. Os átomos formam moléculas. Uma molécula é uma estrutura química que consiste em pelo menos dois átomos mantidos juntos por uma ligação química. Muitas moléculas biologicamente importantes são macromoléculas, moléculas grandes que são normalmente formadas pela combinação de unidades menores chamadas monômeros. Um exemplo de macromolécula é o ácido desoxirribonucléico (DNA) (Figura 1.1.6), que contém as instruções para o funcionamento do organismo que o contém.

CONCEITO EM AÇÃO

Para ver uma animação desta molécula de DNA, clique aqui.

Algumas células contêm agregados de macromoléculas rodeados por membranas; estes são chamados de organelas. Organelas são pequenas estruturas que existem dentro das células e desempenham funções especializadas. Todas as coisas vivas são feitas de células; a própria célula é a menor unidade fundamental de estrutura e função nos organismos vivos. (Este é o motivo pelo qual os vírus não são considerados vivos: eles não são feitos de células. Para fazer novos vírus, eles precisam invadir e sequestrar uma célula viva; só então podem obter os materiais de que precisam para se reproduzir.) Alguns organismos consistem em uma única célula e outras são multicelulares. As células são classificadas como procarióticas ou eucarióticas. Procariontes são organismos unicelulares que não possuem organelas circundadas por uma membrana e não possuem núcleos circundados por membranas nucleares; em contraste, as células dos eucariotos têm organelas e núcleos ligados à membrana.

Na maioria dos organismos multicelulares, as células se combinam para formar os tecidos, que são grupos de células semelhantes que desempenham a mesma função. Órgãos são coleções de tecidos agrupados com base em uma função comum. Os órgãos estão presentes não apenas nos animais, mas também nas plantas. Um sistema orgânico é um nível superior de organização que consiste em órgãos funcionalmente relacionados. Por exemplo, animais vertebrados têm muitos sistemas de órgãos, como o sistema circulatório que transporta sangue por todo o corpo e de e para os pulmões; inclui órgãos como o coração e vasos sanguíneos. Organismos são entidades vivas individuais. Por exemplo, cada árvore em uma floresta é um organismo. Procariotos unicelulares e eucariotos unicelulares também são considerados organismos e são normalmente referidos como microrganismos.

CONEXÃO DE ARTE

Figura 1.1.7: De um átomo a toda a Terra, a biologia examina todos os aspectos da vida. (crédito "molécula": modificação do trabalho por Jane Whitney; crédito "organelas": modificação do trabalho por Louisa Howard; crédito "células": modificação do trabalho por Bruce Wetzel, Harry Schaefer, National Cancer Institute; crédito "tecido": modificação da obra de "Kilbad" / Wikimedia Commons; "órgãos" de crédito: modificação da obra de Mariana Ruiz Villareal, Joaquim Alves Gaspar; "organismos" de crédito: modificação da obra de Peter Dutton; "ecossistema" de crédito: modificação da obra de "gigi4791 "/ Flickr; crédito" biosfera ": modificação do trabalho pela NASA)

Qual das seguintes afirmações é falsa?

  1. Os tecidos existem dentro de órgãos que existem dentro de sistemas orgânicos.
  2. Comunidades existem dentro de populações que existem dentro de ecossistemas.
  3. Organelas existem dentro das células que existem dentro dos tecidos.
  4. Comunidades existem dentro de ecossistemas que existem na biosfera.

B

Todos os indivíduos de uma espécie que vivem em uma área específica são chamados coletivamente de população. Por exemplo, uma floresta pode incluir muitos pinheiros brancos. Todos estes pinheiros representam a população de pinheiros brancos desta floresta. Diferentes populações podem viver na mesma área específica. Por exemplo, a floresta com pinheiros inclui populações de plantas com flores e também insetos e populações microbianas. Uma comunidade é o conjunto de populações que habitam uma determinada área. Por exemplo, todas as árvores, flores, insetos e outras populações em uma floresta formam a comunidade da floresta. A própria floresta é um ecossistema. Um ecossistema consiste em todas as coisas vivas em uma determinada área junto com as partes abióticas, ou não vivas, desse ambiente, como o nitrogênio no solo ou na água da chuva. No nível mais alto da organização (Figura 1.1.7), a biosfera é o conjunto de todos os ecossistemas e representa as zonas de vida na Terra. Inclui terra, água e partes da atmosfera.

A Diversidade da Vida

A ciência da biologia tem um escopo muito amplo porque existe uma enorme diversidade de vida na Terra. A fonte dessa diversidade é a evolução, o processo de mudança gradual durante o qual novas espécies surgem de espécies mais antigas. Os biólogos evolucionistas estudam a evolução dos seres vivos em tudo, desde o mundo microscópico aos ecossistemas.

No século 18, um cientista chamado Carl Linnaeus propôs pela primeira vez organizar as espécies conhecidas de organismos em uma taxonomia hierárquica. Nesse sistema, as espécies mais semelhantes entre si são reunidas em um agrupamento conhecido como gênero. Além disso, gêneros semelhantes (o plural de gênero) são colocados juntos dentro de uma família. Esse agrupamento continua até que todos os organismos sejam reunidos em grupos no nível mais alto. O sistema taxonômico atual passa a ter oito níveis em sua hierarquia, do mais baixo ao mais alto, são eles: espécie, gênero, família, ordem, classe, filo, reino, domínio. Assim, as espécies são agrupadas em gêneros, os gêneros são agrupados em famílias, as famílias são agrupadas em ordens e assim por diante (Figura 1.1.8).

O nível mais alto, domínio, é uma adição relativamente nova ao sistema desde a década de 1990. Os cientistas agora reconhecem três domínios da vida, o Eukarya, o Archaea e as Bactérias. O domínio Eukarya contém organismos que possuem células com núcleos. Inclui os reinos de fungos, plantas, animais e vários reinos de protistas. As Archaea são organismos unicelulares sem núcleo e incluem muitos extremófilos que vivem em ambientes hostis como fontes termais. As bactérias são outro grupo bastante diferente de organismos unicelulares sem núcleos (Figura 1.1.9). Tanto as Archaea quanto as Bactérias são procariontes, um nome informal para células sem núcleo. O reconhecimento, na década de 1990, de que certas “bactérias”, agora conhecidas como Archaea, eram tão diferentes genética e bioquimicamente de outras células bacterianas quanto de eucariotos, motivou a recomendação de dividir a vida em três domínios. Essa mudança dramática em nosso conhecimento da árvore da vida demonstra que as classificações não são permanentes e mudarão quando novas informações estiverem disponíveis.

Além do sistema taxonômico hierárquico, Linnaeus foi o primeiro a nomear organismos usando dois nomes exclusivos, agora chamado de sistema de nomenclatura binomial. Antes de Lineu, o uso de nomes comuns para se referir a organismos causava confusão porque havia diferenças regionais nesses nomes comuns. Os nomes binomiais consistem no nome do gênero (em maiúsculas) e no nome da espécie (todos em minúsculas). Ambos os nomes são colocados em itálico quando são impressos. Cada espécie recebe um binômio único, reconhecido em todo o mundo, de modo que um cientista em qualquer local pode saber a qual organismo está se referindo. Por exemplo, o gaio-azul da América do Norte é conhecido exclusivamente como Cyanocitta cristata. Nossa própria espécie é Homo sapiens.

EVOLUÇÃO EM AÇÃO: Carl Woese e a árvore filogenética

As relações evolutivas de várias formas de vida na Terra podem ser resumidas em uma árvore filogenética. Uma árvore filogenética é um diagrama que mostra as relações evolutivas entre as espécies biológicas com base nas semelhanças e diferenças nas características genéticas ou físicas, ou em ambas. Uma árvore filogenética é composta de pontos de ramificação, ou nós, e ramificações. Os nós internos representam ancestrais e são pontos na evolução quando, com base em evidências científicas, acredita-se que um ancestral tenha divergido para formar duas novas espécies. O comprimento de cada ramo pode ser considerado como uma estimativa do tempo relativo.

No passado, os biólogos agrupavam os organismos vivos em cinco reinos: animais, plantas, fungos, protistas e bactérias. O trabalho pioneiro do microbiologista americano Carl Woese no início dos anos 1970 mostrou, no entanto, que a vida na Terra evoluiu ao longo de três linhagens, agora chamadas de domínios - Bactérias, Archaea e Eukarya. Woese propôs o domínio como um novo nível taxonômico e Archaea como um novo domínio, para refletir a nova árvore filogenética (Figura 1.1.10) Muitos organismos pertencentes ao domínio Archaea vivem em condições extremas e são chamados de extremófilos. Para construir sua árvore, Woese usou relações genéticas em vez de semelhanças baseadas na morfologia (forma). Vários genes foram usados ​​em estudos filogenéticos. A árvore de Woese foi construída a partir do sequenciamento comparativo dos genes que são universalmente distribuídos, encontrados em alguma forma ligeiramente alterada em cada organismo, conservados (o que significa que esses genes permaneceram apenas ligeiramente alterados ao longo da evolução) e de um comprimento apropriado.

Ramos do estudo biológico

O escopo da biologia é amplo e, portanto, contém muitos ramos e subdisciplinas. Os biólogos podem seguir uma dessas subdisciplinas e trabalhar em um campo mais focado. Por exemplo, a biologia molecular estuda processos biológicos em nível molecular, incluindo interações entre moléculas como DNA, RNA e proteínas, bem como a maneira como são reguladas. Microbiologia é o estudo da estrutura e função dos microrganismos. É um ramo bastante amplo e, dependendo do objeto de estudo, também existem fisiologistas microbianos, ecologistas e geneticistas, entre outros.

Outra área do estudo biológico, a neurobiologia, estuda a biologia do sistema nervoso e, embora seja considerada um ramo da biologia, também é reconhecida como um campo de estudo interdisciplinar conhecido como neurociência. Devido à sua natureza interdisciplinar, esta sub-disciplina estuda diferentes funções do sistema nervoso usando abordagens moleculares, celulares, de desenvolvimento, médicas e computacionais.

A paleontologia, outro ramo da biologia, usa fósseis para estudar a história da vida (Figura 1.1.11). Zoologia e botânica são o estudo de animais e plantas, respectivamente. Os biólogos também podem se especializar como biotecnologistas, ecologistas ou fisiologistas, para citar apenas algumas áreas. Os biotecnologistas aplicam o conhecimento da biologia para criar produtos úteis. Os ecologistas estudam as interações dos organismos em seus ambientes. Os fisiologistas estudam o funcionamento das células, tecidos e órgãos. Esta é apenas uma pequena amostra dos muitos campos que os biólogos podem exercer. De nossos próprios corpos ao mundo em que vivemos, as descobertas da biologia podem nos afetar de maneiras muito diretas e importantes. Dependemos dessas descobertas para nossa saúde, nossas fontes de alimentos e os benefícios fornecidos por nosso ecossistema. Por isso, o conhecimento da biologia pode nos beneficiar na tomada de decisões em nosso dia-a-dia.

O desenvolvimento da tecnologia no século XX que continua até hoje, particularmente a tecnologia para descrever e manipular o material genético, o DNA, transformou a biologia. Essa transformação permitirá que os biólogos continuem a compreender a história da vida com mais detalhes, como o corpo humano funciona, nossas origens humanas e como os humanos podem sobreviver como espécie neste planeta, apesar do estresse causado pelo nosso número crescente. Os biólogos continuam a decifrar grandes mistérios sobre a vida, sugerindo que apenas começamos a compreender a vida no planeta, sua história e nossa relação com ela. Por essa e outras razões, o conhecimento de biologia obtido por meio deste livro e de outras mídias impressas e eletrônicas deve ser um benefício em qualquer campo que você inserir.

CARREIRAS EM AÇÃO: Cientista Forense

A ciência forense é a aplicação da ciência para responder a questões relacionadas com a lei. Tanto biólogos quanto químicos e bioquímicos podem ser cientistas forenses. Cientistas forenses fornecem evidências científicas para uso em tribunais, e seu trabalho envolve o exame de vestígios de materiais associados a crimes. O interesse pela ciência forense aumentou nos últimos anos, possivelmente por causa de programas de televisão populares que apresentam cientistas forenses trabalhando. Além disso, o desenvolvimento de técnicas moleculares e o estabelecimento de bancos de dados de DNA atualizaram os tipos de trabalho que os cientistas forenses podem fazer. Suas atividades profissionais estão principalmente relacionadas a crimes contra pessoas, como assassinato, estupro e agressão. Seu trabalho envolve a análise de amostras como cabelo, sangue e outros fluidos corporais e também o processamento de DNA (Figura 1.1.12) encontrados em muitos ambientes e materiais diferentes.Os cientistas forenses também analisam outras evidências biológicas deixadas nas cenas do crime, como partes de insetos ou grãos de pólen. Os alunos que desejam seguir carreira em ciências forenses provavelmente terão que fazer cursos de química e biologia, bem como alguns cursos intensivos de matemática.

Resumo

Biologia é a ciência da vida. Todos os organismos vivos compartilham várias propriedades essenciais, como ordem, sensibilidade ou resposta a estímulos, reprodução, adaptação, crescimento e desenvolvimento, regulação, homeostase e processamento de energia. Os seres vivos são altamente organizados seguindo uma hierarquia que inclui átomos, moléculas, organelas, células, tecidos, órgãos e sistemas orgânicos. Os organismos, por sua vez, são agrupados como populações, comunidades, ecossistemas e a biosfera. A evolução é a fonte da tremenda diversidade biológica da Terra hoje. Um diagrama denominado árvore filogenética pode ser usado para mostrar as relações evolutivas entre os organismos. A biologia é muito ampla e inclui muitos ramos e subdisciplinas. Os exemplos incluem biologia molecular, microbiologia, neurobiologia, zoologia e botânica, entre outros.

Glossário

átomo
uma unidade básica de matéria que não pode ser decomposta por reações químicas normais
biologia
o estudo dos organismos vivos e suas interações uns com os outros e seus ambientes
biosfera
uma coleção de todos os ecossistemas da Terra
célula
a menor unidade fundamental de estrutura e função nas coisas vivas
comunidade
um conjunto de populações que habitam uma determinada área
ecossistema
todas as coisas vivas em uma determinada área junto com as partes abióticas e não vivas desse ambiente
eucarioto
um organismo com células que têm núcleos e organelas ligadas à membrana
evolução
o processo de mudança gradual em uma população que também pode levar ao surgimento de novas espécies de espécies mais antigas
homeostase
a habilidade de um organismo de manter constantes condições internas
macromolécula
uma grande molécula normalmente formada pela união de moléculas menores
molécula
uma estrutura química que consiste em pelo menos dois átomos mantidos juntos por uma ligação química
órgão
uma estrutura formada por tecidos operando juntos para desempenhar uma função comum
sistema de órgãos
o nível superior de organização que consiste em órgãos funcionalmente relacionados
organela
um compartimento ou saco ligado à membrana dentro de uma célula
organismo
uma entidade viva individual
árvore filogenética
um diagrama que mostra as relações evolutivas entre as espécies biológicas com base em semelhanças e diferenças em características genéticas ou físicas ou ambas
população
todos os indivíduos de uma espécie que vivem em uma área específica
procarionte
um organismo unicelular que não possui um núcleo ou qualquer outra organela ligada à membrana
tecido
um grupo de células semelhantes desempenhando a mesma função

11 exemplos de biologia na vida cotidiana

A biologia é um campo da ciência extremamente interessante que tem sido o centro do foco por séculos. Os complexos conceitos biológicos incomodam a todos desde tempos imemoriais. Apesar dos avanços que ocorrem na área da ciência e tecnologia, muitos fenômenos biológicos ainda estão pedindo uma explicação subjacente razoável. O mistério a respeito da origem da vida na terra e da aparência do homem ainda não foi desvendado. É por causa da biologia que existimos. Tudo o que fazemos envolve biologia de uma forma ou de outra. Mesmo quando você não está fazendo nada ou dormindo, cada célula do seu corpo está trabalhando para você. Enfim, desde o momento em que você nasce, é a biologia que cumpre o seu papel você cresce e se torna criança, você se depara com a adolescência, acolhe a idade adulta e depois disso, você começa a envelhecer. Todos esses processos lindos, porém fascinantes, têm um princípio biológico oculto. Hoje vamos discutir alguns exemplos da vida diária em que a biologia desempenha um papel significativo.

1. Agricultura

A comida que consumimos é fruto da agricultura. Nós, humanos e animais dependemos dos produtos agrícolas para nos sustentar. Frutas, vegetais, grãos, leguminosas, óleos, mel, açúcar, chá, café e outros alimentos são todos obtidos das plantas. Os agricultores são capazes de produzir variedades de safras de alto rendimento e resistentes a pragas. Os cientistas estudam a natureza complexa, a ocorrência e o ciclo de vida das pragas e, com a ajuda de técnicas biotecnológicas, conseguem obter melhor qualidade e quantidade das safras. É porque ocorre a polinização que as flores brotam e as sementes são obtidas. Todo o processo de polinização só é possível por causa dos pássaros e das abelhas melíferas.

2. Alimentos e bebidas

O que nos mantém vivos é a comida que consumimos. Sem comida, a viabilidade da vida não é viável. Nossos alimentos vêm de plantas e animais. Os micróbios auxiliam na formação de produtos lácteos, como requeijão, queijo e iogurte. A bactéria Lactobacillus auxilia na formação da coalhada do leite. Da mesma forma, a levedura, um dos eucariotos mais simples, é usada no processo de fermentação. O vinho é obtido a partir de uvas por um processo semelhante. Além disso, existem certos micróbios e outros processos biológicos que ajudam indiretamente na produção de alimentos. Os microrganismos presentes no solo atuam como um agente decompositor, que auxilia na produção do composto a partir da matéria orgânica morta e em decomposição. Este composto atua como um fertilizante eficaz para as plantas em crescimento.

3. Saúde e Medicina

Sempre que ficamos doentes, consultamos um médico. O médico nos dá remédios e estamos todos prontos para ir. Como isso foi possível? A resposta a essa pergunta está na biologia. É somente por causa da biologia que o estudo de vários microrganismos causadores de doenças tornou-se possível. Os pesquisadores investigaram a natureza intrincada dos microrganismos, sua ocorrência, ciclo de vida, reprodução e propagação e, portanto, criaram medidas de controle para prevenir a doença. Até mesmo a formulação de medicamentos para o combate aos microrganismos causadores de doenças foi possibilitada pelo estudo da biologia desses microrganismos.

4. Roupas

Seja verões escaldantes ou invernos arrepiantes, é a biologia que o mantém seguro. Você usa roupas de algodão respiráveis ​​no verão, obtidas de plantas. Os suéteres grossos que cobrem os invernos frios são feitos de lã obtida de ovelhas. Linho, náilon e tinturas de tecido são derivados de plantas e poliéster de fósseis, no entanto, qualquer que seja o tecido, deve ser à base de plantas.

5. Jet lag

Quando você viaja ao redor do mundo e atravessa vários fusos horários, tem problemas para adormecer no novo país. Não é? Por que isso acontece e qual é a razão subjacente para isso? A resposta a essa pergunta está no fato de seu corpo possuir um relógio interno, chamado de ritmo circadiano. O relógio biológico é responsável por decidir a hora de ficar acordado e a hora de adormecer. O jet lag ocorre porque seu relógio biológico (ritmo circadiano) está sincronizado com seu fuso horário original. Seu relógio biológico não leva em consideração a distância que você viajou. Doravante, quanto mais fusos horários você cruzar, maior será o seu jet lag.

6. Células-tronco

As células-tronco são células indiferenciadas. Essas células podem se replicar rapidamente. As células-tronco são de extrema importância para nós porque podem se desenvolver em vários tipos de células, como células musculares, células nervosas, células cardíacas, etc. Nós, humanos, começamos nossa vida como uma única célula e, após infinitas divisões celulares, desenvolvido em organismos multicelulares. As células-tronco funcionam de maneira semelhante. As células-tronco embrionárias, células totalmente indiferenciadas, são chamadas de células mestras. As células-tronco podem substituir os tecidos e órgãos danificados, corrigir o mau funcionamento de algumas partes dos órgãos, introduzir defeitos genéticos para pesquisas e permitir que os cientistas desenvolvam novos medicamentos para o tratamento das doenças. Mais uma vez, a biologia atua como seu salvador.

7. Doença da altitude

Você deve se lembrar da última vez que visitou uma estação de montanha e se sentiu desconfortável em altitudes mais elevadas. Qual pode ser a explicação provável para isso? Agora, novamente, a resposta a esta pergunta simples está na biologia. O mal da altitude é um grupo de sintomas que ocorrem quando você escala a uma altitude mais elevada. Como você não deu ao seu corpo tempo para se adaptar às mudanças de pressão e reduzir os níveis de oxigênio em grandes altitudes, os sintomas do mal-estar da altitude ocorrem muito rapidamente. No entanto, seu corpo fascinante responde aumentando a taxa de respiração, o que, por sua vez, não apenas aumenta os níveis de oxigênio no sangue, mas também altera os níveis de acidez do sangue, a pressão pulmonar, os níveis de eletrólitos e o equilíbrio de sal.

8. Meio ambiente e ecossistema

É somente por causa do campo da biologia que você é mais capaz de compreender a natureza das interações entre os organismos e o meio ambiente. As diversas interações que ocorrem entre os humanos também se devem ao seu estudo no nível biológico. Somos mais capazes de compreender a psicologia e a sociologia humanas por meio do estudo biológico do corpo humano. Não apenas as interações humanas, mas agora somos capazes de discernir outras interações ecológicas e também o estudo dos ecossistemas. Isso nos ajuda a identificar os perigos potenciais para o ecossistema e a Terra. Depois de identificar os perigos, podemos seguir em frente para a melhoria do meio ambiente.

9. Abastecimento da Terra

Desde que a conscientização aumentou, estamos nos voltando para as fontes renováveis ​​de energia. No entanto, não podemos negar o fato de que a maior parte do mundo ainda funciona com combustíveis fósseis, principalmente carvão e petróleo. Agora, o que são combustíveis fósseis? Os combustíveis fósseis são derivados apenas de seres vivos e têm origem biológica. Combustíveis fósseis como petróleo e gás natural são derivados de matéria biológica morta e em decomposição.

10. Biocombustíveis de próxima geração

Preocupado com os combustíveis fósseis que se esgotam rapidamente? Não se preocupe nem um pouco porque a biologia, mais uma vez, está a seu favor. O desenvolvimento dos biocombustíveis está em alta. O cultivo e processamento do Jatropha curcas L. (JCL) estão aumentando porque o óleo de Jatropha é efetivamente usado em motores e geradores a diesel. O que é mais surpreendente é o fato de que o óleo de Jatropha pode ser utilizado diretamente após a extração, mesmo sem refino. O etanol, fabricado a partir de açúcares vegetais, é misturado à gasolina para aumentar a eficiência do combustível. Vários biocombustíveis atualmente em uso são derivados de algas, milho, trigo, óleo de colza e beterraba sacarina. O uso de biocombustíveis abrirá uma nova avenida de combustíveis para combater a questão da poluição e da emissão de carbono.

11. Drogas: Boon or Bane?

O uso de drogas e álcool tem aumentado entre os jovens, o que é uma grande preocupação para a sociedade. A maioria das drogas, como opióides, canabinóides e alcalóides da coca, é obtida das plantas com flores. Outras drogas, como barbitúricos, anfetaminas e benzodiazepínicos, foram usadas para tratar os pacientes com doenças mentais, depressão e insônia. Além dos medicamentos acima, a morfina era usada como analgésico e um sedativo útil. No entanto, infelizmente, muitas pessoas começaram a fazer uso indevido desses medicamentos. Quando esses medicamentos são tomados para outros fins, quanto mais para fins medicinais, eles afetam as funções físicas, fisiológicas e psicológicas de um indivíduo. O uso de substâncias tem efeitos adversos como insuficiência respiratória, insuficiência cardíaca, hemorragia cerebral e pode levar ao coma e morte.


INTRODUÇÃO

Membros da família de GTPases regulatórias que incluem ARFs, ARF-like (ARLs) e SARs surgiram como reguladores-chave da sinalização celular envolvidos em quase todos os aspectos da biologia celular (Tabelas 1-3, Figura 1 e Tabelas Suplementares I- III) (D'Souza-Schorey e Chavrier, 2006 Donaldson e Jackson, 2011 Jackson e Bouvet, 2014). Sua importância é enfatizada por achados que mostram que deleções ou mutações completas ou condicionais resultam em letalidade embrionária ou defeitos específicos de órgãos, com ligações a uma variedade de doenças (Tabela 4) (Seixas et al., 2013 Zhang et al., 2013). As GTPases da família ARF controlam os principais processos celulares, incluindo o tráfego de membrana bidirecional (secreção e endocitose), ciliogênese, metabolismo lipídico, uso de energia, motilidade, divisão, apoptose e regulação da transcrição. Como todas as GTPases regulatórias, as GTPases da família ARF operam como “interruptores moleculares”, interconvertendo-se entre conformações inativas (ligadas ao PIB) e ativas (ligadas ao GTP). Ao se ligarem ao GTP, as GTPases ativadas alteram suas conformações, o que aumenta sua afinidade por efetores e podem alterar sua localização nas células, cada uma contribuindo para a geração de um output biológico específico. As GTPases da família ARF ativadas (ligadas por GTP) propagam seus efeitos por meio de uma redistribuição específica de efetores (por exemplo, recrutamento para uma membrana), ativação alostérica da atividade enzimática efetora, alterações conformacionais dentro do efetor, resultando em aumento da afinidade por outros componentes celulares (proteínas, lipídios, etc.), ou uma combinação de tais mudanças. Como consequência, o sinal de saída dessas GTPases é rigidamente controlado pela ligação regulada de GTP e pela meia-vida do estado ativado. Estes, por sua vez, são controlados pela estimulação da liberação de GDP ligado (para permitir que o GTP se ligue espontaneamente) por fatores de troca de nucleotídeos de guanina (GEFs) e de sua atividade GTPase intrínseca por proteínas ativadoras de GTPase (GAPs) (Casanova, 2007 Inoue e Randazzo, Randazzo 2007 et al., 2007 Bui et al., 2009 Spang et al., 2010 East e Kahn, 2011 Wright et al., 2014 Vitali et al., 2017). Assim, a tríade de GEF – GTPase – GAP pode ser vista como um componente mínimo nas vias de sinalização que alteram uma grande fração dos comportamentos celulares. No entanto, apesar de sua clara importância na biologia celular e ligações com patologias humanas, nossa compreensão das vias envolvidas e mecanismos moleculares permanecem fragmentários. Nesta revisão, resumimos brevemente os papéis conhecidos da família GTPases do ARF, seus GEFs e GAPs, sua localização nas células e seus interatores. Em vez de descrever em detalhes qualquer uma das muitas vias em que operam, enfatizamos a extensa sobreposição de especificidades e ações entre os membros da família, pois isso representa o maior desafio para alcançar um entendimento profundo de seus mecanismos de ação. Como cada caminho requer a tríade GEF – GTPase – GAP mínima, defendemos uma abordagem sistemática para estudar cada família e as três famílias juntas. Terminamos nossa análise destacando algumas questões e desafios importantes na sinalização ARF e esperamos que inspire mais esforços colaborativos para abordar a grande, complexa, mas de vital importância, área da sinalização ARF.

TABELA 1: GTPases da família ARF humana.

Os nomes dos genes do National Center for Biotechnology Information (NCBI) estão listados, junto com a localização celular, funções identificadas e interatores de proteínas. As abreviaturas usadas incluem CDR, babados dorsais circulares EE, endossomos iniciais PLD, fosfolipase D PM, membrana plasmática RE, endossomos reciclados RRs, bastonetes e anéis. Informações adicionais estão incluídas na Tabela Suplementar I.

Os nomes dos genes NCBI são listados, junto com a localização celular, funções identificadas e interatores de proteínas. As abreviaturas utilizadas incluem PM, membrana plasmática PSD, densidades pós-sinápticas, RE, endossomos de reciclagem TGN, transRede -Golgi. Informações adicionais estão incluídas na Tabela Suplementar II.

Os nomes dos genes NCBI são listados, junto com a localização celular, funções identificadas e interatores de proteínas. As abreviaturas usadas incluem CDR, babados dorsais circulares EE, endossomos iniciais EGFR, receptor FA do fator de crescimento epidérmico, aderências focais LD, gotículas de lipídios LE, endossomos tardios PM, membrana plasmática RE, endossomos reciclados RRs, bastonetes e anéis SF, fibras de estresse. Informações adicionais estão incluídas na Tabela Suplementar III.

FIGURA 1: Localização subcelular da família ARF GTPases, ARF GEFs e ARF GAPs. Uma célula esquemática com organelas (em vermelho) mostrando a localização das GTPases (em azul claro), GEFs (em roxo) e GAPs (em verde). Informações mais detalhadas para essas localizações são fornecidas nas referências citadas no texto.

TABELA 4: Fenótipos de camundongos com mutações / deleções de GTPases da família ARF.

São indicadas as proteínas ARF e ARL deletadas ou como nocaute de corpo inteiro (nocaute convencional) ou em um tipo de célula ou maneira específica de tecido, incluindo deleções induzíveis (nocaute condicional). E, dia embrionário ENU, N-etilo-N-nitrosoureia HGF, fator de crescimento de hepatócitos P, dia pós-natal VLDL, lipoproteína de densidade muito baixa.


Realidade virtual e mista (VMR)

Com o aumento do poder computacional, tecnologias que eram caras ou impossíveis de implementar no passado agora se tornaram acessíveis em laptops e telefones celulares (Kish 2004 Waldrop 2016). Essas tecnologias agora estão revolucionando as maneiras como interagimos com o mundo, como aprendemos e como ensinamos (Veletsianos 2010). A realidade virtual e mista (VMR, ver a terminologia na Fig. 1) é uma dessas tecnologias que vem ganhando cada vez mais atenção nas comunidades acadêmicas e de ensino (Mazuryk e Gervautz 1996). De fato, na última década, houve um aumento exponencial na publicação de artigos em temas envolvendo Realidade Virtual e Mista na Educação (Fig. 2a). VMR pode ser definido como um mundo alternativo cheio de entidades geradas por computador que interagem com os sistemas sensoriais e motores humanos para causar uma sensação de 'presença' (estado psicológico) no sujeito através do uso de uma tecnologia 'imersiva' (ou seja, tecnologia que simula um ambiente que não é necessariamente real) (Yoh 2001). Presença pode ser definida como 'um estado de dissociação da realidade em que as pessoas sentem a experiência subjetiva de existir no ambiente digital (Slater 2003). Embora presença e imersão tenham sido usadas de forma intercambiável (Barbot e Kaufman 2020), experiências que aumentam a presença não aumentam necessariamente os sentimentos de imersão e vice-versa (ver meta-análise de Cummings e Bailenson 2016), sugerindo que, embora esses termos se refiram ao sentimento de 'estar lá', eles não são necessariamente equivalentes. No entanto, ambos são importantes em aplicativos VMR. De acordo com o dicionário Oxford, Realidade Virtual é definida como 'imagens e sons criados por um computador que parecem quase reais para o usuário, que pode interagir com eles usando sensores', o que destaca que presença e imersão são aspectos fundamentais da realidade virtual ( ver, por exemplo, Lombart et al. 2020).Observe que aqui, Realidade Virtual se refere ao hardware (ou seja, fones de ouvido), mas também de forma mais ampla, à tecnologia (da qual os fones de ouvido fazem parte), nossa definição de trabalho de Realidade Virtual neste artigo se concentra no último. De acordo com a taxonomia de Milgram et al. (1995), as experiências imersivas são alcançadas por meio de um continuum complexo na fidelidade de reprodução dos ambientes real e virtual, em que as limitações das abordagens, bem como do hardware (por exemplo, dispositivos e monitores) podem influenciar o grau de experiência imersiva e presença disponível para o usuário (Milgram et al. 1995). Observe, no entanto, que a sensação de presença e imersão pode não ser necessariamente o objetivo final das tecnologias VMR (Milgram et al. 1995, mas ver Robinett 1992 Sheridan 1992), embora as exibições cada vez mais realistas possam eventualmente resultar em uma sensação de imersão completa e presença (Naimark 1991).

O continuum realidade-virtualidade. AR - realidade aumentada AV - virtualidade aumentada VR - realidade virtual [baseado em (Milgram et al. 1995)]. Em um artigo altamente influente, Milgram, Takemura, Utsumi e Kishino (1995) propuseram o continuum realidade-virtualidade para classificar as tecnologias de realidade virtual, aumentada e mista. De um lado do espectro está o mundo real (realidade) e, do outro lado do espectro, o mundo totalmente virtual (virtualidade) onde a Realidade Virtual (VR) em seu sentido estrito reside. Entre os extremos, está a Realidade Aumentada (AR) - que depende principalmente de elementos do mundo real, mas com a adição de entidades virtuais, o exemplo mais conhecido (e controverso) de RA foi Pokémon Go! (Serino et al. 2016 Zsila et al. 2018) - e Virtualidade Aumentada (AV) com o oposto de AR, isto é, mundo principalmente virtual, mas com a adição de entidades "reais". AR e AV são casos de Realidade Mista (RM), onde elementos reais e virtuais estão interligados dentro da aplicação. Para o propósito deste artigo e para simplificar, nos referimos a AR, AV e VR, todos como realidade virtual e mista (VMR) aplicativos porque todos eles têm algum grau de componentes virtuais introduzidos no aplicativo

VMR importância crescente no contexto acadêmico e educacional. uma Web of Science Consulta de tópicos de publicações (à esquerda) e citações (à direita) que envolvem VMR e educação (laranja) e VMR e biologia (vermelho). As pesquisas WoS foram realizadas em 12 de maio de 2020 com consultas de termos de pesquisa "(virtual E aumentada) realidade E educação" ou "(virtual E aumentada) realidade E biologia". Para cada pesquisa, resenhas e anais de conferências foram excluídos. No total, foram 6443 e 133 artigos que se enquadraram nos critérios de seleção, respectivamente. b Visão geral esquemática do potencial do VMR para impactar a Biologia. Por um lado, o VMR tem sido cada vez mais usado para o ensino de uma variedade de tópicos dentro da Biologia. Conforme a tecnologia avança, pode ser possível combinar outras tecnologias de ponta, como aprendizado de máquina e inteligência artificial para criar um mundo virtual em evolução auto-sustentável (BioVR) que nos permite obter insights sobre os processos biológicos

VMR existe há décadas e acredita-se que tenha sua origem na década de 1960, quando Morton Heilig criou um dos primeiros simuladores multissensoriais imersivos que incluíam estímulos como som, cheiro, vento e vibração (chamado de 'Sensorama') ( Heilig 1962 Mazuryk e Gervautz 1996). Desde então, a tecnologia VR avançou significativamente a ponto de hoje existirem muitas plataformas para criar e experimentar aplicativos VMR (por exemplo, Jerald et al. 2014 Ledermann e Schmalstieg 2005 Wexelblat 2014). Na última década, o uso de VMR no ensino e aprendizagem aumentou dramaticamente e abrange uma variedade de assuntos (Davies et al. 2019 Hoffman e Vu 1997 Makransky et al. 2016 Mikropoulos e Natsis 2011), incluindo biologia (Makransky et al. 2016 Shim et al. 2003 Shim et al. 2000). Uma meta-análise de dezesseis estudos mostrou que os simuladores cirúrgicos VMR diminuem o tempo para completar os procedimentos cirúrgicos, sugerindo uma aquisição de habilidade cirúrgica mais eficiente (Haque e Srinivasan 2006). Da mesma forma, VMR tem sido usado como uma tecnologia para treinamento e simulação de respostas a eventos de desastres, melhorando assim o campo da medicina de desastres (Gout et al. 2020). Essa absorção bem-sucedida de VMR na medicina provavelmente surge devido à inviabilidade de replicar situações da vida real (por exemplo, resposta a furacões na medicina de desastres), bem como as situações de alto risco (por exemplo, cirurgias delicadas) que são fatais para o paciente e requerem treinamento sem precedentes para o clínico em contextos de treinamento de risco inferior (ou seja, simulações em vez da vida real). Além disso, o VMR melhora a aprendizagem de tarefas que requerem memória espacial e visual, observação, bem como controle de respostas emocionais em condições estressantes (Jensen e Konradsen 2018). É importante ressaltar que crianças autistas foram descritas como tendo um envolvimento positivo com aplicativos VMR em ambientes educacionais (Kandalaft et al. 2013 Strickland et al. 1996), sugerindo que VMR pode ser usado em uma ampla gama de contextos e funcionar como uma ferramenta inclusiva para o educação de alunos com e sem necessidades especiais (mas veja a discussão sobre 'Potencial uso indevido de VMR' abaixo). Portanto, o VMR tem o potencial de se tornar uma ferramenta educacional importante e inclusiva em nosso século (Hoffman e Vu 1997). Na verdade, o VMR tem sido usado recentemente para o ensino e aprendizagem da biologia, com resultados positivos.


3. Abordagens explicativas para o desenvolvimento

As explicações na biologia do desenvolvimento são geralmente causais, embora ao contrário da explicação mecanicista padrão, haja uma aquisição constante de novas capacidades causais (em termos de entidades constituintes, atividades e sua organização) por meio do desenvolvimento (McManus 2012 Parkkinen 2014). Embora ainda haja muito trabalho na caracterização de diferentes aspectos da explicação na biologia do desenvolvimento, não há dúvida de que uma concepção de causação de diferenciação ou manipulabilidade (veja a entrada sobre causação e manipulabilidade) fornece um elemento central do raciocínio (Woodward 2003 Strevens 2009 Waters 2007a ) Explicações genéticas do desenvolvimento (Seção 3.1), semelhantes ao que é visto na genética molecular, funcionam identificando mudanças na expressão de genes e interações entre seus produtos de RNA e proteínas que levam a mudanças nas propriedades das características morfológicas durante a ontogenia (por exemplo, forma ou tamanho), mantendo uma variedade de variáveis ​​contextuais fixas. Mais recentemente, tem havido um interesse crescente em explicações físicas de desenvolvimento (Seção 3.2) que envolvem apelos a forças mecânicas devido a arranjos geométricos de materiais de mesoescala, como fluxo de fluido (Forgacs e Newman 2005). Os pesquisadores concordam sobre os fenômenos que precisam ser explicados (Seção 1.2 e Seção 2.2), mas divergem sobre se as regras físicas ou os fatores genéticos são mais ou menos explicativos (Keller 2002). [8] A existência de dois tipos diferentes de explicações causais para fenômenos de desenvolvimento levanta uma questão adicional sobre como eles podem ser combinados em uma estrutura explicativa mais integrada (Seção 3.3).

3.1 Genética

Muitos filósofos se voltaram para as explicações do desenvolvimento nas últimas duas décadas em um esforço para estimar ou esvaziar as afirmações sobre o poder causal dos genes (Keller 2002 Neumann-Held e Rehmann-Sutter 2006 Rosenberg 2006 Robert 2004 Waters 2007a). [9] As explicações genéticas tocam o tema filosófico do reducionismo e parecem constituir a maior parte do sucesso empírico acumulado para a biologia do desenvolvimento nas últimas décadas. [10] Declarações de biólogos do desenvolvimento reforçam esta perspectiva:

A biologia do desenvolvimento e hellip lida com o processo pelo qual os genes no ovo fertilizado controlam o comportamento da célula no embrião e assim determinam seu padrão, sua forma e muito de seu comportamento e a atividade do gene diferencial controla o desenvolvimento. (Wolpert et al. 1998: v, 15)

Esses tipos de afirmações às vezes são amplificados em apelos a uma programa para desenvolvimento.

[Elementos do genoma] contêm o código específico da sequência para o desenvolvimento e determinam o resultado particular dos processos de desenvolvimento e, portanto, a forma do animal produzida por cada embrião. & hellip Desenvolvimento é a execução do programa genético para a construção de uma dada espécie de organismo (Davidson 2006: 2, 16). [11]

Em outras ocasiões, as declarações se concentram na genética como o locus primário de causalidade na ontogenia: & ldquoA complexidade do desenvolvimento é a saída direta da expressão espacialmente específica de conjuntos de genes particulares e é neste nível que podemos abordar a causalidade no desenvolvimento & rdquo (Davidson e Peter 2015 : 2). Se essas declarações podem ou não ser comprovadas tem sido objeto de intenso debate. [12] As afirmações mais fortes sobre programas genéticos ou o controle genético do desenvolvimento têm desvantagens empíricas e conceituais que incluem uma desatenção à plasticidade e ao papel do meio ambiente, uma ambigüidade sobre o locus da agência causal e uma dependência de metáforas extraídas do computador ciência (Gilbert e Epel 2009 Keller 2002 Moss 2002 Robert 2004). No entanto, isso deixa intacto o princípio de diferenciação da explicação genética exibido na genética molecular (Waters 2007a), que produz reivindicações causais mais estreitas e precisas sob condições experimentais controladas, e é aplicável a diversas entidades moleculares que desempenham papéis causais durante o desenvolvimento, como como RNAs reguladores, proteínas e sinais ambientais. Podemos observar isso brevemente reconsiderando o exemplo da cardiogênese de vertebrados (Seção 1.2).

Há problemas em alegar que os genes contêm todas as informações (veja a entrada sobre informações biológicas) para formar o coração dos vertebrados? Existe um programa genético no DNA que controla o desenvolvimento do coração? Os genes são o principal fornecedor e organizador de recursos materiais para o desenvolvimento do coração, determinando amplamente o resultado fenotípico? Os estudos existentes sobre o desenvolvimento do coração identificaram um papel para as forças do fluido na especificação da forma interna do coração (Hove et al. 2003) e sua assimetria esquerda / direita (Nonaka et al. 2002). Gradientes bioquímicos de cálcio extracelular são responsáveis ​​por ativar a expressão assimétrica do gene regulador Nodal (Raya et al. 2004) e a inibição dos gradientes de voltagem embaralha o estabelecimento de assimetria normal (Levin et al. 2002). Pistas mecânicas, como rigidez microambiental, são cruciais para as principais transições de células migratórias em folhas organizadas durante a formação do coração (Jackson et al. 2017). Vários genes são claramente criadores de diferenças nesses processos (Asp et al. 2019 Srivastava 2006 Brand 2003 Olson 2006), mas a conclusão de que os genes carregam todas as informações necessárias para gerar características de forma do coração parece injustificada. Embora possa ser garantido empiricamente, em alguns casos, privilegiar diferenças de sequência de DNA como fatores causais em processos específicos de ontogenia (Waters 2007a), como redes hierarquicamente organizadas de fabricantes de diferenças genéticas explicando a especificação de tecidos (Peter e Davidson 2011), a diversidade de entidades apelado na genética molecular e a extensão de seus papéis individuais e conjuntos na especificação de resultados de desenvolvimento implica que os debates sobre o significado, o escopo e o poder das explicações genéticas continuarão (Griffiths e Stotz 2013). No entanto, uma mudança de programas genéticos e determinismo genético para DNA, RNA e proteínas como criadores de diferenças que operam conjuntamente sugere que conceitualizemos outros fatores causais de maneira semelhante.

3.2 Física

O fluxo de fluido, como uma força física, também faz a diferença durante o desenvolvimento do coração e da ontogenia de forma mais geral, e os biólogos do desenvolvimento apelam para os fazedores da diferença física, que são entendidos como fatores na produção das propriedades morfológicas dos fenômenos do desenvolvimento (Forgacs e Newman 2005). Uma abordagem de causação física estava em exibição no trabalho do final do século 19 de Wilhelm His (Hopwood 1999, 2000 Pearson 2018) e especialmente visível no trabalho do início do século 20 de D & rsquoArcy Thompson e outros (Thompson 1992 [1942] Keller 2002: cap. 2 Olby 1986). Isso ocorreu em um ambiente de crescente atenção à teoria cromossômica da herança e tentativas de explorar fenômenos de desenvolvimento por meio de métodos genéticos clássicos (Morgan 1923, 1926, 1934). Thompson apelou para as taxas diferenciais de crescimento e as restrições das relações geométricas para explicar como a morfologia do organismo se origina. As representações visuais de análogos abióticos e mecânicos forneceram a plausibilidade, como a forma de respingos de líquido ou gotas suspensas para as configurações de copo e sino do estágio sexual de natação livre da água-viva. Se forças físicas geraram morfologias específicas em materiais viscoelásticos, então morfologias análogas em espécies vivas devem ser explicadas em termos de forças físicas que operam nos materiais viscoelásticos do embrião em desenvolvimento. Ainda assim, os processos morfogenéticos que produzem a forma e a estrutura da morfologia foram vistos principalmente, se não exclusivamente, em termos de genética durante o último meio século. As abordagens físicas foram ficando em segundo plano à medida que as abordagens da genética molecular iam de vento em popa (Fraser e Harland, 2000).

A molecularização da embriologia experimental é uma das histórias de sucesso mais marcantes da biologia contemporânea à medida que genes e interações genéticas (por exemplo, em redes transcricionais e vias de sinalização, consulte a Seção 1.3) foram descobertos para fundamentar detalhes específicos de diferenciação, morfogênese, formação de padrões e crescimento quando a estrutura se origina durante o desenvolvimento. As abordagens genéticas predominam na biologia do desenvolvimento contemporânea e os modos físicos de causalidade são frequentemente negligenciados. A frustração entre os pesquisadores interessados ​​na causalidade física durante a embriogênese é palpável.

Para os tipos moleculares, uma causa é uma molécula ou um gene. Explicar um fenômeno é identificar genes e caracterizar proteínas sem as quais o fenômeno falhará ou será anormal. Uma molécula é uma explicação: uma força é uma descrição para argumentar de outra forma traz pena, na melhor das hipóteses (Albert Harris para John Trinkaus, 12 de março de 1996 Fonte: Marine Biological Laboratory Library Archives).

Apesar dessa predominância de abordagens explicativas genéticas e da frustração entre os pesquisadores que utilizam outras abordagens, uma onda de interesse tem sido construída em torno das explicações físicas do desenvolvimento, especialmente em termos de sua integração com as explicações genéticas (Miller e Davidson 2013 Newman 2015). Alguns filósofos argumentaram que a modelagem biomecânica de fatores causais físicos constitui uma rejeição de certas formas de explicação redutiva em biologia (Green e Batterman 2017).

3.3 Abordagens de integração: genética e física

Thompson sustentou que as forças físicas eram explicativas, mas inadequadas isoladamente para explicar a origem do desenvolvimento da morfologia, a hereditariedade (genética) também era um fator causal necessário. [13] No entanto, Thompson foi rápido em destacar que os modos mecânicos de causalidade podem ser negligenciados em meio à crescente atenção à hereditariedade (genética):

não é menos exagero se tendemos a negligenciar esses modos físicos e mecânicos diretos de causalidade, e ver nos caracteres de um osso apenas os resultados da variação e da hereditariedade. (Thompson 1992 [1942]: 1023)

Apesar desta última forma de exagero se manifestar durante grande parte do século 20, uma agenda para combinar ou integrar as duas abordagens agora está explícita. [14]

Não há controvérsia sobre se os modos genéticos e físicos de causalidade funcionam simultaneamente:

as vias de sinalização física e bioquímica do embrião contribuem para a forma do organismo. (Von Dassow et al. 2010: 1)

Eles não são explicações causais concorrentes do mesmo fenômeno. As explicações devem capturar como suas interações produtivas geram resultados de desenvolvimento:

um número crescente de exemplos aponta para a existência de uma interação recíproca entre a expressão de alguns genes do desenvolvimento e as forças mecânicas que estão associadas aos movimentos morfogenéticos. (Brouz & eacutes e Farge 2004: 372)

Causas genéticas podem levar a causas físicas e vice-versa. A causação física traz a causação genética por meio da mecanotransdução. Alongamento, contração, compressão, tensão de cisalhamento de fluido e outras dinâmicas físicas são detectados por diferentes componentes moleculares dentro e fora das células que traduzem essas mudanças ambientais em sinais bioquímicos (Hoffman et al. 2011 Wozniak e Chen 2009). A causação genética traz a causação física ao criar diferentes propriedades físicas de células e tecidos por meio da presença, ausência ou mudança na frequência de proteínas específicas. Por exemplo, diferentes padrões de expressão para moléculas de adesão celular (por exemplo, caderinas) podem levar à adesão diferencial através de folhas epiteliais de tecido e, assim, gerar separações de fase ou compartimentos por meio de variação de tensão superficial (Newman e Bhat 2008). Se esses modos de causalidade não estão competindo, então como podemos combinar os criadores de diferenças genéticas e físicas em uma explicação causal integrada? Quanta unidade explicativa pode ser alcançada para essa & ld interação quorecíproca & rdquo?

Encontrar modelos filosóficos para a integração explicativa da genética e da física permanece uma questão em aberto (Love 2017b). A distribuição da responsabilidade causal no sentido de determinar as contribuições relativas (por exemplo, a composição das magnitudes causais entre as diferentes forças físicas na mecânica newtoniana) é problemática porque requer comensurabilidade com relação a como as causas produzem seus efeitos (Sober 1988). No contexto da causalidade entendida em termos de fazedores de diferença, a dificuldade de integração é uma variação de um problema de raciocínio causal identificado por John Stuart Mill e rotulado de & ldquointermixture of effects & rdquo, que envolve múltiplas causas contribuindo de uma forma combinada para produzir uma resultado.

Essa dificuldade é mais evidente no caso dos fenômenos fisiológicos, sendo raramente possível separar as diferentes agências que compõem coletivamente um corpo organizado, sem destruir os próprios fenômenos que é nosso objetivo investigar. (Mill 1843 [1974]: 456 [livro 3, capítulo 11, seção 1, parágrafo 7])

Metodologia estatística cuidadosa em experimentos pode responder se um tipo de fazedor de diferenças é responsável por mais da variação na variável de efeito para uma determinada população. Mas uma classificação de fatores causais com relação a quanta diferença eles fizeram não é o mesmo que combinar dois modos de causalidade em um relato integrado. Outra resposta é dissolver o problema de integração reduzindo todas as interações causais a um dos dois modos distintos, alcançando assim uma espécie de unidade explicativa (Rosenberg 2006). No entanto, essa abordagem é evitada por biólogos ativos que consideram os modos genéticos e físicos de causalidade como significativos e não redutíveis um ao outro.

Uma estratégia diferente é o pluralismo integrativo (Mitchell 2002). Isso envolve um procedimento de duas etapas para explicar fenômenos complexos cujas características são o resultado de múltiplas causas: (a) formular modelos idealizados onde fatores causais particulares operam isoladamente (& ld modelagem teórica & rdquo) e, (b) integrar modelos idealizados para explicar como particulares, fenômenos concretos se originam dessas causas em combinação. Este modelo é sugestivo, mas também tem desvantagens importantes que incluem o fato de que o raciocínio causal genético na biologia do desenvolvimento normalmente não envolve modelagem teórica e a natureza precisa da integração não é especificada. A integração dos criadores de diferenças genéticas e físicas em um único mecanismo oferece uma possibilidade adicional (Darden 2006 Craver 2007). Embora isso destaque de forma valiosa a continuidade produtiva entre os fazedores de diferença por meio de estágios em uma sequência (ou seja, sua interação recíproca), também tem desvantagens. Esses incluem:

Abordagens divergentes para medir o tempo. Em vez do tempo - o mecanismo - o tempo é medido com estágios externos padronizados (veja abaixo, Seção 5.2). Os estágios facilitam o estudo de diferentes tipos de mecanismos de desenvolvimento, com diferentes taxas e durações características para seus estágios, dentro de uma estrutura comum para um organismo modelo (por exemplo, Drosófila), embora também permita que mecanismos moleculares conservados sejam estudados em diferentes espécies, porque a descrição do mecanismo correspondente não está ancorada na sequência temporal do organismo modelo.

Uma expectativa de que as descrições do mecanismo "saiam" das atividades de nível mais baixo de entidades moleculares (Darden 2006). No caso de combinar os criadores de diferenças genéticas e físicas, a interação recíproca significa que há uma evitação estudada de atingir o fundo do poço em um ou outro modo de causalidade.

O requisito de organização composicional estável para mecanismos:

Explicações mecanísticas são explicações constitutivas ou componenciais: elas explicam o comportamento do mecanismo como um todo em termos das atividades organizadas e da interação de seus componentes. (Craver 2007: 128)

Mas essas descrições de mecanismo estão frequentemente inseridas em contextos de desenvolvimento diferentes (em momentos diferentes na ontogenia) com relações composicionais distintas (dentro e entre as espécies). A interação recíproca entre os criadores de diferenças genéticas e físicas não é mantida precisamente porque essas diferenças composicionais alteram as relações de causalidade física (fluxo de fluido, tensão etc., consulte a Seção 1.3). Os biólogos desenvolvimentistas foram capazes de generalizar as relações de causalidade genética (em termos de mecanismos genéticos, ver Seção 1.3) entre as espécies de forma bastante ampla, mas a tentativa de combiná-las com a causalidade física exigiu o estreitamento do escopo das alegações causais.

Modelos filosóficos adequados da dependência sistemática entre os criadores de diferenças genéticas e físicas na ontogenia precisam dar conta de como as relações temporais necessárias para fazer afirmações causais estão ancoradas em uma periodização externa usada por biólogos do desenvolvimento. A imposição de diferentes escalas temporais pode fazer com que fatores distintos sejam significativos ou salientes, o que importa para determinar como diferentes tipos de causas podem ser combinados em explicações integradas. Uma possibilidade é justapor esses fazedores de diferença em estágios distintos por meio de verificação experimental, de modo que exibam continuidade produtiva dentro das restrições da periodização externa (Love 2017b). Isso facilita a representação da simetria entre os fatores causais porque os fabricantes de diferenças genéticas podem ser colocados antes ou depois dos fabricantes de diferenças físicas (e vice-versa) Embora isso não forneça uma maneira de combinar magnitudes causais (como na adição de vetores da mecânica newtoniana), oferece uma estratégia explícita para atribuir responsabilidade entre diferentes tipos de causas por meio do veículo de organização temporal que vai além de classificar os criadores de diferenças. A periodização serve como um modelo a partir das práticas dos biólogos do desenvolvimento para fornecer totalidade ou unidade aos diferentes modos de causalidade para produzir um tipo de explicação integrada da morfologia que resulta de uma sequência de processos de desenvolvimento.

Nem todos os tipos de explicação causal envolvem uma periodização externa e há outras maneiras de combinar causas a fim de produzir estruturas explicativas mais integradas. Uma área onde explicações combinadas para fenômenos de desenvolvimento estão sendo analisadas diz respeito a descrições de mecanismos e modelagem matemática em biologia de sistemas (Brigandt 2013 Fagan 2013). Por exemplo, Fagan (2013: cap. 9) mostra como uma explicação integrada emerge de um procedimento passo a passo que começa com uma descrição detalhada de um mecanismo molecular seguido pela formulação de um diagrama de fiação abstraído de interações de componentes, que é então traduzido em um sistema de equações que pode levar em conta as mudanças nas interações de componentes ao longo do tempo. Soluções para esses sistemas de equações e um mapeamento de soluções para as interações entre os componentes do sistema no comportamento do sistema geral dentro de uma representação de paisagem compartilhada explica mais sistematicamente a diferenciação celular.


Por que a biologia é importante na vida cotidiana?

A biologia é importante para a vida cotidiana porque permite que os humanos entendam melhor seus corpos, seus recursos e ameaças potenciais ao meio ambiente. A biologia é o estudo de todos os seres vivos, portanto, ajuda as pessoas a entender todos os organismos vivos, desde as menores bactérias até as sequoias da Califórnia e as baleias azuis. Biólogos profissionais geralmente se concentram em um pequeno subconjunto de organismos vivos, como pássaros, plantas ou bactérias.

O estudo da biologia ajudou os humanos a compreender as semelhanças entre todas as formas de vida. Por exemplo, o código genético que ajuda a construir todos os organismos vivos é muito semelhante em todas as formas de vida. O material genético é armazenado na forma de DNA para todas as plantas, animais, bactérias e fungos. Ao estudar o DNA de todas essas formas de vida diferentes, os biólogos determinaram que todas as criaturas vivas estão relacionadas entre si.

A biologia também ajudou os médicos a aprender como manter as pessoas saudáveis ​​e combater doenças. Os biólogos aprenderam que coisas chamadas patógenos, que são outras entidades vivas, causam doenças. Ao compreender como esses organismos perigosos funcionam, os cientistas podem combatê-los. Por causa da biologia, muitas pessoas viveram muito porque foram capazes de evitar doenças.


Resultados

Visão geral do método PseudotimeDE

O método estatístico de PseudotimeDE consiste em quatro etapas principais: subamostragem, inferência de pseudotime, ajuste de modelo e teste de hipótese (Fig. 1). As duas primeiras etapas são realizadas no nível da célula e incluem todos os genes informativos (cuja seleção depende do método de inferência de pseudotempo, por exemplo, Slingshot e Monocle3-PI), enquanto as duas últimas etapas são realizadas em cada gene que é potencialmente DE.

Na etapa de subamostragem, PseudotimeDE subamostra 80% das células do conjunto de dados original para capturar a incerteza da inferência de pseudotime, a mesma técnica usada em [9, 11, 30].

Uma ilustração do método PseudotimeDE (criado com BioRender.com). O núcleo do PseudotimeDE é obter uma distribuição nula válida da estatística de teste do gene DE Sj para cada gene j. Para conseguir isso, PseudotimeDE subamostra 80% das células dos dados scRNA-seq originais. Em seguida, em cada subamostra, PseudotimeDE realiza inferência de pseudotime (usando um método especificado pelo usuário, como Slingshot e Monocle3-PI) e permuta o pseudotime inferido nas células. Em seguida, PseudotimeDE ajusta um modelo (NB-GAM ou ZINB-GAM) às subamostras permutadas para obter os valores de Sj sob a hipótese nula e usa esses valores para aproximar a distribuição nula de Sj. Em paralelo, PseudotimeDE ajusta o mesmo modelo ao conjunto de dados original e calcula o valor observado de Sj. Finalmente, PseudotimeDE deriva o p-valor do valor observado e a distribuição nula de Sj. Os detalhes são descritos na seção "Métodos"

Na etapa de inferência de pseudotempo, PseudotimeDE aplica um método de inferência de pseudotempo especificado pelo usuário ao conjunto de dados original e a cada subamostra, de modo que cada célula receba seu pseudotempo inferido no conjunto de dados original e todas as subamostras que o incluem. Para construir casos nulos em que os genes não são DE para teste de hipótese posterior, PseudotimeDE permuta o pseudotime inferido em cada subamostra, independente de outras subamostras.

Na etapa de ajuste do modelo, PseudotimeDE ajusta NB-GAM ou GAM binomial negativo inflado de zero (ZINB-GAM) para cada gene no conjunto de dados original para obter uma estatística de teste que indica o tamanho do efeito do pseudotime inferido na expressão do gene.

Na etapa de teste de hipótese, para cada gene, Pseudotime ajusta o mesmo modelo usado para o conjunto de dados original para as subamostras permutadas para obter valores nulos aproximados da estatística de teste do gene (os valores nulos são aproximados porque as subamostras não têm o mesmo número de células como no conjunto de dados original). Para salvar o número de subamostras necessárias e para melhorar o p-value resolução, Pseudotime ajusta uma distribuição Gamma ou uma mistura de duas distribuições Gamma para esses valores nulos. Subseqüentemente, ele usa a distribuição paramétrica ajustada como a distribuição nula aproximada da estatística de teste. Finalmente, PseudotimeDE calcula uma cauda direita p-valor para o gene da estatística de teste do gene no conjunto de dados original e a distribuição nula aproximada.

Mais detalhes sobre PseudotimeDE são descritos na seção “Métodos”.

Simulações verificam se PseudotimeDE supera os métodos existentes na validade de p-valores e o poder de identificação

Usamos uma dinâmica de simulador amplamente utilizada [9, 16] para gerar quatro conjuntos de dados scRNA-seq sintéticos, entre os quais três são conjuntos de dados de linha única com níveis de baixa, média e alta dispersão, e o outro é um conjunto de dados de bifurcação . Uma vez que o conjunto de dados de alta dispersão de linha única se assemelha melhor aos dados reais de scRNA-seq (arquivo adicional 1: Figura S1), nós o usamos como nosso caso principal. Aplicamos dois métodos de inferência de pseudotempo - Slingshot e Monocle3-PI - a cada conjunto de dados sintético para inferir o pseudotempo celular.

Primeiro, descobrimos que PseudotimeDE captura com sucesso a incerteza subjacente do pseudotime inferido. A primeira camada - “incerteza linear” - reflete a aleatoriedade do pseudotime celular inferido dentro de uma linhagem celular (Fig. 2a e amp c). A Figura 2b, & amp d mostra as distribuições de pseudotempo inferido de células individuais por Slingshot e Monocle3-PI, respectivamente, em 1000 conjuntos de dados subamostrados, confirmando que a incerteza linear é específica para métodos de inferência de pseudotempo. Entre os dois métodos, Monocle3-PI demonstra maior incerteza linear. A segunda camada - “incerteza de topologia” - reflete a aleatoriedade da construção da linhagem. O conjunto de dados de bifurcação sintética contém duas linhagens de células. O Slingshot constrói corretamente a topologia de bifurcação do conjunto de dados original e os 1000 conjuntos de dados subamostrados. Enquanto Monocle3-PI captura a topologia de bifurcação do conjunto de dados original (Fig. 2e), ele falha em capturar a topologia de mais de 50% das subamostras (Fig. 2f mostra 10 subamostras escolhidas aleatoriamente), demonstrando sua maior incerteza de topologia do que a de Slingshot.

PseudotimeDE captura a incerteza na inferência de pseudotime. uma Visualização de células sintéticas de linhagem única marcadas com pseudotime inferido por Slingshot (usando PCA). A curva preta denota a linhagem inferida. b As distribuições de pseudotempo inferido de células individuais por Slingshot em subamostras. No eixo vertical, as células são ordenadas por seu tempo real na linhagem usada na simulação para cada célula (uma coordenada vertical), os pontos pretos têm coordenadas horizontais correspondentes ao pseudotempo inferido da célula nas subamostras que incluem a célula. Quanto mais espalhados horizontalmente os pontos pretos, maior a incerteza que a inferência do pseudo-tempo tem. c Visualização de células sintéticas de linhagem única marcadas com pseudotime inferido por Monocle3-PI (usando UMAP). A curva preta denota a linhagem inferida. Comparado com (a), a linhagem inferida é mais oscilante. d As distribuições de pseudotime inferido de células individuais por Monocle3-PI em subamostras. Comparado com (b), a incerteza na inferência de pseudotempo é maior. e Visualização de células bifurcadas sintéticas marcadas com pseudotime inferido por Monocle3-PI (usando UMAP). Monocle3-PI recupera a topologia de bifurcação. f Visualização de dez subamostras das células em (e), marcado com pseudotime inferido por Monocle3-PI (usando UMAP) em cada subamostra. Quatro das dez subamostras não têm a topologia de bifurcação inferida corretamente (marcada com “F” vermelho), revelando a incerteza na inferência de pseudotime pelo Monocle3-PI. Em painéis uma, c, e, e f, o pseudotempo inferido é representado por uma escala de cores de 0 (o pseudotempo mais antigo) a 1 (o pseudotempo mais recente)

Depois de confirmar a incerteza da inferência do pseudotime, comparamos o PseudotimeDE com quatro métodos de identificação do gene DE: tradeSeq, Monocle3-DE, NBAMSeq e ImpulseDE2. Os dois primeiros métodos, tradeSeq e Monocle3-DE, são o estado da arte para a análise de dados scRNA-seq e, portanto, atuam como os principais concorrentes do PseudotimeDE. Em nosso benchmark, primeiro avaliamos esses métodos em termos da validade de seus p-valores, que devem ser uniformemente distribuídos entre 0 e 1 sob a hipótese nula (ou seja, um gene não é DE). Nossos resultados mostram que, entre os cinco métodos, o PseudotimeDE gera o melhor calibrado p-valores que seguem a distribuição uniforme esperada mais de perto (Fig. 3a, & amp f e Arquivo adicional 1: Figs. S3 – S5a & amp f). Entre os quatro métodos existentes, apenas Monocle3-DE fornece aproximadamente calibrado p-values, enquanto a saída tradeSeq, NBAMSeq e ImpulseDE2 p-valores que estão muito desviados da distribuição uniforme esperada. Esta observação é confirmada pelo teste de Kolmogorov-Smirnov, que avalia o quão próximo p-valores seguem a distribuição uniforme. Uma vez que a identificação dos genes DE depende de um pequeno p- valor de corte, o menor p-valores são mais importantes do que os maiores. Portanto, re-plotamos o p-valores na escala - log10 para examinar de perto a calibração de pequenos p-valores (Fig. 3b, & amp g e Arquivo adicional 1: Figs. S3 – S5b & amp g). Novamente, PseudotimeDE retorna o melhor calibrado p-valores, enquanto os outros quatro métodos geram excessivamente pequenos p-valores que inflariam falsas descobertas. Isso se reflete em nossos resultados: em um limite de FDR de 5% alvo, PseudotimeDE leva ao melhor controle de FDR entre todos os métodos (Fig. 3c, & amp h e Arquivo adicional 1: Figs. S3-S5c & amp h).

PseudotimeDE supera quatro métodos de última geração (tradeSeq, Monocle3-DE, NBAMSeq e ImpulseDE2) para identificar genes DE ao longo do pseudotime celular. Painéis esquerdos umae são baseados em pseudotempo inferido pelos painéis direitos do Slingshot fj são baseados em pseudotime inferidos por Monocle3-PI. uma, f Distribuições de genes não-DE observados p-valores por cinco métodos DE com pseudotempo inferido. Topo: gráficos quantil-quantil que comparam os quantis empíricos dos observados p-valores em relação aos quantis esperados da distribuição Uniforme [0,1]. Abaixo: histogramas do observado p-valores. o p-valores mostrados no topo dos histogramas são do teste de Kolmogorov – Smirnov sob a hipótese nula de que a distribuição é Uniforme [0,1]. Quanto maior o p-valor, mais uniforme é a distribuição. Entre os cinco métodos DE, PseudotimeDE's observados p-valores seguem mais de perto a distribuição Uniforme [0,1] esperada. b, g Gráficos de quantil-quantil do mesmo p-valores como em uma e f na escala log10 negativa. PseudotimeDE retorna melhor calibrado pequeno p-valores do que os outros quatro métodos fazem. c, h FDPs dos cinco métodos DE com o FDR alvo 0,05 (BH ajustado- p≤0,05). PseudotimeDE produz o FDP mais próximo de 0,05. d, eu Curvas ROC e valores AUROC dos cinco métodos DE. PseudotimeDE atinge o AUROC mais alto. e, j Potência dos cinco métodos DE sob o FDP = 0,05 de corte. PseudotimeDE atinge o maior poder

Em seguida, comparamos esses métodos em termos de sua capacidade de distinguir genes DE de genes não-DE, capacidade medida pela área sob os valores da curva de característica de operação do receptor (AUROC) (Fig. 3d, & amp i e Arquivo adicional 1: Figs. S3 – S5d & amp i). PseudotimeDE atinge os valores AUROC mais altos. Entre os outros quatro métodos, tradeSeq e NBAMSeq têm valores AUROC ligeiramente mais baixos do que PseudotimeDE's, e Monocle3-DE e ImpulseDE2 têm valores AUROC muito mais baixos do que os outros três métodos '. A razão é que PseudotimeDE, tradeSeq e NBAMSeq usam o modelo flexível NB-GAM, enquanto Monocle3-DE e ImpulseDE2 usam modelos muito mais restritivos, que limitam seu poder.

Percebendo que o mal calibrado p- os valores dos quatro métodos existentes invalidam seu controle FDR, comparamos todos os cinco métodos em termos de seu poder sob uma proporção real de descobertas falsas de 5% (FDP, definida como a proporção de descobertas falsas entre as descobertas em um conjunto de dados sintético) em vez de o FDR nominal de 5%. Nossos resultados mostram que PseudotimeDE atinge a maior potência em todos os conjuntos de dados, exceto para o conjunto de dados de bifurcação, onde PseudotimeDE tem potência ligeiramente inferior do que tradeSeq (Fig. 3e, & amp j e Arquivo adicional 1: Figs.S3 – S5e e amp j). Esses resultados demonstram o alto poder do PseudotimeDE e seu controle eficaz de FDR, o que falta nos métodos existentes.

Em resumo, nossos resultados de simulação verificam que o PseudotimeDE supera os métodos existentes em termos de geração de p-valores, que são essenciais para o controle de FDR e identificação de genes DE com alto poder. Notavelmente, os dois métodos de RNA-seq em massa, NBAMSeq e ImpulseDE2, produzem resultados piores do que os três métodos de scRNA-seq. Portanto, nos concentramos apenas nos métodos scRNA-seq nos três aplicativos de dados reais a seguir.

Exemplo de dados reais 1: células dendríticas estimuladas com lipopolissacarídeo

Na primeira aplicação, comparamos PseudotimeDE com tradeSeq e Monocle3-DE em um conjunto de dados de células dendríticas de camundongo (DCs) após estimulação com lipopolissacarídeo (LPS, um componente de bactérias gram-negativas) [31]. Neste conjunto de dados, espera-se que as alterações na expressão gênica estejam associadas ao processo de resposta imune. Primeiro aplicamos Slingshot e Monocle3-PI a este conjunto de dados para inferir o pseudotime celular e, em seguida, inserimos o pseudotime inferido em PseudotimeDE, tradeSeq e Monocle3-DE para identificação do gene DE. Consistente com nossos resultados de simulação, o p-valores de tradeSeq estão mal calibrados: suas distribuições bimodais indicam que eles não seguem a distribuição uniforme sob a hipótese nula, muitos deles estão inflados, e essa inflação levaria à perda de potência na identificação do gene DE (Fig. 4a, & amp e). Na verdade, em um Benjamini-Hochberg (BH) nominal ajustado p-valor ≤0,01 limite (que corresponde a controlar o FDR ≤1% quando p-valores são válidos), tradeSeq identifica o menor número de genes DE, enquanto PseudotimeDE identifica a maioria dos genes DE, seguido por Monocle3-DE. Notavelmente, a maioria dos genes DE identificados por tradeSeq também são identificados por PseudotimeDE (Fig. 4b, & amp f), um resultado consistente com o excesso de conservatividade de tradeSeq devido ao seu inflado p-valores. Ao contrário de tradeSeq, Monocle3-DE não exibe o inflacionado p-valor questão no entanto, ele usa um modelo mais restritivo do que PseudotimeDE e tradeSeq fazem. Portanto, usamos análises funcionais para investigar se Monocle3-DE perde certos genes DE devido à sua modelagem restritiva. Também investigamos se os genes DE adicionais encontrados por PseudotimeDE, mas perdidos por tradeSeq ou Monocle3-DE, são biologicamente significativos.

Aplicação de PseudotimeDE, tradeSeq e Monocle3-DE ao conjunto de dados de células LPS-dendríticas. Painéis esquerdos umad são baseados em pseudotempo inferido pelos painéis direitos do Slingshot eh são baseados em pseudotime inferidos por Monocle3-PI. uma, e Histogramas de todos os genes p-valores pelos três métodos DE. As distribuições bimodais de tradeSeq's p-valores sugerem uma violação do requisito de que p-valores seguem a distribuição Uniforme [0,1] sob a hipótese nula. b, f Gráficos de Venn mostrando as sobreposições dos genes DE significativos (BH ajustado- p≤0,01) identificado pelos três métodos DE. Os genes DE de PseudotimeDE quase incluem tradeSeq. c, g Números de termos GO enriquecidos (p& lt0.01) nos genes DE significativos especificamente encontrados por PseudotimeDE ou tradeSeq / Monocle3-DE em comparações de pares entre PseudotimeDE e tradeSeq / Monocle3-DE em b e f. Muitos mais termos GO são enriquecidos nos genes DE específicos de PseudotimeDE do que nos específicos tradeSeq- ou Monocle3-DE. d, h Exemplo de termos GO enriquecidos nos genes DE específicos de pseudotime em c e g. Muitos desses termos estão relacionados a LPS, processo imunológico e defesa contra bactérias

Nossa primeira estratégia é realizar a análise da ontologia genética (GO) nos genes DE identificados por cada método e comparar os termos GO enriquecidos. Descobrimos que mais termos GO são enriquecidos (com enriquecimento p-valores & lt0.01) nos genes DE identificados por PseudotimeDE (arquivo adicional 1: Fig. S6a & amp c) e que os termos GO específicos de PseudotimeDE estão relacionados a respostas imunes (arquivo adicional 1: Fig. S6b & amp d). No entanto, a comparação de termos GO enriquecidos não reflete diretamente a diferença de genes DE identificados por métodos diferentes. Portanto, nossa segunda estratégia é investigar as funções dos genes DE que são identificados exclusivamente por um método em comparações de pares de PseudotimeDE vs. tradeSeq e PseudotimeDE vs. Monocle3-DE. Primeiro, realizamos a análise GO em cada conjunto de genes DE identificados de forma exclusiva. Para uma comparação justa de dois métodos, removemos os genes DE sobrepostos encontrados por ambos os métodos da lista de genes de fundo na análise GO. Nossos resultados mostram que muitos mais termos GO são enriquecidos (com enriquecimento p-valores & lt0,01) em genes DE específicos de pseudotime do que em genes DE específicos de tradeSeq- ou Monocle3-DE (Fig. 4c, & amp g). Além disso, muitos desses termos GO específicos de PseudotimeDE estão diretamente relacionados às respostas imunes de DCs à estimulação de LPS, incluindo os termos GO "resposta celular a lipopolissacarídeo" e "resposta de defesa a bactéria Gram-negativa" (Fig. 4d, & amp h Arquivo adicional 2: Tabela S1). Para focar mais nas respostas imunológicas, realizamos a seguir uma análise de enriquecimento usando as assinaturas imunológicas (C7) no Banco de Dados de Assinaturas Moleculares (MSigDB) [32]. Nossos resultados mostram que apenas genes DE específicos de PseudotimeDE têm termos MSigDB C7 enriquecidos (com BH ajustado p-values ​​& lt0.01), enquanto os genes DE específicos de tradeSeq- e Monocle3-DE quase não têm enriquecimento (Arquivo adicional 1: Fig. S7a e amp c). Mais importante ainda, muitos termos enriquecidos em genes DE específicos de PseudotimeDE foram encontrados por estudos anteriores de DCs estimulados com LPS (ver exemplos no arquivo adicional 1: Fig. S7b & amp d Arquivo adicional 2: Tabela S1) esta é uma evidência direta que apóia a validade de genes DE específicos de PseudotimeDE. Para fins de ilustração, visualizamos os níveis de expressão de alguns genes DE conhecidos e novos identificados por PseudotimeDE usando UMAP, e padrões claros de DE são observados (arquivo adicional 1: Fig. S8-S9). Em conclusão, nossas análises funcionais verificam que PseudotimeDE identifica genes DE biologicamente significativos perdidos por tradeSeq e Monocle3-DE, confirmando que PseudotimeDE tem alto poder, além de sua p-valores.

Exemplo de dados reais 2: maturação de células beta pancreáticas

Na segunda aplicação, comparamos PseudotimeDE com tradeSeq e Monocle3-DE em um conjunto de dados do processo de maturação de células beta de camundongo [33]. Primeiro aplicamos Slingshot e Monocle3-PI a este conjunto de dados para inferir o pseudotime celular e, em seguida, inserimos o pseudotime inferido em PseudotimeDE, tradeSeq e Monocle3-DE para identificação do gene DE. Consistente com os resultados anteriores, o p-valores de tradeSeq seguem uma distribuição bimodal, sugerindo que muitos deles estão incorretamente inflados (Fig. 5a, & amp f). No BH nominal ajustado p-valor ≤ 0,01 nível, PseudotimeDE identifica os segundos genes mais DE, menos do que os genes DE identificados de Monocle3-DE e muito mais do que tradeSeq (Fig. 5b, & amp g). Como o número de genes DE identificados não pode refletir o desempenho desses métodos, usamos três abordagens para avaliar os genes DE identificados por cada método.

Aplicação de PseudotimeDE, tradeSeq e Monocle3-DE ao conjunto de dados de maturação de células beta pancreáticas. Painéis esquerdos umae são baseados em pseudotempo inferido pelos painéis direitos do Slingshot fj são baseados em pseudotime inferidos por Monocle3-PI. uma, f Histogramas de todos os genes p-valores pelos três métodos DE. As distribuições bimodais de tradeSeq's p-valores sugerem uma violação do requisito de p-valores seguem a distribuição Uniforme [0,1] sob a hipótese nula. b, g Gráficos de Venn mostrando as sobreposições dos genes DE significativos (BH ajustado- p≤0,01) identificado pelos três métodos DE. Os genes DE de PseudotimeDE quase incluem tradeSeq. c, h Números de termos GO enriquecidos (p& lt0.01) nos genes DE significativos especificamente encontrados por PseudotimeDE ou tradeSeq / Monocle3-DE em comparações de pares entre PseudotimeDE e tradeSeq / Monocle3-DE em b e g. Muitos mais termos GO são enriquecidos nos genes DE específicos de PseudotimeDE do que nos específicos tradeSeq- ou Monocle3-DE. d, eu Exemplo de termos GO enriquecidos nos genes DE específicos de pseudotime em c e h. Muitos desses termos estão relacionados à insulina, regulação das células beta e desenvolvimento do pâncreas. e, j Dois exemplos de genes: Slc39a10 (DE) e Sst (não-DE). Para Slc39a10, PseudotimeDE e Monocle3-DE produzem pequeno p-values ​​(p& lt1e − 6), enquanto tradeSeq não (p& gt0.1). Para Sst, PseudotimeDE produz maior p-valores do que tradeSeq e Monocle3-DE. As linhas azuis tracejadas são as curvas ajustadas por NB-GAM

Primeiramente, realizamos a análise GO em cada conjunto de genes DE identificados exclusivamente, usando as mesmas comparações de pares de PseudotimeDE vs. tradeSeq e PseudotimeDE vs. Monocle3-DE como para os dados LPS-dendríticos. Nossos resultados mostram que mais termos GO são enriquecidos (com enriquecimento p-valores & lt0,01) em genes DE específicos de PseudotimeDE do que em genes DE específicos de tradeSeq- ou Monocle3-DE (Fig. 5c, & amp h). Além disso, muitos desses termos GO específicos do PseudotimeDE estão diretamente relacionados ao desenvolvimento de células beta pancreáticas, por exemplo, "regulação positiva / negativa da via de sinalização Notch" [34] e "desenvolvimento do pâncreas endócrino" (Fig. 5c, e arquivo adicional 3 : Tabela S2). Como resultado complementar, também realizamos análises GO nos genes DE identificados por cada método. Descobrimos que os termos GO, que são enriquecidos apenas nos genes DE identificados por PseudotimeDE, estão relacionados ao desenvolvimento de células beta e, portanto, são mais biologicamente significativos do que os termos GO que são enriquecidos apenas nos genes DE identificados por tradeSeq ou Monocle3-DE ( Arquivo adicional 1: Fig. S10b e amp d).

Em segundo lugar, utilizamos os genes DE identificados a partir de dados bulk RNA-seq no artigo original [33] para avaliar os rankings de genes DE estabelecidos por PseudotimeDE, tradeSeq e Monocle3-DE a partir de dados de scRNA-seq. Tomando os genes DE em massa como um conjunto de genes, realizamos a análise de enriquecimento do conjunto de genes (GSEA) [32] em todos os genes '- log10p-valores de saída por PseudotimeDE, tradeSeq e Monocle3-DE. Entre os três métodos, PseudotimeDE leva à pontuação de enriquecimento normalizado mais alto (NES) (arquivo adicional 3: Tabela S2), sugerindo que os genes de DE em massa são mais enriquecidos nos genes de DE com classificação superior encontrados por PseudotimeDE.

Terceiro, examinamos um gene DE altamente confiável Slc39a10 [33, 35] e um gene não-DE verificado Sst [33] como exemplos representativos. Para Slc39a10, PseudotimeDE e Monocle3-DE produzem pequeno p-values ​​(& lt10 −6), enquanto tradeSeq gera um p-valor & gt0.1 e, portanto, perdê-lo (Fig. 5e, & amp g). Para Sst, PseudotimeDE produz o maior p-value (& gt0.001), enquanto tradeSeq e Monocle3-DE rendem extremamente pequeno p-valores (& lt10 −10) e, portanto, confundi-lo com um gene DE. Portanto, PseudotimeDE tem o melhor desempenho nesses dois genes representativos.

Para fins de ilustração, visualizamos os níveis de expressão de alguns genes DE conhecidos e novos identificados por PseudotimeDE usando UMAP, e padrões de DE claros são observados (arquivo adicional 1: Figs. S11-S12).

Exemplo de dados reais 3: diferenciação da medula óssea

Na terceira aplicação, comparamos PseudotimeDE com tradeSeq e Monocle3-DE em um conjunto de dados de diferenciação da medula óssea de camundongos [36]. Aplicamos o Slingshot com UMAP para redução de dimensionalidade para inferir o pseudotempo da célula, conforme descrito no artigo tradeSeq [16]. Slingshot constrói a topologia de bifurcação relatada (no documento tradeSeq) no conjunto de dados original (Fig. 6a), mas infere a topologia de trifurcação, em vez da topologia de bifurcação, em 40% das subamostras (a Fig. 6b mostra dez subamostras escolhidas aleatoriamente). Observe que a terceira linhagem consistindo do megacariócito do tipo de célula (MK) foi relatada no artigo Monocle2 ([12]), sugerindo que a incerteza de topologia observada pode ser biologicamente significativa.

Aplicação de PseudotimeDE, tradeSeq e Monocle3-DE ao conjunto de dados de medula óssea de camundongos. uma Visualização UMAP e pseudotempo inferido por Slingshot. Os tipos de células predefinidos são marcados por cores. Slingshot retorna uma topologia de bifurcação, denotada como linhagem 1 (esquerda) e linhagem 2 (direita). b Visualização UMAP e pseudotempo inferido por Slingshot em dez subamostras aleatórias. Quatro em cada dez subamostras não produzem topologia de bifurcação, mas topologia de trifurcação, onde a terceira linhagem contém principalmente o tipo de célula “MK” e foi relatado em [12]. c Histogramas de todos os genes p-valores calculados pelos três métodos DE na primeira linhagem. d Histogramas de todos os genes p-valores calculados pelos três métodos DE na segunda linhagem. e Gráfico de Venn mostrando as sobreposições dos genes DE significativos (BH ajustado- p≤0,01) identificado pelos três métodos DE na linhagem 1. PseudotimeDE e tradeSeq compartilham 77,6% (índice de Jaccard) dos genes DE. (f) Números de conjuntos de genes enriquecidos (q& lt0.25) por GSEA usando o p-valores na linhagem 1 pelos três métodos DE. Embora os genes DE sejam semelhantes em e, PseudotimeDE produz 270 conjuntos de genes enriquecidos, enquanto tradeSeq produz apenas 9. g Gráfico de Venn mostrando as sobreposições dos genes DE significativos (BH ajustado- p≤ 0,01) identificado pelos três métodos DE na linhagem 2. Semelhante à linhagem 1 na g, PseudotimeDE e tradeSeq compartilham 77,2% (índice de Jaccard) dos genes DE. h Números de conjuntos de genes enriquecidos (q& lt0.25) por GSEA usando o p-valores na linhagem 2 pelos três métodos DE. PseudotimeDE e Monocle3-DE geram centenas de conjuntos de genes enriquecidos, enquanto tradeSeq não produz nenhum conjunto de genes enriquecidos

Para uma comparação justa, fazemos PseudotimeDE usar apenas as subamostras com topologia de bifurcação inferida, porque tradeSeq e Monocle3-DE usam a topologia de bifurcação inferida dos dados originais para identificar genes DE. Consistente com os resultados anteriores, o tradeSeq p-valores seguem uma distribuição bimodal que é inesperada para bem calibrados p-valores. Em um BH nominal ajustado p-valor ≤ 0,01 limiar, os três métodos identificam genes DE altamente semelhantes (Fig. 6e, & amp g). Por exemplo, PseudotimeDE e tradeSeq compartilham cerca de 80% de seus genes DE identificados (índice de Jaccard). Dos poucos genes DE específicos do método, as análises funcionais não podem indicar qual método tem melhor desempenho. Portanto, usamos GSEA em vez de avaliar métodos ' p-valores. Surpreendentemente, embora os três métodos identifiquem genes DE altamente semelhantes, seus p-valores levam a resultados GSEA amplamente diferentes. No qnível & lt0,25, PseudotimeDE e Monocle3-DE produzem centenas de conjuntos de genes enriquecidos, enquanto tradeSeq produz apenas alguns ou nenhum conjunto de genes enriquecidos (Fig. 6f, & amp h Arquivo adicional 4: Tabela S3). Este resultado indica que, além da classificação de p-valores, os valores nominais de p-valores também são cruciais para análise downstream, como GSEA. Portanto, o bem calibrado p-valores tornam o PseudotimeDE superior aos métodos existentes para identificação do gene DE e análises posteriores.

Exemplo de dados reais 4: subtipos de células T natural killer

Na quarta aplicação, comparamos PseudotimeDE com tradeSeq e Monocle3-DE em um conjunto de dados de subtipos de célula T natural killer (célula NKT) [37]. Aplicamos Slingshot com PCA para redução de dimensionalidade para inferir o pseudotime celular e construir a topologia de trifurcação (Fig. 7a) relatada no estudo original. Aplicamos os três métodos DE para identificar genes de DE em cada uma das três linhagens. Consistente com os resultados anteriores, o p-valores de tradeSeq seguem uma distribuição bimodal, sugerindo que muitos deles estão incorretamente inflados (Fig. 7b).

Aplicação de PseudotimeDE, tradeSeq e Monocle3-DE ao conjunto de dados de células T natural killer. uma Visualização PCA e pseudotempo inferido por Slingshot. Os subtipos NKT predefinidos são marcados por cores. Slingshot retorna uma topologia de trifurcação, onde as três linhagens são NKT0 a NKT1, NKT0 a NKT17 e NKT0 a NKT2. b Histogramas de todos os genes p-valores nas três linhagens calculadas pelos três métodos DE. c Mapas de calor de pontuações de enriquecimento normalizado (NESs, marcados por cores) e seus correspondentes p-valores (em números) do GSEA. Cada valor NES e seus correspondentes p-valores são calculados para cada método DE e cada linhagem, com base no p-valores de um método DE para uma linhagem e os genes DE dessa linhagem encontrados a partir de dados de RNA-seq em massa, denotados por "NKT1 bulk", "NKT17 bulk" ou "NKT2 bulk" [37]. Observe que, entre os três métodos DE, as saídas PseudotimeDE p-valores que melhor concordam com os genes DE específicos de linhagem de dados em massa e, portanto, mais distinguem as três linhagens. Por exemplo, para a linhagem NKT1, o pequeno PseudotimeDE p-valores são enriquecidos no conjunto de genes "NKT1 bulk" apenas, enquanto tradeSeq e Monocle3-DE têm pequenos p-valores enriquecidos em pelo menos dois conjuntos de genes DE específicos de linhagem

Para fins de validação, utilizamos os genes DE específicos de linhagem identificados a partir de dados de RNA-seq em massa no estudo original [37] para avaliar os rankings de genes DE estabelecidos por PseudotimeDE, tradeSeq e Monocle3-DE a partir de dados de scRNA-seq. Especificamente, realizamos o GSEA usando os conjuntos de genes DE em massa da mesma maneira que para o conjunto de dados de maturação de células beta pancreáticas. O GSEA mostra que PseudotimeDE's p-valores concordam melhor com os genes DE específicos de linhagem de dados em massa e, portanto, a maioria distingue as três linhagens. Por exemplo, para a linhagem NKT1, o pequeno PseudotimeDE p-valores são enriquecidos exclusivamente no conjunto de genes "NKT1 bulk", enquanto tradeSeq e Monocle3-DE têm pequenos p-valores enriquecidos em pelo menos dois conjuntos de genes DE específicos de linhagem (Fig. 7c). Este resultado confirma que, em comparação com os genes DE identificados pelos outros dois métodos DE, os principais genes DE identificados por PseudotimeDE são biologicamente mais significativos.

Exemplo de dados reais 5: fases do ciclo celular

No quinto aplicativo, comparamos PseudotimeDE com tradeSeq e Monocle3-DE em um conjunto de dados de células-tronco pluripotentes induzidas por humanos (iPSCs) medidas com fases do ciclo celular (rótulos FUCCI) [38].O estudo original relatou 101 genes cíclicos cujos níveis de expressão têm grandes proporções de variância explicada (PVE) pelos marcadores FUCCI das células [38], ou seja, os marcadores FUCCI das células são considerados preditores, os níveis de expressão de um gene nas mesmas células são considerada como a resposta, e um PVE é calculado a partir de um ajuste de suavização não paramétrico, portanto, quanto maior o PVE, melhor os níveis de expressão do gene podem ser previstos pelas fases do ciclo celular. O estudo original também desenvolveu um pacote R peco para inferir as fases do ciclo celular a partir de dados de scRNA-seq.

Em nosso estudo, primeiro construímos um conjunto de dados de referência tratando os 101 genes cíclicos como verdadeiros genes DE e usando os mesmos genes com níveis de expressão aleatoriamente embaralhados nas células como os verdadeiros genes não DE, portanto, nossos conjuntos positivos e negativos contêm 101 genes . Em seguida, aplicamos o pacote R peco a este conjunto de dados para inferir a fase do ciclo de cada célula, que é equivalente a pseudotempo, ou seja, usamos peco como o método de inferência de pseudotempo. Finalmente, aplicamos os três métodos DE.

Nossos resultados mostram que, para os verdadeiros genes não-DE, apenas PseudotimeDE gera p-valores que seguem aproximadamente a distribuição Uniforme [0,1] (Fig. 8a, & amp c). Para os verdadeiros genes DE, PseudotimeDE’s (- log10 transformado) p-valores, um por gene, têm a maior correlação com o PVE desses genes, indicando que PseudotimeDE identifica com sucesso os principais genes DE como aqueles com as tendências cíclicas mais fortes (Fig. 8b). PseudotimeDE também produz controle FDR bem-sucedido, o valor AUROC mais alto e a maior potência, entre os três métodos DE (Fig. 8d-f). Portanto, concluímos que PseudotimeDE supera tradeSeq e Monocle3-DE na identificação de genes relacionados ao ciclo celular deste conjunto de dados iPSC scRNA-seq.

Aplicação de PseudotimeDE, tradeSeq e Monocle3-DE ao conjunto de dados de fase do ciclo celular. uma Distribuições de genes não-DE ' p-valores por três métodos DE com pseudotempo inferido. Topo: gráficos de quantil-quantil que comparam os quantis empíricos de genes não-DE ' p-valores em relação aos quantis esperados da distribuição Uniforme [0,1]. Abaixo: histogramas de genes não-DE ' p-valores. o p-valores mostrados no topo dos histogramas são do teste de Kolmogorov – Smirnov sob a hipótese nula de que a distribuição é Uniforme [0,1]. Quanto maior o p-valor, mais uniforme é a distribuição. Entre os três métodos DE, PseudotimeDE's p-valores seguem mais de perto a distribuição Uniforme [0,1] esperada. b Distribuições de genes DE p-valores por três métodos DE com pseudotempo inferido. Acima: gráficos de dispersão dos genes DE ' p-valores contra as proporções de variância explicada (PVE), que medem a força das tendências cíclicas inferidas dos genes no estudo original [38]. PseudotimeDE’s p-valores (- log10 transformado) têm a correlação mais alta com o PVE, indicando que PseudotimeDE identifica os genes com as tendências cíclicas mais fortes como os principais genes DE. Abaixo: histogramas de todos os genes ' p-valores. As cores azul e vermelha representam o p-valores de genes DE e genes não-DE (os mesmos que em (a) abaixo), respectivamente. PseudotimeDE produz a melhor separação dos dois grupos de genes ' p-valores. c Gráficos de quantil-quantil do mesmo p-valores como em uma na escala log10 negativa. PseudotimeDE retorna o melhor calibrado p-valores. d FDPs dos três métodos DE com o FDR alvo 0,05 (BH ajustado- p≤0.05). e Curvas ROC e valores AUROC dos três métodos DE. PseudotimeDE atinge o AUROC mais alto. f Potência dos três métodos DE sob o FDP = 0,05 de corte. PseudotimeDE atinge o maior poder

PseudotimeDE permite que os usuários inspecionem a incerteza do pseudotime de célula inferida

Além da identificação de genes DE, PseudotimeDE oferece funcionalidade para inspecionar a incerteza da inferência de pseudotime por meio de sua etapa de subamostragem intermediária. Nas Figs. 2e, f e 6a, b, PseudotimeDE revela a incerteza das linhagens celulares inferidas. Os usuários geralmente desejam corrigir a topologia de linhagem, por exemplo, uma topologia de bifurcação, para análise a jusante, no entanto, a topologia pode variar entre as subamostras. Portanto, recomendamos que os usuários verifiquem se a topologia inferida dos dados originais também pode ser inferida de mais da metade das subamostras. Caso contrário, os usuários podem considerar o uso de outro método de inferência de pseudotempo com menos incerteza ou adicionar outras restrições à topologia inferida. Caso contrário, a grande incerteza da linhagem celular inferida prejudicaria a confiabilidade das análises posteriores.

Em seguida, condicionando em uma dada topologia de linhagem, PseudotimeDE permite aos usuários visualizar a incerteza de pseudotime dentro de uma linhagem (Fig. 2a-d), também orientando a escolha de métodos de inferência de pseudotime em termos de incerteza.

Tempo computacional

A única maneira viável de acomodar todos os métodos de inferência de pseudotime e levar em conta sua incerteza na identificação do gene DE é usar subamostragem e permutação, a abordagem adotada por PseudotimeDE. No entanto, uma preocupação comum dos métodos baseados em permutação é que eles são computacionalmente intensivos. Reconhecidamente, PseudotimeDE é mais lento do que os métodos não baseados em permutação existentes, mas seu tempo computacional é, no entanto, aceitável para usuários de servidor. Por exemplo, com 24 núcleos (CPU Intel “Cascade Lake”), 36 GB de RAM e 1000 subamostras, o PseudotimeDE leva de 3 a 8 horas para analisar cada um dos três primeiros conjuntos de dados scRNA-seq em nosso estudo. Especificamente, o conjunto de dados de células dendríticas LPS (4016 genes, 390 células) leva 3 h, o conjunto de dados de maturação de células beta pancreáticas (6121 genes, 497 células) leva 3,5 h, e o conjunto de dados de medula óssea (3004 genes, 2660 células, duas linhagens ) leva 8 horas. O tempo computacional é proporcional ao número de genes, ao número de linhagens e ao número de subamostras. Claro, é inversamente proporcional ao número de núcleos disponíveis.

Para reduzir o tempo computacional do PseudotimeDE, os usuários têm duas opções. Primeiro, os usuários podem reduzir o número de genes a serem testados. Por exemplo, genes modestamente expressos, como aqueles com mais de 90% de contagens zero, são recomendados para serem filtrados porque eles geralmente são de menos interesse para os biólogos. Em segundo lugar, os usuários podem reduzir o número de subamostras. Devido à sua estimativa paramétrica da distribuição nula da estatística de teste, PseudotimeDE não requer um grande número de subamostras. Descobrimos que PseudotimeDE com apenas 100 subamostras gera semelhantes p-valores para aqueles baseados em 1000 subamostras (arquivo adicional 1: Fig. S20). Se estiver usando 100 submaples, o tempo computacional está dentro de 0,5 h para cada um dos três primeiros conjuntos de dados.

Em um cenário indesejável em que os recursos computacionais são muito limitados, os usuários devem abandonar a consideração da incerteza de pseudotempo e tratar o pseudotempo inferido como fixo. Então eles não precisam do procedimento de subamostragem, e PseudotimeDE irá calcular p-valores da distribuição nula assintótica da estatística de teste [39], com curto tempo computacional semelhante aos métodos não baseados em permutação '.


  • Disponível em níveis padrão (SL) e superiores (HL)
  • O número mínimo de horas prescrito é 150 para SL e 240 para HL
  • Os alunos são avaliados externamente e internamente
  • Os alunos de biologia do SL e HL realizam um currículo comum e um esquema de avaliação interna comum (IA).
  • Embora existam habilidades e atividades básicas comuns aos alunos do SL e do HL, os alunos da HL devem estudar as opções e alguns tópicos com mais profundidade, bem como alguns tópicos adicionais. A distinção entre SL e HL é de amplitude e profundidade.
  • Uma abordagem prática para a entrega do curso é enfatizada por meio do projeto do grupo 4 interdisciplinar e uma mistura de experimentos e investigações de curto e longo prazo.
  • A avaliação interna representa 20% da avaliação final e é avaliada por meio de uma única investigação individual. Esta investigação pode envolver uma abordagem prática, uso de bancos de dados, modelagem, simulação ou um híbrido. O trabalho dos alunos é avaliado internamente pelo professor e moderado externamente pelo IB.

A avaliação externa de biologia consiste em três artigos escritos. No artigo 1, há 30 (no SL) ou 40 (no HL) questões de múltipla escolha. O Documento 2 contém perguntas de resposta curta e resposta estendida sobre o material básico (e de nível superior adicional (AHL) em HL). Artigo 3 tem duas seções A seção A contém uma pergunta baseada em dados e várias perguntas de resposta curta sobre o trabalho experimental no núcleo (e material AHL em HL). A seção B contém perguntas de resposta curta e resposta estendida de cada uma das quatro opções.

Muitas dessas informações são obtidas diretamente do guia de disciplinas de biologia, disponível para todos os professores do IB no centro de recursos do programa.


Biologia molecular da célula

Química orgânica

Química Física para as Ciências da Vida

Guia de estudo para Biologia Campbell

Química

Bioquímica

Teste de ideias de negócios

O Manual de Inovação de Serviço

Projeto de proposição de valor

Livro para colorir de Harry Potter

Química orgânica

Procedimentos de Pfenninger e Fowler & # 039s para cuidados primários

DeVita, Hellman, and Rosenberg & # 039s Cancer: Principles & amp Practice of Oncology

Química Orgânica como Segunda Língua

Introdução à Geologia Ambiental

Biologia

Biologia

Química

Anatomia Humana e Fisiologia

Praticando Biologia


O Conceito de Personagem na Biologia Evolutiva



Este site usa cookies e Google Analytics (consulte nossos termos e condições para obter detalhes sobre as implicações de privacidade).

O uso deste site está sujeito aos termos e condições.
Todos os direitos reservados pela The PhilPapers Foundation

Página gerada Quarta, 30 de junho 11:30:15 de 2021 em philpapers-web-b76fb567b-jxzfk Informações de depuração

estatísticas de cache: hit = 1286, miss = 1375, save =
manipulador automático: 318 ms
componente chamado: 303 ms
entrada: 303 ms
entry_basics: 91 ms
cabeçalho de entrada: 73 ms
menu: 69 ms
similar_entries: 64 ms
citações-citações: 49 ms
capítulos_de_entrada: 27 ms
entry_stats: 27 ms
get_entry: 12 ms
prepCit: 9 ms
links de entrada: 7 ms
entrada-gatos: 7 ms
lado da entrada: 6 ms
amazon: 4 ms
writeLog: 3 ms
citações-referências: 3 ms
search_quotes: 2 ms
entry_stats_query: 2 ms
recuperar objeto de cache: 0 ms
renderizador init: 0 ms
salvar objeto de cache: 0 ms
configuração: 0 ms
auth: 0 ms
stat_db: 0 ms
botões de entrada: 0 ms


Assista o vídeo: Síntesis Conceptual 12 Señalización (Janeiro 2022).