Em formação

Como você obtém níveis específicos de transcrição de mRNA para comparação de um conjunto de dados Hi-Seq?


Tenho dados HiSeq de ratos expostos a duas condições. Eu gostaria de responder à seguinte pergunta: "Existe uma diferença significativa nos níveis de transcrição do mRNA ao comparar a condição A com a condição B?"

Para responder a esta pergunta, eu tenho que mapear minhas leituras HiSeq para o genoma de referência para determinar os valores de expressão ou é aceitável usar um pequeno conjunto de sequências de referência de interesse (aproximadamente 50)? Essas sequências particulares não são anotadas no genoma de referência. Quais são as desvantagens de não mapear para o genoma?


Vai ser difícil para você gerar um valor RPKM ou RPM sem% de alinhamento com o genoma, ou transcriptoma. Suas contagens de leitura não terão contexto.


Mapeamento e quantificação de transcriptomas de mamíferos por RNA-Seq

Mapeamos e quantificamos os transcriptomas de camundongos sequenciando-os profundamente e registrando a frequência com que cada gene é representado na amostra de sequência (RNA-Seq). Isso fornece uma medida digital da presença e prevalência de transcrições de genes conhecidos e anteriormente desconhecidos. Relatamos medições de referência compostas por 41-52 milhões de leituras mapeadas de 25 pares de bases para RNA selecionado de poli (A) do cérebro de camundongo adulto, fígado e tecidos musculares esqueléticos. Usamos padrões de RNA para quantificar a prevalência de transcritos e testar a faixa linear de detecção de transcritos, que abrangeu cinco ordens de magnitude. Embora & gt90% das leituras mapeadas exclusivamente caiam dentro de exons conhecidos, os dados restantes sugerem modelos de genes novos e revisados, incluindo promotores alterados ou adicionais, exons e regiões 3 'não transcritas, bem como novos candidatos a precursores de microRNA. Os eventos de splice de RNA, que não são facilmente medidos por microarray de expressão de gene padrão ou análise em série de métodos de expressão de genes, foram detectados diretamente pelo mapeamento de leituras de sequência de cruzamento de splice. Observamos 1,45 × 10 5 emendas distintas, e emendas alternativas eram proeminentes, com 3.500 genes diferentes expressando uma ou mais emendas internas alternativas.


Fundo

Ao fornecer uma visão ampla do genoma da expressão gênica, os microarrays se tornaram uma ferramenta exploratória comum em muitas áreas de estudos biológicos e clínicos [1-3]. Embora existam várias plataformas de microarray diferentes, as matrizes de oligonucleotídeos sintetizados fotolitograficamente da Affymetrix se tornaram uma das principais tecnologias. Essas matrizes apresentam várias sondas de 25-mer (um "conjunto de sondas") para cada gene, com suas medições resumidas em um único número para o nível de expressão estimado desse gene. Devido ao importante papel desempenhado por esta tecnologia, muitos estudos metodológicos têm se concentrado em melhorar a extração de informações dessas matrizes, desde a análise de imagens e o papel adequado de sondas perfeitas e incompatíveis até as propriedades de distribuição das medições e testes estatísticos ideais para expressão diferencial [4,5].

Os dados de expressão gênica em grande escala geralmente contêm uma grande quantidade de ruído de vários fatores experimentais. Felizmente, na maioria dos casos, a variabilidade técnica é relativamente pequena em comparação com a biológica e seu efeito pode ser minimizado usando um número suficiente de repetições [6-8]. No entanto, o alto custo dos experimentos de microarray muitas vezes impede a coleta de amostras suficientes para uma análise confiável em um único laboratório. Nesses casos, o emprego de conjuntos de dados de microarray existentes de outros estudos pode ser uma maneira eficiente de melhorar a confiabilidade de um estudo. Além disso, como o número de conjuntos de dados disponíveis publicamente cresce rapidamente em depósitos de dados públicos (por exemplo, Gene Expression Omnibus [9] Stanford Microarray Database [10] ArrayExpress at EBI [11]), é claro que esses conjuntos de dados devem ser combinados para gerar um compreensão mais abrangente da biologia subjacente.

Vários problemas dificultaram esse processo até agora. Em primeiro lugar, diferentes conjuntos de dados foram processados ​​usando procedimentos diferentes devido à falta de padrões uniformes, por exemplo, para correção de fundo, normalização e cálculo de valores de expressão. Isso torna difícil compará-los diretamente. Os arquivos de dados brutos geralmente não estão disponíveis e, mesmo que estejam, seu reprocessamento requer um esforço considerável. Em segundo lugar, não temos conjuntos de dados com controles e réplicas suficientes, realizados sob um projeto experimental adequado e com anotações adequadas, a fim de fazer comparações adequadas. Terceiro, possivelmente o mais problemático, os experimentos foram realizados em muitas plataformas diferentes, com diferenças significativas entre elas. Mesmo dentro de uma única plataforma, os avanços tecnológicos e algorítmicos, bem como as anotações em evolução dos genomas, resultaram em gerações sucessivas de matrizes com modificações substanciais de uma geração para a outra. Até agora, vários estudos encontraram vários graus de discordância entre as plataformas, às vezes com grandes discrepâncias que colocam em questão a confiabilidade de certas conclusões alcançadas em estudos de microarray [12-19]. Uma comparação de duas matrizes Affymetrix, HuGeneFL e HG-U95A, foi feita anteriormente, mas apenas com a conclusão de que a reprodutibilidade é alta quando os dois conjuntos de sondas compartilham muitas sondas exatas e é baixa quando não o fazem [20].

Neste trabalho, realizamos um exame completo da comparabilidade entre as duas gerações de matrizes de GeneChip humano da Affymetrix, HG-U95Av2 e HG-U133A, ambos os quais foram usados ​​extensivamente para estudar padrões de expressão de genes humanos. Em seguida, propomos um método para melhorar sua comparabilidade. A análise que realizamos é possível graças a um conjunto de dados que consiste nas mesmas amostras de tecido hibridizadas em ambas as plataformas. O procedimento é ilustrado na Figura & # x200B Figura1. 1 Usando nosso conjunto de dados replicado, primeiro examinamos a eficácia de três esquemas para combinar os conjuntos de sondas em diferentes matrizes. Em seguida, quantificamos a quantidade surpreendente de diferença nos resultados da análise entre as plataformas, conforme revelado na análise de correlação, agrupamento hierárquico e seleção de genes expressos diferencialmente. Descobrimos que a comparabilidade pode ser melhorada redimensionando valores de expressão ou filtragem de dados, mas que essas técnicas são limitadas a poucas análises específicas. Como um método genérico para análise comparativa, propomos selecionar um subconjunto de sondas que têm sobreposições de sequência com as sondas na outra matriz e recalcular os níveis de expressão com base apenas neste subconjunto. Demonstramos que esta filtragem de sonda melhora significativamente a reprodutibilidade, sem eliminar um número significativo de genes da análise.

Uma visão esquemática do procedimento. O mesmo RNA foi hibridizado em ambas as matrizes HG-U95Av2 e HG-U133A, para 14 amostras. Três métodos para combinar as sondas foram considerados, mas os dois conjuntos de dados deram resultados altamente inconsistentes na análise de agrupamento e identificação de genes expressos diferencialmente. Para melhorar a comparabilidade em geral, as informações de sequência de nível de sonda foram exploradas. Todas as sondas 25-mer foram alinhadas às sequências do genoma humano por BLAT e, em seguida, filtradas com base no comprimento de sua sobreposição com as sondas na outra matriz. Novos índices de expressão foram calculados usando apenas as sondas selecionadas, o que resulta em maior reprodutibilidade.


Identificação de genes expressos diferencialmente a partir de dados de RNA-Seq

Este exemplo mostra como testar dados de RNA-Seq para genes expressos diferencialmente usando um modelo binomial negativo.

Introdução

Uma análise de expressão diferencial típica de dados de RNA-Seq consiste em normalizar as contagens brutas e realizar testes estatísticos para rejeitar ou aceitar a hipótese nula de que dois grupos de amostras não apresentam diferença significativa na expressão gênica. Este exemplo mostra como inspecionar as estatísticas básicas de dados de contagem brutos, como determinar fatores de tamanho para normalização de contagem e como inferir os genes expressos de forma mais diferencial usando um modelo binomial negativo.

O conjunto de dados para este exemplo compreende dados de RNA-Seq obtidos no experimento descrito por Brooks et al. [1]. Os autores investigaram o efeito do silenciamento de siRNA de pasilla, um gene conhecido por desempenhar um papel importante na regulação do splicing em Drosophila melanogaster . O conjunto de dados consiste em 2 réplicas biológicas das amostras de controle (não tratadas) e 2 réplicas biológicas das amostras knock-down (tratadas).

Inspecionando tabelas de contagem de leitura para características genômicas

O ponto de partida para esta análise de dados de RNA-Seq é uma matriz de contagem, onde as linhas correspondem às características genômicas de interesse, as colunas correspondem às amostras fornecidas e os valores representam o número de leituras mapeadas para cada característica em uma determinada amostra.

O arquivo incluído pasilla_count_noMM.mat contém duas tabelas com as matrizes de contagem no nível do gene e no nível do exon para cada uma das amostras consideradas. Você pode obter matrizes semelhantes usando a função featurecount.

Observe que, quando a contagem é realizada sem sumarização, as características individuais (exons neste caso) são relatadas com sua atribuição de metafeaturas (genes, neste caso) seguida pelas posições de início e parada.

Você pode anotar e agrupar as amostras criando um vetor lógico da seguinte maneira:

Traçando as atribuições de recursos

O arquivo incluído também contém uma tabela geneSummaryTable com o resumo das entradas SAM atribuídas e não atribuídas. Você pode representar graficamente a distribuição básica dos resultados da contagem, considerando o número de leituras que são atribuídas às características genômicas fornecidas (exons ou genes para este exemplo), bem como o número de leituras que não estão atribuídas (ou seja, sem sobreposição de nenhuma característica) ou ambíguo (ou seja, sobreposição de vários recursos).

Observe que uma pequena fração dos registros de alinhamento nos arquivos SAM não é relatada na tabela de resumo. Você pode notar isso na diferença entre o número total de registros em um arquivo SAM e o número total de registros processados ​​durante o procedimento de contagem para esse mesmo arquivo SAM. Esses registros não relatados correspondem aos registros mapeados para sequências de referência que não são anotadas no arquivo GTF e, portanto, não são processados ​​no procedimento de contagem. Se os modelos de genes são responsáveis ​​por todas as sequências de referência usadas durante a etapa de mapeamento de leitura, todos os registros são relatados em uma das categorias da tabela de resumo.

Traçando a cobertura de leitura em um determinado cromossomo

Quando a contagem de leitura é realizada sem sumarização usando a função featurecount, os IDs padrão são compostos pelo atributo ou metafeature (por padrão, gene_id) seguido pelas posições de início e parada do recurso (por padrão, exon). Você pode usar as posições iniciais do exon para plotar a cobertura de leitura em qualquer cromossomo em consideração, por exemplo, braço do cromossomo 2L.

Como alternativa, você pode representar graficamente a cobertura de leitura considerando a posição inicial de cada gene em um determinado cromossomo. O arquivo pasilla_geneLength.mat contém uma tabela com a posição inicial e final de cada gene no arquivo de anotação de gene correspondente.

Normalizando contagens de leitura

A contagem de leitura em dados de RNA-Seq foi encontrada para ser linearmente relacionada à abundância de transcritos [2]. No entanto, a contagem de leituras para um determinado gene depende não apenas do nível de expressão do gene, mas também do número total de leituras sequenciadas e do comprimento da transcrição do gene. Portanto, para inferir o nível de expressão de um gene a partir da contagem de leituras, precisamos levar em consideração a profundidade do sequenciamento e o comprimento do transcrito do gene. Uma técnica comum para normalizar a contagem de leituras é usar os valores RPKM (Read Per Kilobase Mapped), onde a contagem de leituras é normalizada pelo número total de leituras produzidas (em milhões) e o comprimento de cada transcrição (em quilobases). Esta técnica de normalização, no entanto, nem sempre é eficaz, uma vez que poucos genes altamente expressos podem dominar a contagem total de pistas e distorcer a análise de expressão.

Uma técnica de normalização melhor consiste em calcular o tamanho efetivo da biblioteca considerando um fator de tamanho para cada amostra. Ao dividir as contagens de cada amostra pelos fatores de tamanho correspondentes, trazemos todos os valores de contagem para uma escala comum, tornando-os comparáveis. Intuitivamente, se a amostra A for sequenciada N vezes mais profunda do que a amostra B, espera-se que as contagens de leitura de genes expressos de forma não diferencial sejam em média N vezes maiores na amostra A do que na amostra B, mesmo se não houver diferença na expressão.

Para estimar os fatores de tamanho, tome a mediana das razões de contagens observadas para aquelas de uma amostra de pseudo-referência, cujas contagens podem ser obtidas considerando a média geométrica de cada gene em todas as amostras [3]. Então, para transformar as contagens observadas em uma escala comum, divida as contagens observadas em cada amostra pelo fator de tamanho correspondente.

Você pode apreciar o efeito dessa normalização usando o boxplot de funções para representar medidas estatísticas como mediana, quartis, mínimo e máximo.

Calculando Média, Dispersão e Alteração de Dobra

Para melhor caracterizar os dados, consideramos a média e a dispersão das contagens normalizadas. A variância das contagens de leitura é dada pela soma de dois termos: a variação entre as amostras (variância bruta) e a incerteza de medir a expressão por contagem de leituras (ruído de disparo ou Poisson). O termo variância bruto domina para genes altamente expressos, enquanto o ruído de disparo domina para genes expressos de forma humilde. Você pode representar graficamente os valores de dispersão empírica em relação à média das contagens normalizadas em uma escala logarítmica, conforme mostrado abaixo.

Dado o pequeno número de repetições, não é surpreendente esperar que os valores de dispersão se espalhem com alguma variação em torno do valor verdadeiro. Algumas dessas variações refletem a variação da amostragem e outras refletem a verdadeira variabilidade entre as expressões gênicas das amostras.


Como você obtém níveis específicos de transcrição de mRNA para comparação de um conjunto de dados Hi-Seq? - Biologia

O NIH Stroke Scale (NIHSS) International é uma iniciativa de entidades governamentais nacionais e internacionais, bem como de organizações privadas e escolares. Esses órgãos são dedicados a promover o bem-estar e um melhor atendimento ao paciente na área de AVC.
É nossa visão fornecer a todos os pacientes a melhor oportunidade de sobrevivência. Acreditamos que o programa “Conheça o AVC” oferece aos profissionais de saúde as ferramentas necessárias para atingir esse objetivo.

Missão

Modernizar o sistema global de saúde e pesquisa clínica usando padrões globais de atendimento para que nenhum paciente seja deixado para trás, não importa sua raça, religião, status socioeconômico, afiliação política ou localização geográfica.

Regulamentos e privacidade

Agências regulatórias, Comitês de Revisão Ética e organizações de acreditação de saúde agora exigem que qualquer profissional de saúde, usando o NIHSS como uma ferramenta de diagnóstico de paciente, demonstre competências contínuas no uso da ferramenta, a fim de maximizar a confiabilidade entre avaliadores entre diagnosticadores e melhorar os humanos proteção do sujeito e segurança do paciente.

Abordagem para proteção do sujeito humano e segurança do paciente

"O National Institutes of Health Stroke Scale (NIHSS) é uma ferramenta de avaliação sistemática que fornece uma medida quantitativa do déficit neurológico relacionado ao AVC. O NIHSS foi originalmente projetado como uma ferramenta de pesquisa para medir dados de linha de base em pacientes em ensaios clínicos de AVC agudo. Agora , a escala também é amplamente usada como uma ferramenta de avaliação clínica para avaliar a acuidade de pacientes com AVC, determinar o tratamento apropriado e prever o resultado do paciente. O NIHSS pode ser usado como uma ferramenta de avaliação clínica de AVC para avaliar e documentar o estado neurológico em pacientes com AVC agudo. A escala de AVC é válida para prever o tamanho da lesão e pode servir como uma medida da gravidade do AVC. O NIHSS demonstrou ser um preditor de resultados de curto e longo prazo de pacientes com AVC. Além disso, a escala de AVC serve como uma ferramenta de coleta de dados para o planejamento do atendimento ao paciente e fornece uma linguagem comum para a troca de informações entre os profissionais de saúde. A escala foi projetada para ser simples e válida e uma ferramenta confiável que pode ser administrada à beira do leito de forma consistente por médicos, enfermeiras ou terapeutas. "
"O NIHSS é uma escala de exame neurológico de 15 itens usada para avaliar o efeito do infarto cerebral agudo nos níveis de consciência, linguagem, negligência, perda de campo visual, movimento extraocular, força motora, ataxia, disartria e perda sensorial. Um observador treinado avalia a capacidade do paciente de responder a perguntas e realizar atividades. As classificações de cada item são pontuadas de 3 a 5 notas com 0 como normal, e há uma permissão para itens não testáveis. A avaliação de um único paciente requer menos de 10 minutos para ser concluída . A avaliação da gravidade do AVC depende da capacidade do observador de avaliar o paciente de forma precisa e consistente. "


Como você obtém níveis específicos de transcrição de mRNA para comparação de um conjunto de dados Hi-Seq? - Biologia

Diferentes tipos de experimentos de RNA-Seq requerem diferentes comprimentos e profundidades de leitura de sequenciamento (número de leituras por amostra). Este boletim analisa as considerações de sequenciamento de RNA e oferece recursos para o planejamento de experimentos de RNA-Seq.

Quais recursos devo consultar primeiro?

Para sequenciamento de RNA, a profundidade de leitura é normalmente usada em vez de cobertura. A detecção de genes de baixa expressão pode exigir um aumento na profundidade de leitura. O projeto ENCODE (atualizado aqui) possui padrões de dados para sequenciamento de RNA-Seq e Small RNA que são um excelente recurso para muitos projetos.

A Illumina recomenda consultar a literatura primária de seu campo e organismo para obter as orientações mais atualizadas sobre o planejamento de experimentos.

Quantas leituras devo atingir por amostra?

A profundidade de leitura varia de acordo com os objetivos do estudo RNA-Seq. A maioria dos experimentos requer 5–200 milhões de leituras por amostra, dependendo da complexidade e do tamanho do organismo, juntamente com os objetivos do projeto.

  • Os experimentos de perfil de expressão gênica que procuram um instantâneo rápido de genes altamente expressos podem precisar apenas de 5 a 25 milhões de leituras por amostra. Nestes casos, os pesquisadores podem agrupar várias amostras de RNA-Seq em uma linha de uma execução de sequenciamento, o que permite a alta multiplexação das amostras.
  • Os experimentos que buscam uma visão mais global da expressão gênica e algumas informações sobre o splicing alternativo geralmente requerem de 30 a 60 milhões de leituras por amostra. Esta faixa abrange a maioria dos experimentos de RNA-Seq publicados para sequenciamento de mRNA / transcriptoma completo.
  • Os experimentos que buscam obter uma visão detalhada do transcriptoma ou montar novas transcrições podem exigir 100–200 milhões de leituras. Nesses casos, os pesquisadores podem precisar sequenciar várias amostras em várias vias de sequenciamento de alto rendimento.
  • A expressão de RNA direcionada requer menos leituras. Por exemplo, a Illumina recomenda 3 milhões de leituras por amostra para TruSight RNA Pan Cancer e TruSight RNA Fusion Panel, que são compatíveis com pooling de alta plexidade de amostras.
  • miRNA-Seq ou pequenos experimentos de análise de RNA podem exigir ainda menos leituras do que o sequenciamento do transcriptoma inteiro. Este requisito varia significativamente dependendo do tipo de tecido que está sendo sequenciado. A Illumina recomenda enfaticamente o uso da literatura primária para determinar quantas leituras são necessárias, com a maioria dos aplicativos variando de 1 a 5 milhões de leituras por amostra.

Para determinar quantas amostras podem ser executadas de uma vez, divida o número de leituras produzidas pela célula de fluxo pelo número de leituras necessárias por amostra:

A Calculadora de cobertura também pode ser usada para calcular quantas amostras devem ser agrupadas para uma determinada execução, dependendo do instrumento e do tipo de kit de sequenciamento que está sendo usado.

Qual deve ser a duração das minhas leituras?

O comprimento da leitura depende do aplicativo e do tamanho final da biblioteca. O Seletor do Kit de Preparação para Biblioteca fornece orientação de comprimento de leitura para cada tipo de biblioteca RNA-Seq. As leituras de sequenciamento que são mais longas do que o comprimento da inserção não fornecem dados úteis adicionais.

  • Expressão gênica / Perfil de RNA - A quantificação do transcriptoma codificante normalmente requer uma única leitura curta (geralmente 50-75 bp) para minimizar a leitura nas junções de emenda enquanto conta todos os RNAs no pool.
  • Análise do transcriptoma - Novos projetos de montagem e anotação do transcriptoma tendem a se beneficiar de leituras mais longas e emparelhadas (como 2 x 75 bp ou 2 x 100 bp) para permitir uma cobertura mais completa das transcrições e identificação de novas variantes ou locais de emenda. Leituras de extremidades emparelhadas são necessárias para obter informações de ambas as extremidades 5 'e 3' das espécies de RNA com kits de preparação de biblioteca de RNA-Seq de fita.
  • Análise de RNA pequeno - devido ao comprimento curto do RNA pequeno, uma única leitura (geralmente uma leitura de 50 bp) cobre normalmente toda a sequência. Um comprimento de leitura de 50 bp sequencia a maioria dos pequenos RNAs, mais o suficiente do adaptador para ser identificado com precisão e aparado durante a análise de dados.

Para obter mais informações sobre outras considerações no planejamento de seus experimentos de RNA-Seq e opções de kit de RNA-Seq, acesse o site de treinamento e veja os webinars gravados. Em "Filtros", selecione Tipo de treinamento & gt Treinamento e vídeos & gt Treinamento on-line:


Como você obtém níveis específicos de transcrição de mRNA para comparação de um conjunto de dados Hi-Seq? - Biologia

Investigando a heterogeneidade intra-tumoral em neuroblastoma

Analise a heterogeneidade do tumor em neuroblastoma usando a plataforma de análise de dados R2

Os botões cinza neste curso o levarão para a plataforma R2, geralmente com configurações predefinidas para que você possa pegar uma análise facilmente. Os botões verdes neste documento abrirão um formulário do Google, um por seção, com o qual você pode enviar suas respostas.

O câncer é uma doença muito complexa. Muito mais complicado do que o inicialmente previsto quando as primeiras mutações foram consideradas causais para cânceres específicos. Por exemplo, no câncer colorretal, um caminho bem definido de mutações subsequentemente obtidas leva a tipos de células tumorigênicas mais agressivas (o modelo de Vogelstein).

Embora tenha havido extensa pesquisa sobre mecanismos de mutação semelhantes no neuroblastoma (também no grupo AMC Oncogenomics), tal mecanismo não foi encontrado para esse tumor infantil, muitas vezes mortal. Nesta sessão de trabalho prático, vamos integrar dados de expressão de RNA com dados de sequência, especificamente dados de seq ChIP, para desvendar dados de neuroblastoma.

Como você já deve ter aprendido com suas palestras, este tumor consiste em diferentes tipos de células cancerígenas. Há razões para acreditar que essa heterogeneidade causa o alto percentual de recidivas no subtipo agressivo de neuroblastoma. As crianças que desenvolvem uma recaída quase sempre morrem. Felizmente, novas tecnologias tornaram-se disponíveis para a biologia molecular. Isso nos permite estudar não apenas mutações e expressão de genes de RNA, mas também estudar as modificações epigenéticas das histonas associadas ao DNA. Além disso, os genes agora podem ser manipulados em linhas celulares e em tecidos vivos. Usando análises avançadas de dados, estatísticas e métodos de agrupamento, o campo da bioinformática tenta derivar novos insights desses dados experimentais e ajudar os biólogos moleculares a gerar hipóteses que podem ser testadas experimentalmente. Hoje você usará a plataforma de visualização e análise genômica baseada na web R2. R2 fornece um conjunto de ferramentas de bioinformática para investigar pacientes recentes e dados experimentais de tumores de neuroblastoma e linhas celulares.

O neuroblastoma é um tumor pediátrico da linhagem adrenérgica periférica, derivado da crista neural. Durante a embriogênese, as células se desprendem da crista neural, migram ventralmente e se diferenciam em células produtoras de adrenalina ou noradrenalina. Neuroblastomas tipicamente expressam enzimas para a rota de síntese de adrenalina. Os neuroblastomas em estágio alto geralmente entram em remissão completa com a terapia, mas freqüentemente apresentam recidiva como doença resistente à terapia.

Usando técnicas recentes de coleta de dados de biologia molecular e algoritmos de análise de dados bioinformáticos avançados, começamos a investigar essa característica agressiva de tumores de neuroblastoma. Obtivemos biópsias de tumor de quatro pacientes que foram colhidos em cultura. Cada biópsia deu origem a duas linhas celulares fenotipicamente divergentes. Neste curso, você mesmo conduzirá a pesquisa, seguindo as linhas de raciocínio e os mesmos dados utilizados em um artigo do grupo AMC Oncogenomics publicado na Nature Genetics em 2017.

Tumores e origens: uma primeira impressão de seus dados

Para começar, vamos investigar as linhas de células tumorais da infância estabelecidas, incluindo neuroblastoma. Linhas celulares estabelecidas podem ser cultivadas e passadas em cultura indefinidamente. Um exemplo típico é a linha de células HeLa clássica, retirada de um adenocarcinoma cervical de Henrieta Lacks em 1951, que está em cultivo desde então. Como os perfis das linhas celulares de neuroblastoma se relacionam com as linhas celulares de outros tumores? Dados adicionais sobre linhas celulares clássicas de outros tumores infantis estão disponíveis nos recursos da comunidade científica. Para cada publicação, os cientistas são obrigados a disponibilizar seus dados em repositórios públicos. Podemos usá-los em um conjunto de dados público maior de 86 outras linhagens celulares derivadas de 6 tumores infantis diferentes e ver como eles se relacionam.

  • 86 linhas celulares derivadas de 6 tumores infantis diferentes (Cellline Childhood cancer - ITCC - 86 - MAS5.0 - u133p2)

Abra o formulário da seção 1.2

Você está agora na página principal do R2. Esta plataforma de análise de dados de biologia molecular baseada na web contém uma grande variedade de dados e métodos para analisar os conjuntos de dados. Passo a passo, os pesquisadores são guiados por uma teia de opções para análise de dados. A página principal de R2 mostra este princípio: passe por cada uma das caixas numeradas para desenvolver sua análise de escolha.
Neste caso, primeiro veremos se e como a expressão de mRNA de vários genes muda por meio de um único conjunto de dados. O conjunto de dados adequado descrito acima já foi selecionado. Neste conjunto de dados, 86 linhas celulares derivadas de 6 tipos diferentes de tumor infantil podem ser encontradas (sarcoma de Ewing, meduloblastoma, neuroblastoma, osteossarcoma, leucemia linfocítica aguda e rabdomiossarcoma).

A partir de conhecimentos adquiridos em palestras anteriores, ou apenas por meio de uma rápida busca no Google na web. Você consegue pensar em um gene que pode apresentar uma expressão diferente entre alguns desses 6 modelos de tumor?

  • No campo 4 digite o nome do gene e clique Próximo
  • Deixe todas as configurações padrão e clique em Próximo

Um gráfico mostra a expressão do mRNA desse gene em todo o conjunto de linhagens de células tumorais infantis. As amostras estão ao longo do eixo x, os valores de expressão de mRNA do gene em uma amostra estão no eixo y. Abaixo do gráfico está a anotação disponível para as amostras mostradas em faixas coloridas. Em R2, as amostras podem ser anotadas com, por exemplo, dados clínicos ou informações biológicas. Cada grupo de dados anotados é chamado de “Rastreio” em R2. Essas trilhas podem ser usadas para filtrar, colorir ou dividir dados em todos os tipos de análises de R2.
Às vezes, você pode ver as faixas categóricas exibidas abaixo de um gráfico. Porém, muitas vezes, mais anotações estão disponíveis para as amostras. Você pode passar o mouse sobre os pontos em um gráfico ou sobre as trilhas abaixo do gráfico para obter mais informações por amostra.

No final da página, você encontrará uma tabela com configurações ajustáveis. Muitas configurações do gráfico podem ser adaptadas.

Experimente uma visualização diferente dos mesmos dados com as seguintes alterações nas configurações:
Os valores da expressão no eixo y são logarítmicos por padrão, no menu de configurações, defina o Transformar opção para Nenhum em vez de. Divida os dados em grupos com a configuração usar faixa em Separações de grupos: escolha o itcc_model faixa que contém as informações de qual amostra pertence a qual tipo de tumor. Também classifique as amostras novamente na expressão com Opção de gráfico extra definido como Classificação de rastreamento e gene. Por fim, clique Ajustar configurações para obter o gráfico com essas adaptações.

Agora tente o gene MYCN (Tipo MYCN no Change Gene no canto superior direito para manter todas as suas configurações, mas para alterar seu gene).

Passe o mouse sobre a trilha abaixo do gráfico ou sobre os pontos de dados para descobrir qual itcc_model pertence a qual grupo de amostras.

O que você pode dizer sobre a expressão desse gene nos diferentes modelos de tumor?

O que o nível de expressão desse gene no neuroblastoma pode significar sobre a função do gene nesse câncer?

Clustering com mapas tSNE

Vimos que a expressão dos genes difere entre as amostras e alguns tipos de tumores parecem expressar especificamente certos genes. Para explorar ainda mais o tipo de dados com os quais estamos lidando, um tipo imparcial não supervisionado de análise de agrupamento é uma boa ideia. Um algoritmo desenvolvido recentemente é o mapa tSNE. Células semelhantes se agruparão no mapa.

Abaixo do gráfico, um menu permite ao usuário adaptar as configurações. As cores dos pontos do gráfico não são definidas por padrão. Para colorir o gráfico com uma anotação biologicamente significativa, encontre o Modo de cor lista suspensa e selecione Cor por faixa. Agora defina o Trilha para cor lista suspensa para usar o itcc_model rastrear e clicar Próximo para mostrar as mudanças.

O algoritmo t-SNE tem um parâmetro chamado perplexidade, que determina quantos pontos de atração em um mapa têm um em relação ao outro. Defina o valor de perplexidade para 5 e clique próximo novamente.

O que você nota sobre o agrupamento das amostras de neuroblastoma?

Com quais outros modelos de tumor as linhas de células de neuroblastoma se agrupam?

Com base no acima exposto, o que você faria para investigar melhor suas observações

Urgência da pesquisa: material do paciente

Na primeira etapa, deduzimos que as linhas de células de neuroblastoma parecem se agrupar com linhas de células de diferentes linhagens de desenvolvimento. Recentemente, estabelecemos novos pares de linhas celulares de pacientes com neuroblastoma. Em alguns casos, várias linhas celulares foram obtidas na mesma biópsia. Essas linhagens celulares compartilham defeitos genéticos e são, portanto, chamadas isogênico pares de linha celular. Uma imagem microscópica de cada par é fornecida abaixo.

Abra o formulário da seção 1.3

O que você nota sobre a morfologia das linhas celulares?

Fizemos o perfil da expressão de mRNA de genes usando chips de mRNA da Affymetrix em três desses pares e de uma linha celular de neuroblastoma previamente estabelecida que, após a cultura, deu origem a dois fenótipos muito divergentes. Os padrões de expressão gênica resultantes podem ser usados ​​para realizar um agrupamento hierárquico. Um exemplo desse agrupamento resultando em um mapa de calor ordenado é fornecido abaixo

  • Linhas celulares derivadas recentemente de três pacientes diferentes. Duas células de aparência morfologicamente diferentes foram coletadas por paciente. Este conjunto de dados é combinado com duas linhas de células clássicas de Neuroblastoma que se agruparam de forma diferente no tSNE: SHEP e SY5Y (Neuroblastoma Misto (MES-ADRN) - Versteeg - 8 - MAS5.0 - u133p2)
  • Toplister: seleção de genes não supervisionados
  • Clustering hierárquico não supervisionado
  • Visualização de mapa de calor

Para esta análise, iremos diretamente para uma das ferramentas de análise de R2: Toplister. O Toplister pode avaliar quais genes se comportam de maneira diferente em um conjunto de dados. Ele faz isso selecionando os genes cujos valores de expressão têm o maior desvio padrão em um determinado conjunto de amostras. Isso dá uma visão imparcial das diferenças na expressão do gene.

  • Vá para R2 clicando no botão abaixo. R2 will find the 100 genes that have the largest variation in gene expression among these 8 cell lines, three pairs from three tumors of a patient and two classical neuroblastoma cell lines.

Do you recognize any genes that explain the difference in phenotype?

  • Use the mousewheel to scroll to the bottom of the page (or click on the shoe-print at the top of the page).

Here you can choose to perform an additional analysis. The heatmap vizualization produces a hierarchically clustered view of the expression values for the top 100 genes.

What number of groups do you expect?

The cell line pairs from the patient were also investigated for the tumor stem cell marker gene CD133 and for their migration capability. See the results in the figure below:

Given these observations, what origin can you assign to each group?

Which genes make a difference? Creating signatures

We have identified two different types of cells that occur within the same patient. Neuroblastoma apparently has a heterogenous nature. What genes determine the difference between the two types? We’ll use RNA expression data again but now we will use a predefined, supervised classification in groups to search for genes that characterize this classification best, or in other words, that are differentially expressed between these two groups.

  • Mixed Neuroblastoma (MES-ADRN) - Versteeg - 8 - MAS5.0 - u133p2 (same as above)
  • Gene Ontology
  • Broad curated hallmark datasets
  • Differential Expression: supervised gene selection
  • Gene Ontology Analysis: Overrepresentation calculation

Open the form for section 1.4

This dataset has been annotated with 'cell type' information. Each sample was assigned to either the MESenchymal or the ADReNergic cell type. The information is stored in R2 in a track.

  • Choose the proper track in the Select a track dropdown. Since we have only 8 samples make sure that the multiple testing correction is set to No correction. Clique Next twice. (More information on Correction for Multiple Testing can be found here).
  • A list of differentially expressed genes appears with correlation p-value < 0.01 in this dataset is shown. Click on the hyperlinked name of your favorite gene to see its expression in the sample set try an oppositely correlating gene as well
  • Go back to the window with the differentially expressed genes. This is still open in one of your browser tabs.
  • Clique no Heatmap(zscore) button in the right menu panel a heatmap shows the expression of the differentially expressed genes for each sample.

How is this figure different from the former?


For future use, this list of genes has been stored for you in R2 as signatures (aka genesets or categories). The list has been split into two categories: one set of genes that is highly expressed in the MES type of samples (r2_mesadrn_mes) and one set of genes highly expressed in the ADRN type of samples (r2_mesadrn_adrn).

R2 provides additional analysis for sets of genes that can be accessed from the right panel of menu buttons. As a first analysis step we can check a data resource called the Gene Ontology that provides a tree of systematically ordered biological terms that is used to formally describe the biological role of each gene. The Gene Ontology Analysis tool in R2 calculates for each of the thousands of groups of genes that are annotated with a specific biological term whether your set of choice is over-represented in them.

  • On the page with the differentially expressed genes, select the Gene Ontology Analysis button in the menu on the right

What can you say about the function of the differentially expressed genes?

  • Now scroll down to the end of the page (or click the filter button in the left upper corner of the page) and adapt the settings such that only the Biological Process branch of the Gene Ontology is selected, and select only the genes that are higher expressed in the MES type of cells

What can you say about the function of the group of genes that are upregulated in the MES type of cells?

In R2 there are many more sets of genes that have been found to be implemented in specific processes. The Broad Institute has compiled quite some of these sets of genes that characterize hallmark biological processes.

  • Go back to the window with the differentially expressed genes.
  • Selecione os Gene set analysis option from the right menu
  • Selecione os geneset_broad_2015_hallmark geneset and click Next

Which hallmark category of genes pops up as most important? Can you explain this?

Identifying groups: using signatures to classify other datasets

We now have a signature that distinguishes between the two types of cells. We also obtained some hints about functional characteristics of these cells. How does this signature behave in other datasets? Does the same set of genes tell us something about other sets of tumors or cell lines? This is the next step in our analysis.
We've assembled a more complex dataset by gathering the dataset of the 4 pairs of cell lines, additional neuroblastoma cell lines from the first dataset and publicly available data of non-malignant human neural crest tissue. The neural crest undergoes a mesenchymal transition and gives rise to cell types from the adrenergic lineage.

  • A combination of the 8 cell lines above, additional neuroblastoma cell lines and cells from the neural crest lineage (Mixed Neuroblastoma (MES-ADRN-CREST) - Versteeg/Etchevers - 34 - MAS5.0 - u133p2)

Open the form for section 1.5

  • Go to the main portal of R2 by clicking the button below the dataset described above is automatically selected
  • In field 3 select View Geneset that you can find under the red header Meta-analysis.
  • Clique Next and select geneset_r2provided_genelists
  • Clique Next, leave selection as is and click Next
  • Select both signatures that were derived before by CTRL click on the MES (r2_mesadrn_mes) and ADRN (r2_mesadrn_adrn) signatures and click Next

Which cell types group together?

How does this relate to the earlier observations on cell lineage?

When observing such clear-cut patterns it is good scientific practice to test this in additional datasets. The database of R2 contains an additional dataset consisting of neuroblastoma cell lines that were profiled by a French research team.

Do you observe similar patterns?

Using scores for further characterization

The expression patterns of these specific signatures can be used to compare cell types. We can do this by summarizing the expression data of all genes in the signature in each cell type in one value a signature score. The figure below shows the signature score of the MES part of the signature in a specific sample.

R2 has calculated these scores for all samples in both signatures. We're going to find out how they relate.

Open the form for section 1.6

  • In field 3 choose Relate 2 tracks and click Next
  • First we'll explore the scores in each signature separately on the X-axis (Select X track) we'll use the unique sample id (lab_id) and on the Y-axis the signature score track that R2 has generated for the ADRN signature (s_mesadrn_adrn(#)). Clique Next.
  • A graph is generated. For each sample the signature score for the mesadrn_adrn signature is shown. Selecione Color by Track for ColorMode and try different tracks. Clique Adjust Settings to view the result.
  • Now select for the Y-axis the MES part of the signature, click Adjust Settings to view the result.
  • To compare the signature scores, select the ADRN signature for the X track
  • If you have time you can also try the Color by Gene ColorMode, choose a gene of interest (Note: the dropdown selection is linked to the database, wait for the proper selections to popup. )

What conclusion would you draw from these figures?

Finding causes: homing in on transcription factors

Apparently there are two types of cells in Neuroblastoma tumors. Neuroblastoma seems to be a heterogenous tumor. Transcription factors (TF's) are known to determine gene expression programs in cells. These gene expression programs determine the development of the cell. Can we find out which TF's might influence the difference between both of these cell lines?

  • Mixed Neuroblastoma (MES-ADRN-CREST) - Versteeg/Etchevers - 34 - MAS5.0 - u133p2
  • Transcription factor annotation from Gene Ontology
  • NCBI (National Center for Biotechnology Information - USA) Gene information database

Open the form for section 1.7

Again we're going to find out which genes make a difference, but now in a specific subset of genes that has been annotated to have Transcription Factor activity. This is gathered from databases that collect that information from peer reviewed publications.

  • In field 3 select Find Differential expression between groups Clique Next
  • Like before, select the track that contains information about the cell types*.
  • We're now also going to filter for a specific gene filter. No Gene Filters section, choose from the bottom dropdown the category C: geneannot Como Gene set. Now click again on the same dropdown, and you will see that the dropdown list has expanded with different subcategories. Select the subcategory transcription factors, SC: TF (945). Clique Next.
  • In the next screen we're asked to further filter for the specific types of samples to compare. Here we're focusing on the difference between ADRN and MES select these (i.e. uncheck neural_crest). Clique Next.
  • A list of genes appears. Investigate the top 4 by clicking on the hyperlinked gene symbols. This brings you to the expression view of the gene.
  • From here you can also access the NCBI gene database containing additional information on the function of the gene and related scientific publications. Do this by clicking on the hyperlinked GeneID number in the top table. You'll arrive at a website that gathers all known information on genes. A useful section is the Bibliografia containing short summaries of relevant scientific papers.

Armed with this information, which gene would you choose for further research? Porque?

Proving causes: manipulating cell lines

From experiments it is known that cells can change their nature, some cells exhibit a certain plasticity.

Open the form for section 1.8

From your own biomedical knowledge, can you explain why this is of relevance to cancer?

From experiments in our lab it became evident that the two cell types found in Neuroblastoma were able to switch. After a given period of time cells in dishes changed their nature as was proven by the expression of certain marker proteins on their surface.
Now that we have a candidate Transcription Factor we can try to investigate its relevance in this plasticity by manipulating the gene in cell lines we grow in the lab.

Can you think of ways to manipulate genes in cell lines?

The TF was inducibly expressed in the SKNBE cell line and this was monitored through time for its gene expression using Affymetrix mRNA arrays. The resulting data was added to the dataset we used above for comparison.

To which of the cell types does SKNBE belong?

  • A combination of the 4 cell line pairs, additional classical Neuroblastoma cell lines, cells from the neural crest lineage and lines that had the TF inducible expressed for increasing periods (Mixed Neuroblastoma (MES-ADRN-Crest-Exp) - Versteeg - 52 - MAS5.0 - u133p2)
  • Select in field 3 the Relate 2 tracks option. R2 has calculated signature scores for all samples in both signatures in this dataset these tracks are called adrn_score e mes_score. Relate the two tracks, adapt the ColorMode para Color by Track and try the mes_adrn_time track. This track contains information on the time that the PRRX1 gene expression was induced in the SKNBE cell line.

What is your conclusion from this experiment?

  • This conclusion is even more obvious when the sequence of events is highlighted, as can be done in R2. The relations between the isogenic pairs are also illustrated. Click the button below to view the graph annotated in this way, a figure that can be incorporated in a publication right away.

Creating hypotheses: relating to chromatin modification data

Apparently this TF is capable of shifting cells from one state to the other. How can we further determine causal relations and ideally targetable processes in these cancer cells? How is a switch dynamically possible? A growing body of evidence implicates enhancers as key elements defining cell identity but the relationship of these enhancers to intratumoral heterogeneity is unknown. We performed ChIP-Seq analysis of the H3K27ac histone modifications for the isogenic cell line pairs.

  • Genome Browser: analyzing histone modifications marking active enhancers
  • Differential Expression

Open the form for section 1.9

Can you explain what the goal of this experiment was?

First we'll check one of the HAND genes, known to play a role in the development of the sympatho-adrenal lineage from the neural crest.

What do you expect for the H3K27ac signals?

  • Click on the button below to show the ChIP-Seq data for HAND1 in the four mesenchymal and five adrenergic neuroblastoma cell lines. For your convenience the signals are colored according to the type (MES or ADRN) of cell line.

Regions encoding genes are drawn at the bottom of the graph. When in red they're encoded in the reverse direction, coding exons are darker.

Can you explain this graph? What do you expect for the expression of this gene?

  • At the top of the page click on the zoom out 10X botão. Look at the differences between the cell lines

The chromatin state is especially important for transcription factors we'll re-visit the list of transcription factors that are differentially expressed between the MES and ADRN cell lines.

Why are Transcription Factors of interest in this setting?

  • Use both expression analysis and the enhancer data in the genomebrowser to decide which transcription factors would be worthwhile to further investigate. In the genomebrowser that was still open from the previous question, type the name of the gene in the left upper corner textfield. To further explore the larger region around the gene you can use the zoom buttons at the top of the page.

Which Transcription Factor would you consider for further study?

With the current new knowledge that you derived above, can you think of a strategy to use the fact that neuroblastoma is a heterogenous tumor consisting of a mesenchymal, motile cell type and a adrenergic, differentiated cell type for therapeutic options? This is an open question, so be creative, you might find something interesting! If you want, you can follow the suggestions below.

Use the button of 1.9 to perform a differential expression analysis. This time explore other gene categories that could be interesting for drug development. Look at the expression profiles of some genes of your choice.

  • Hint: There is a category "drugtargets" in R2 to select druggable proteins you can select this in the same dropdown where the TF selection was done.
  • Another very interesting gene category is the "kinase" category, this contains known kinases that have active roles in pathways.

The first button in 1.9 takes you to the Genome Browser at the position of the HAND1 gene. In the upper left corner of that page, you can fill in other genes of interest to look at the ChIP-Seq profiles of the samples at these locations of the genome. Do this for the genes whose expression profiles you just have studied. Try to find genes that show consistent chromatin modification profiles for the one type of neuroblastoma cell lines and a different consistent profile for the other type.

Knowledge about pathways can be exploited as well.

The NCBI database can provide additional information from literature about the genes of interest.

Open the form for section 1.10

Which strategy do you suggest?

Final remarks / future directions

In the March 1st 2018 issue of Nature a paper was published describing a landscape of genomic alterations across childhood cancers. The data is accessible in R2 also as a Datascope. This is another example of how R2 can visualize your genomics data.

This ends the course. Feel free to further explore the course materials or our tutorials.


13.6 Data quality assessment and quality control

We distinguish between data quality assessment (QA) –steps taken to measure and monitor data quality– and quality control (QC) –removing bad data. These activities pervade all phases of an analysis, from assembling the raw data over transformation, summarization, model fitting, hypothesis testing or screening for “hits” to interpretation. QA-related questions include:

How do the marginal distributions of the variables look (histograms, ECDF plots)?

How do their joint distributions look (scatter plots, pairs plot)?

How well do replicates agree (as compared to different biological conditions)? Are the magnitudes of the differences between several conditions plausible?

Is there evidence of batch effects? These could be of a categorical (stepwise) or continuous (gradual) nature, e.g.. due to changes in experimental reagents, protocols or environmental factors. Factors associated with such effects may be explicitly known, or unkown and latent , and often they are somewhere in between (e.g., when a measurement apparatus slowly degrades over time, and we have recorded the times, but don’t really know exactly at what time the degradation is how bad).

For the last two sets of questions, heatmaps, principal component plots and other ordination plots (as we have seen in Chapters 7 and 9) are useful.

Figure 13.13: Henry Ford’s (possibly apocryphal) quote: “If I had asked people what they wanted, they would have said faster horses.” expresses the view of quality as fitness for purpose, versus adherence to specifications. (Source: Ford)

It’s not easy to define qualidade, and the word is used with many meanings. The most pertinent for us is fitness for purpose, 165 165 http://en.wikipedia.org/wiki/Quality_%28business%29 and this contrasts to other definitions of quality that are based on normative specifications. For instance, in differential expression analysis with RNA-Seq data, our purpose may be the detection of differentially expressed genes between two biological conditions. We can check specifications such as the number of reads, read length, base calling quality, fraction of aligned reads, but ultimately these measures in isolation have little bearing on our purpose. More to the point will be the identification of samples that are not behaving as expected, e.g., because of a sample swap or degradation or genes that were not measured properly. We saw an example for this in Section 8.10.3. Useful plots include ordination plots, such as Figure 8.6, and heatmaps, such as Figure 8.7. UMA quality metric is any value that we use to measure quality, and having explicit quality metrics helps automating QA/QC.


POSSIBLE NK CELL TUMORS OR PRESENCE OF NK CELLS AT SITE OF TUMOR GROWTH

Sidney H. Golub , . E. Carmack Holmes , in NK Cells and Other Natural Effector Cells , 1982

II NK ACTIVITY OF TIL

We have previously reported ( Niitsuma et al., 1981 ) that TIL from human pulmonary tumors have decreased proportions of T cells and decreased activity in assays of T cell function including alloantigen induced proliferation and generation of cytolytic T cells. However, we did find considerable proportions of cells with Fcγ receptors among these TIL (average of 18.8% EAγ ros et te-forming cells) and therefore it is possible that NK activity would be present among TIL. As shown in Table I , 51 Cr-release assays against K562 targets showed low activity among TIL from pulmonary tumors of a variety of histologic types. The TIL were obtained by mechanical disaggregation, Ficoll-Hypaque density gradient centrifugation, and further fractionated by filtration thr.ough nylon monofilament mesh to remove tumor cells. We have shown that removal of residual tumor cells did not result in improvement of NK activity ( Niitsuma et al., 1981 ), indicating that the low NK activity is not due to cold target competition by residual tumor cells. However, TIL obtained from tumors injected two weeks prior to surgery with intralesional BCG ( Holmes et al., 1979 ) did exhibit higher levels of NK activity than TIL from uninjected tumors. Similarly, hilar lymph node lymphocytes (LNL) and peripheral blood lymphocytes (PBL) from the same patients showed modestly higher NK activity ( Table I ). It is interesting to note that in three cases we were able to obtain BCG injected TIL and uninjected TIL from the same patients. These patients had multiple pulmonary metastases, only one of which was BCG injected. In these cases, the NK activity of uninjected TIL remained low while the NK activity of TIL from the adjacent BCG injected tumors was high ( Table I ). These preliminary results suggest that the induction of augmented NK activity at one tumor site, even in combination with augmented systemic NK activity among PBL and LNL, does not necessarily ensure the delivery of active NK cells at other tumor deposits. In this sense, our results are compatible with the suggestion of Hanna and Fidler ( Hanna and Fidler, 1980 ) that NK activity is most effective against circulating tumor cells and of less relevance in defenses against established tumor deposits.

Table I . NK Cytotoxicity of TIL and BCG-TIL

Since we had shown the presence of relatively high proportions of Fcγ receptor cells among TIL, we then asked whether there were target binding and killing cells among the TIL. For this assessment we utilized the single cell assay of Grimm and Bonavida ( Grimm and Bonavida, 1979 ). Preliminary results with this analysis are shown in Table II . Thus far we have seen equivalent numbers of target binding cells among TIL as we see among PBL from the same patients. The proportion of those binding cells actually mediating cytolysis in a three hour assay is also similar among TIL as compared to PBL ( Table II ). Thus, the low activity in 51 Cr-release assays is probably not due to a lack of NK cells among the TIL but instead appears to be due to a functional impairment of these cells. Since the proportion of K562 killing cells among the binders is comparable to PBL, the functional impairment is most likely in the recycling ability of the NK cells among the TIL. In line with this hypothesis are the results of Moore and Vose ( Moore and Vose, 1981 ) and our unpublished observations that TIL cannot be activated to further NK activity with interferon Interferon, which has been shown to accelerate the kinetics of NK-induced lysis ( Silva et al., 1980 ), would presumably promote recycling and might have little effect on cells unable to mediate repeated lytic events.

Table II . Target Binding and Killing Cells

Cell SourceNumber of Samples% Binding Cells a ± S.E.% Killers b ± S.E.% Total NK c ± S.E.
TIL610.7 ± 1.933.4 ± 6.63.6 ± 0.8
LNL415.3 ± 4.248.6 ± 12.87.6 ± 2.6
PBL69.3 ± 2.139.8 ± 6.34.2 ± 1.6

Freeing the TIL from the tumor environment did not restore their NK activity. Incubation of TIL for 24 hours at 37° failed to restore NK activity to levels comparable to those in the PBL. For example, four TIL specimens we tested had NK activity of 5%, 4%, 3%, and 2% vs K562 at a 50:1 effector:target ratio. Incubation for 24 hours at 37° followed by washing resulted in very slight increases in NK cytotoxicity (6%, 10%, 4%, and 4% for the same four samples). The addition of 1×10 −5 M indomethacin in the incubation medium did not improve cytotoxic activity of the TIL against K562 targets. Thus, the TIL appear to be profoundly suppressed in NK function and cannot be restored with activators of NK activity or by allowing them a period of time to shed tumor cell products or other suppressive substances.


Comments and recommendations

In summary, all of the tested fixatives (RNAlater ® , RNAfix (self-made), acetone, methylated ethanol and ethanol for molecular biology) resulted in high quality RNA and a sufficient yield in combination with TRIzol ® -RNA-isolation. However, the quantity of RNA may differ when other extraction methods are used. Simister et al. ( 2011 ) showed that RNA yield was higher with TRIzol ® isolation than with the use of a Qiagen kit. Hence, when choosing a suitable fixative, in addition to feasibility and economic issues, the right extraction method and its compatibility to the preservation media have to be considered.

Even though applicability to other species or tissues cannot be guaranteed based on our study, the rapid penetration of tissues by primary alcohols suggests that ethanol works with a wide range of (at least) invertebrates. However, fixation of large specimens, or species that can actively close their respiratory tracts, might not be instant. In those cases it might be advisable to kill specimens prior to submersion in the fixative to avoid altered mRNA-levels (Prendini et al. 2002 Gayral et al. 2011 ).

Furthermore, we cannot recommend the commonly used housekeeping gene actina for normalization of mRNA data in studies investigating D. latitarsis (under natural conditions), as it showed diurnal variations in our dataset.

Additional Supporting Information may be found in the online version of this article.


Assista o vídeo: Transcrição em eucariotos (Novembro 2021).