Em formação

Qual é a variável dependente de um gráfico de fluorescência relativa?


Então foi perguntado qual era a variável dependente deste experimento. Eu sei que, como alunos, estamos programados para pensar que o eixo y é a variável dependente, enquanto o eixo x é a variável independente (provavelmente bom assim, não sei).

No entanto, pensei que a variável dependente nesta cinética seria o tempo. Uma vez que tem fluorescência relativa de 100 a 0, a mudança na fluorescência para todas as quatro condições não é a mesma, enquanto a única variável afetada é a taxa (que neste experimento é mais dependente da mudança no tempo)?

Desculpe, não posso dar mais informações sobre as condições do experimento, é uma pergunta de teste que eu não teria permissão para postar, por isso eu apaguei as condições de cada linha. Qualquer ajuda seria muito apreciada.


Quando uma variável é independente, ela não é afetada por nenhuma outra variável. A fluorescência relativa obviamente depende do parâmetro de tempo neste caso. Se você parasse em 30 minutos e fizesse leituras a cada 3 minutos, seus dados pareceriam muito diferentes.

Sem mais informações sobre o experimento, no entanto, é difícil dizer se existem variáveis ​​adicionais.


3.6: Variáveis ​​que influenciam as medições de fluorescência

Há uma variedade de variáveis ​​que influenciam o sinal observado na espectroscopia de fluorescência. Como visto no diagrama original, mostrando os vários níveis de energia e transições que podem ocorrer, qualquer coisa que possa extinguir a transição fluorescente afetará a intensidade da fluorescência.

Ao discutir a espectroscopia de absorção, uma consideração importante é a Lei de Beer & rsquos. Uma relação semelhante existe para a espectroscopia de fluorescência, como mostrado abaixo, em que (I ) é a intensidade de fluorescência, ( varepsilon ) é o absortividade molar, (b ) é o comprimento do percurso, (c ) é o concentração, e (P_o ) é o fonte de energia.

Não surpreendentemente, a intensidade da fluorescência varia linearmente com o comprimento do caminho e com a concentração. K & rsquo é uma constante que depende da geometria e de outros fatores e inclui o rendimento quântico da fluorescência. Como ( varphi_F ) é uma constante para um determinado sistema, K & rsquo é definido como K & rdquo ( varphi )F. De particular interesse é que a intensidade da fluorescência está diretamente relacionada à potência da fonte. É lógico que quanto maior a potência da fonte, mais espécies absorvem fótons e se tornam excitadas e, portanto, mais espécies eventualmente emitem radiação fluorescente. Isso sugere que os lasers de alta potência, desde que emitam no comprimento de onda de radiação adequado para excitar um sistema, têm o potencial de ser excelentes fontes para espectroscopia de fluorescência.

A equação acima prevê uma relação linear entre a intensidade da fluorescência e a concentração. No entanto, a utilidade desta equação é quebrada em valores de absorbância de 0,05 ou mais, levando a um desvio negativo da curva padrão.

Outra coisa que pode ocorrer com a fluorescência ou outros processos de emissão é que os fótons emitidos podem ser reabsorvidos por moléculas do estado fundamental. Este é um problema particular se o S1-S0 transição de emissão é aquela que está sendo monitorada. Nesta situação, em altas concentrações de analito, a intensidade de fluorescência medida no detector pode realmente começar a cair conforme mostrado na curva padrão na Figura ( PageIndex <8> ).

Figura ( PageIndex <8> ). Curva padrão para fluorescência mostrando reabsorção de fótons emitidos em concentrações mais altas.

Quaisquer mudanças no sistema que afetem o número e a força das colisões que ocorrem na solução irão influenciar a magnitude da emissão de fluorescência. As colisões promovem decadência sem radiação e perda de energia extra como calor, então mais colisões ou colisões mais fortes promoverão decadência sem radiação e reduzirão a emissão de fluorescência. Portanto, a intensidade da fluorescência depende da temperatura da solução. Temperaturas mais altas irão acelerar o movimento das moléculas (isto é, maior energia translacional) levando a mais colisões e mais colisões fortes, reduzindo assim a intensidade fluorescente. É importante garantir que todas as medições sejam feitas na mesma temperatura. Reduzir a temperatura da amostra também aumentará a relação sinal-ruído.

Outro fator que afetará o número de colisões é a viscosidade do solvente. Soluções mais viscosas terão menos colisões, menos desativação por colisão e maior intensidade fluorescente.

O solvente também pode ter outros efeitos, semelhantes ao que discutimos anteriormente na seção sobre espectroscopia de absorção de UV / VIS. Por exemplo, um solvente de ligação de hidrogênio pode influenciar o valor de ( lambda )max nos espectros de excitação e emissão, alterando os níveis de energia de elétrons e elétrons não ligados em orbitais ( pi ) *. Outras espécies na solução (por exemplo, íons metálicos) também podem se associar com o analito e alterar o ( lambda )max valores.

Muitos íons metálicos e oxigênio dissolvido são paramagnéticos. Já mencionamos que as espécies paramagnéticas promovem o cruzamento intersistemas, extinguindo assim a fluorescência. A remoção de íons metálicos paramagnéticos de uma amostra não é necessariamente uma questão trivial. A remoção do gás oxigênio dissolvido é feita facilmente purgando a amostra com um gás inerte diamagnético, como nitrogênio, argônio ou hélio. Todas as amostras da fase de solução devem ser purgadas do gás oxigênio antes da análise.

Outra preocupação que pode distinguir as soluções de amostra do branco e padrões é a possibilidade de que as soluções desconhecidas tenham impurezas que podem absorver a emissão fluorescente do analito. Comparar a excitação fluorescente e os espectros de emissão das amostras desconhecidas com os padrões pode fornecer uma indicação se o desconhecido tem impurezas que estão interferindo na análise.

O pH também terá um efeito pronunciado no espectro de fluorescência para ácidos e bases orgânicos. Um exemplo interessante é considerar o espectro de emissão de fluorescência para o composto 2-naftol. O átomo de hidrogênio hidroxila é ácido e o composto tem um pKa de 9,5. A um pH de 1, o composto existe quase exclusivamente como 2-naftol protonado. A um pH de 13, o composto existe quase exclusivamente como o íon 2-naftolato desprotonado. A um pH igual ao valor de pKa, a solução consistiria em uma mistura 50-50 da forma protonada e desprotonada.

Figura ( PageIndex <9> ).

Figura ( PageIndex <9> ). Espectros de emissão de fluorescência de 2-naftol em pH 2 e pH 13.

A coisa mais óbvia a notar é a grande diferença no ( lambda )max valor para o 2-naftol neutro (355 nm) e o íon 2-naftolato aniônico (415 nm). A diferença considerável entre os dois espectros de emissão ocorre porque a presença de mais formas de ressonância leva à estabilização (isto é, menor energia) do estado excitado. Conforme mostrado na Figura ( PageIndex <10> ), a espécie 2-naftolato tem múltiplas formas de ressonância envolvendo o átomo de oxigênio, enquanto a espécie 2-naftol neutra tem apenas uma única forma de ressonância. Portanto, o espectro de emissão do íon 2-naftolato é desviado para o vermelho em relação ao da espécie 2-naftol.

Figura ( PageIndex <10> ). Formas de ressonância envolvendo o átomo de oxigênio de 2-naftol e 2-naftolato.

Considere a reação mostrada abaixo para a dissociação de 2-naftol. Esta reação pode ser lenta (troca lenta) ou rápida (troca rápida) na escala de tempo da espectroscopia de fluorescência. Desenhe a série de espectros que resultariam para uma concentração inicial de 2-naftol de 10 -6 M se o pH fosse ajustado para 2, 8,5, 9,5, 10,5 e 13 e ocorresse uma troca lenta. Desenhe os espectros no mesmo pH quando a taxa de câmbio é rápida.

Se ocorrer uma troca lenta, uma espécie individual de 2-naftol ou 2-naftolato permanece em sua forma protonada ou desprotonada durante todo o processo de excitação-emissão e emite seu espectro característico. Portanto, quando ambas as espécies estão presentes em concentrações apreciáveis, dois picos ocorrem no espectro para cada uma das espécies individuais. No lado esquerdo da Figura ( PageIndex <11> ), em pH 2, todas as espécies estão na forma neutra de 2-naftol, enquanto em pH 13 estão todas na forma aniônica de 2-naftolato. Em pH 9,5, que é igual ao valor de pKa, há uma mistura de 50-50 dos dois e os picos para ambas as espécies são iguais em intensidade. Em pH 8,5 e 10,5, uma das formas predomina. A intensidade de cada espécie é proporcional à concentração.

Figura ( PageIndex <11> ). Representação do espectro de emissão fluorescente do 2-naftol em função do pH nas condições de troca lenta (esquerda) e rápida (direita).

Se ocorrer uma troca rápida, como visto no lado direito da Figura ( PageIndex <11> ), uma espécie em particular muda rapidamente entre sua forma protonada e desprotonada durante o processo de excitação e emissão. Agora, a emissão é uma média ponderada de tempo das duas formas. Se o pH for tal que mais 2-naftol neutro está presente na solução, o máximo é mais próximo de 355 nm (pH = 8,5). Se o pH for tal que mais 2-naftolato aniônico está presente na solução, o máximo é mais próximo de 415 nm (pH = 10,5). No valor de pKa (9,5), o pico aparece no meio dos dois extremos.

O que realmente acontece & ndash é a troca rápida ou lenta? A observação é que a troca de prótons que ocorre na reação ácido-base é lenta na escala de tempo da espectroscopia de fluorescência. Lembre-se de que a vida útil de um estado excitado é de cerca de 10 -8 segundos. Isso significa que a taxa de troca de prótons entre as espécies em solução é mais lenta do que 10 -8 segundos e o espectro de emissão de fluorescência tem picos para as espécies 2-naftol e 2-naftolato.


Recursos gráficos

Os gráficos de linha fornecem uma excelente maneira de mapear variáveis ​​independentes e dependentes que são quantitativas. Quando ambas as variáveis ​​são quantitativas, o segmento de linha que conecta dois pontos no gráfico expressa uma inclinação, que pode ser interpretada visualmente em relação à inclinação de outras retas ou expressa como uma fórmula matemática precisa. Os gráficos de dispersão são semelhantes aos gráficos de linha, pois começam com o mapeamento de pontos de dados quantitativos. A diferença é que com um gráfico de dispersão, a decisão é tomada que os pontos individuais não devem ser conectados diretamente entre si por uma linha, mas, em vez disso, expressar uma tendência. Essa tendência pode ser vista diretamente por meio da distribuição de pontos ou com o acréscimo de uma linha de regressão. Uma ferramenta estatística usada para expressar matematicamente uma tendência nos dados.

Uma variável independente e uma variável dependente

Gráfico de dispersão

Com um gráfico de dispersão, uma marca, geralmente um ponto ou um pequeno círculo, representa um único ponto de dados. Com uma marca (ponto) para cada ponto de dados, uma distribuição visual dos dados pode ser vista. Dependendo de quão firmemente os pontos se agrupam, você pode ser capaz de discernir uma tendência clara nos dados.

Como os pontos de dados representam dados reais coletados em um ambiente de laboratório, em vez de valores calculados teoricamente, eles representarão todos os erros inerentes a esse processo de coleta. Uma linha de regressão pode ser usada para descrever estatisticamente a tendência dos pontos no gráfico de dispersão para ajudar a vincular os dados a um ideal teórico. Essa linha de regressão expressa uma relação matemática entre a variável independente e a dependente. Dependendo do software usado para gerar a linha de regressão, você também pode receber uma constante que expressa a "qualidade do ajuste" da curva. Ou seja, com que grau de certeza podemos dizer que esta linha descreve verdadeiramente a tendência dos dados. A constante correlacional é geralmente expressa como R 2 (R ao quadrado). Se essa linha de regressão deve ser linear ou curva depende de como sua hipótese prevê a relação. Quando uma linha curva é usada, ela é normalmente expressa como uma curva de segunda ordem (cúbica) ou de terceira ordem (quadrática). Curvas de ordem superior podem seguir os pontos de dados reais mais de perto, mas raramente fornecem uma descrição matemática melhor do relacionamento.

Gráfico de linha

Os gráficos de linha são como gráficos de dispersão, pois registram valores de dados individuais como marcas no gráfico. A diferença é que uma linha é criada conectando cada ponto de dados. Desta forma, a mudança local de ponto a ponto pode ser vista. Isso é feito quando é importante ser capaz de ver a mudança local entre qualquer um dos pares de pontos. Uma tendência geral ainda pode ser vista, mas essa tendência é acompanhada pela tendência local entre indivíduos ou pequenos grupos de pontos. Ao contrário dos gráficos de dispersão, a variável independente pode ser escalar ou ordinal. No exemplo acima, o mês pode ser considerado escalar ou ordinal. A inclinação dos segmentos de linha é de interesse, mas provavelmente não estaríamos gerando fórmulas matemáticas para segmentos individuais.

O exemplo acima também pode ter sido produzido como um gráfico de barras. Você usaria um gráfico de linha quando quisesse ver mais claramente a taxa de mudança (inclinação) entre pontos de dados individuais. Se a variável independente fosse nominal, você quase certamente usaria um gráfico de barras em vez de um gráfico de linha.

Duas (ou mais) variáveis ​​independentes e uma variável dependente

Gráfico de Linhas Múltiplas

Aqui, pegamos o mesmo gráfico visto acima e adicionamos uma segunda variável independente, ano. Ambas as variáveis ​​independentes, mês e ano, podem ser tratadas como ordinais ou escalares. Isso geralmente ocorre com unidades de tempo maiores, como semanas, meses e anos. Visto que temos uma segunda variável independente, algum tipo de codificação é necessária para indicar em qual nível (ano) cada linha está. Embora possamos rotular cada barra com um texto indicando o ano, é mais eficiente usar cores e / ou um símbolo diferente nos pontos de dados. Precisaremos de uma legenda para explicar o esquema de codificação.

Vários gráficos de linha têm características de economia de espaço em um gráfico de barras agrupado comparável. Como os valores dos dados são marcados por pequenas marcas (pontos) e não barras, eles não precisam ser deslocados entre si (somente quando os valores dos dados são muito densos isso se torna um problema). Outra vantagem é que as linhas podem ser codificadas duplamente facilmente. Com as linhas, eles podem ser codificados por cores (para computador e tela impressa em cores) ou codificados por forma com símbolos (para reprodução em preto e branco). Com barras, a codificação de formas não pode ser usada e a codificação de padrões deve ser substituída. A codificação de padrões tende a ser muito mais limitante.

Observe que há uma quebra na linha de dados de 1996 (verde / triângulo) entre agosto e outubro. Como o ponto de dados para setembro está faltando, a linha não deve ser conectada entre agosto e outubro, pois isso resultaria em uma inclinação local incorreta. Isso é particularmente importante se você exibir a linha sem símbolos em pontos de dados individuais.

Dicas de Excel

Para obter informações sobre a criação de gráficos de barras com o Excel, vá para o Módulo de Gráficos de Linha e Gráficos de Dispersão ou vá para o Menu Principal do Tutorial do Excel para uma lista completa de módulos.

Dicas específicas para gráficos de linha

  • O tutorial de gráficos fornece instruções específicas sobre a criação de gráficos de dispersão e linhas de regressão
  • Os gráficos de linha podem ser criados com o tipo de gráfico de linha ou com dispersão (XY). Ao usar o Scatter (XY), escolha o subtipo Conectado com Linha.
  • É mais simples criar um gráfico de linha com (XY) Scatter quando suas variáveis ​​independentes e dependentes estão em colunas.
  • Marcas para pontos de dados são chamadas de Marcadores
  • A cor e o tamanho da linha e dos marcadores podem ser definidos clicando duas vezes na linha do gráfico.
  • Os marcadores podem ser desativados clicando duas vezes na linha e escolhendo Nenhum em Marcadores.

& copiar Copyright NC State University 2004
Patrocinado e financiado pela National Science Foundation
(DUE-9950405 e DUE-0231086)


O que é uma variável numérica e o que é uma variável categórica?

UMA variável categórica é uma categoria ou tipo. Por exemplo, a cor do cabelo é um valor categórico ou a cidade natal é uma variável categórica. Espécie, tipo de tratamento e gênero são variáveis ​​categóricas.

UMA variável numérica é uma variável onde a medida ou número tem um significado numérico. Por exemplo, a precipitação total medida em polegadas é um valor numérico, a frequência cardíaca é um valor numérico e o número de cheeseburgers consumidos em uma hora é um valor numérico.

Uma variável categórica pode ser expressa como um número para fins estatísticos, mas esses números não têm o mesmo significado que um valor numérico . Por exemplo, se estou estudando os efeitos de três medicamentos diferentes em uma doença, posso citar os três medicamentos diferentes, medicamento 1, medicamento 2 e medicamento 3. No entanto, o medicamento três não é maior, nem mais forte, nem mais rápido do que o medicamento 1. Esses números não são significativos.


Métodos analíticos

Regressão Logística Multinomial

A regressão logística multinomial (MLR) é uma estatística de classificação semiparamétrica que generaliza a regressão logística para problemas multiclasse (por exemplo, mais de dois resultados possíveis). MLR prevê as probabilidades dos vários resultados de uma variável dependente categoricamente distribuída usando uma combinação de variáveis ​​independentes de qualquer classe (por exemplo, binária, ordinal, contínua). Para prever a associação ao grupo, o MLR usa o log odds ratio em vez de probabilidades e um método de máxima verossimilhança iterativo em vez de um método de mínimos quadrados para ajustar o modelo final. As suposições de MLR incluem (1) cada variável independente deve ter um único valor para cada caso (2) colinearidade é considerada relativamente baixa, embora não necessariamente completamente independente e (3) deve haver independência de alternativas irrelevantes (IIA). O IIA define as chances de preferir uma classe em vez de outra, independentemente da presença de outras alternativas não relacionadas e irrelevantes.

O MLR, infelizmente, não produz probabilidades de tipicidade que são úteis para avaliar o quão bem o modelo está classificando, mas Hefner e Ousley (2014) sugerem substituir essas medidas por métodos não paramétricos, como probabilidades classificadas e medidas de similaridade interindividual classificadas (Hefner e Ousley 2014) . Métodos de validação cruzada podem ser usados ​​para testar o desempenho da regressão logística e para obter uma estimativa de confiabilidade do modelo.


Tipos de variáveis ​​biológicas

Existem três tipos principais de variáveis: variáveis ​​de medição, que são expressas como números (como 3,7 mm), variáveis ​​nominais, que são expressas como nomes (como "feminino") e variáveis ​​classificadas, que são expressas como posições (como " terceiro"). Você precisa identificar os tipos de variáveis ​​em um experimento para escolher o método correto de análise.

Introdução

Uma das primeiras etapas para decidir qual teste estatístico usar é determinar quais tipos de variáveis ​​você possui. Quando você sabe quais são as variáveis ​​relevantes, que tipo de variáveis ​​elas são e quais são suas hipóteses nula e alternativa, geralmente é muito fácil descobrir qual teste você deve usar. Classifico as variáveis ​​em três tipos: variáveis ​​de medição, variáveis ​​nominais e variáveis ​​classificadas. Você verá outros nomes para esses tipos de variáveis ​​e outras maneiras de classificar variáveis ​​em outras referências de estatísticas, portanto, tente não se confundir.

Crustáceo isópode (percevejo ou roly-poly), Armadillidium vulgare.

Você analisará experimentos semelhantes, com hipóteses nulas e alternativas semelhantes, de maneira completamente diferente, dependendo de qual desses três tipos de variáveis ​​estão envolvidos. Por exemplo, digamos que você mediu variável X em uma amostra de 56 isópodes masculinos e 67 femininos (Armadillidium vulgare, comumente conhecido como percevejo ou roliço), e sua hipótese nula é "Masculino e feminino A. vulgare têm os mesmos valores da variável X. "Se a variável X for a largura da cabeça em milímetros, é uma variável de medida, e você compararia a largura da cabeça em homens e mulheres com uma amostra de duas t& ndashtest ou uma análise de variância unilateral (anova). Se a variável X for um genótipo (como AA, Aa, ou aa), é uma variável nominal e você compararia as frequências do genótipo em machos e fêmeas com um teste exato de Fisher. Se você agitar os isópodes até que se enrolem em pequenas bolas, registre qual é o primeiro isópode a desenrolar, o segundo a desenrolar, etc., é uma variável classificada e você compararia o tempo de desenrolamento em machos e fêmeas com um teste de Kruskal & ndashWallis .

Variáveis ​​de medição

Variáveis ​​de medição são, como o nome indica, coisas que você pode medir. Uma observação individual de uma variável de medição é sempre um número. Os exemplos incluem comprimento, peso, pH e densidade óssea. Outros nomes para eles incluem variáveis ​​"numéricas" ou "quantitativas".

Alguns autores dividem as variáveis ​​de medição em dois tipos. Um tipo são as variáveis ​​contínuas, como o comprimento da antena de um isópode, que em teoria têm um número infinito de valores possíveis. A outra são as variáveis ​​discretas (ou merísticas), que têm apenas valores inteiros - são coisas que você conta, como o número de espinhos na antena de um isópode. As teorias matemáticas subjacentes aos testes estatísticos envolvendo variáveis ​​de medição assumem que as variáveis ​​são contínuas. Felizmente, esses testes estatísticos funcionam bem em variáveis ​​de medição discretas, então você geralmente não precisa se preocupar com a diferença entre variáveis ​​de medição contínuas e discretas. A única exceção seria se você tiver um número muito pequeno de valores possíveis de uma variável discreta, caso em que você pode querer tratá-la como uma variável nominal.

Quando você tem uma variável de medição com um pequeno número de valores, pode não ficar claro se ela deve ser considerada uma medição ou uma variável nominal. Por exemplo, digamos que seus isópodes tenham de 20 a 55 espinhos em sua antena esquerda, e você deseja saber se o número médio de espinhos na antena esquerda é diferente entre machos e fêmeas. Você deve considerar o número da coluna como uma variável de medição e analisar os dados usando uma amostra de duas t& ndashtest ou uma anova unilateral. Se houver apenas dois números de espinha diferentes - alguns isópodes têm 32 espinhos, e alguns têm 33 & mdash, você deve tratar o número da espinha como uma variável nominal, com os valores "32" e "33", e comparar as proporções de isópodes com 32 ou 33 espinhos nos homens e mulheres usando um teste exato de Fisher de independência (ou qui-quadrado ou G& ndashtest de independência, se o tamanho da sua amostra for realmente grande). O mesmo é verdadeiro para experimentos de laboratório, se você der comida a seus isópodes com 15 concentrações diferentes de manose e, em seguida, medir sua taxa de crescimento, a concentração de manose seria uma variável de medição se você der comida a alguns isópodes com 5 mM de manose, e o resto dos isópodes obtém 25 mM de manose, então a concentração de manose seria uma variável nominal.

Mas e se você projetar um experimento com três concentrações de manose, ou cinco, ou sete? Não existe uma regra rígida, e como você trata a variável dependerá em parte de suas hipóteses nula e alternativa. Se sua hipótese alternativa for "valores diferentes de manose têm taxas diferentes de crescimento de isópodes", você pode tratar a concentração de manose como uma variável nominal. Mesmo se houver algum padrão estranho de alto crescimento com manose zero, baixo crescimento com pequenas quantidades, alto crescimento com quantidades intermediárias e baixo crescimento com altas quantidades de manose, uma anova unilateral pode dar um resultado significativo. Se sua hipótese alternativa for "os isópodes crescem mais rápido com mais manose", seria melhor tratar a concentração de manose como uma variável de medição, para que você possa fazer uma regressão. Na minha aula, usamos a seguinte regra prática:
& mdasha variável de medição com apenas dois valores deve ser tratada como uma variável nominal
& mdasha variável de medição com seis ou mais valores deve ser tratada como uma variável de medição
& mdasha variável de medição com três, quatro ou cinco valores não existe.

Claro, no mundo real existem experiências com três, quatro ou cinco valores de uma variável de medição. Estudos de simulação mostram que a análise de tais dependente variáveis ​​com os métodos usados ​​para variáveis ​​de medição funcionam bem (Fagerland et al. 2011). Não tenho conhecimento de nenhuma pesquisa sobre o efeito do tratamento independente variáveis ​​com pequenos números de valores como medida ou nominal. Sua decisão sobre como tratar sua variável dependerá em parte de sua questão biológica. Você pode evitar a ambigüidade ao projetar o experimento & mdash se quiser saber se uma variável dependente está relacionada a uma variável independente que poderia ser medida, é uma boa ideia ter pelo menos seis valores da variável independente.

Algo que pode ser medido é uma variável de medição, mesmo quando você define os valores. Por exemplo, se você cultivar isópodes com um lote de alimento contendo 10 mM de manose, outro lote de alimento com 20 mM de manose, outro lote com 30 mM de manose, etc. até 100 mM de manose, as diferentes concentrações de manose são uma variável de medição, mesmo que você tenha feito a comida e definir a concentração de manose sozinho.

Tenha cuidado ao contar algo, pois às vezes é uma variável nominal e às vezes uma variável de medição. Por exemplo, o número de colônias de bactérias em uma placa é uma variável de medição, você conta o número de colônias e há 87 colônias em uma placa, 92 em outra placa, etc. Cada placa teria um ponto de dados, o número de colônias isso é um número, então é uma variável de medição. No entanto, se a placa tiver colônias de bactérias vermelhas e brancas e você contar o número de cada uma, é uma variável nominal. Agora, cada colônia é um ponto de dados separado com um dos dois valores da variável, "vermelho" ou "branco" porque essa é uma palavra, não um número, é uma variável nominal. Nesse caso, você pode resumir os dados nominais com um número (a porcentagem de colônias que são vermelhas), mas os dados subjacentes ainda são nominais.

Índices

Às vezes, você pode simplificar sua análise estatística tomando a proporção de duas variáveis ​​de medição. Por exemplo, se você quiser saber se os isópodes machos têm cabeças maiores, em relação ao tamanho do corpo, do que os isópodes fêmeas, você pode pegar a proporção da largura da cabeça com o comprimento do corpo de cada isópode e comparar as proporções médias de machos e fêmeas usando um duas amostras t& ndashtest. No entanto, isso pressupõe que a proporção é a mesma para diferentes tamanhos de corpo. Sabemos que isso não é verdade para os humanos & mdash a proporção do tamanho da cabeça / tamanho do corpo em bebês é assustadoramente grande, em comparação com adultos & mdashso você deve olhar para a regressão da largura da cabeça no comprimento do corpo e certificar-se de que a linha de regressão vai bem perto da origem, como uma linha reta A linha de regressão através da origem significa que as razões permanecem as mesmas para diferentes valores da variável X. Se a linha de regressão não chegar perto da origem, seria melhor manter as duas variáveis ​​separadas em vez de calcular uma proporção e comparar a linha de regressão da largura da cabeça no comprimento do corpo em homens com aquela em mulheres usando uma análise de covariância .

Variáveis ​​circulares

Um tipo especial de variável de medição é uma variável circular. Eles têm a propriedade de que o valor mais alto e o valor mais baixo estão próximos um do outro frequentemente, o ponto zero é completamente arbitrário. As variáveis ​​circulares mais comuns em biologia são a hora do dia, a época do ano e a direção da bússola. Se você medir a época do ano em dias, o dia 1 pode ser 1 de janeiro, ou o equinócio da primavera, ou seu aniversário, qualquer que seja o dia que você escolher, o dia 1 é adjacente ao dia 2 de um lado e o dia 365 do outro.

Se você está considerando apenas parte do círculo, uma variável circular se torna uma variável de medição regular. Por exemplo, se você estiver fazendo uma regressão polinomial de ataques de urso vs. época do ano no Parque Nacional de Yellowstone, você pode tratar "mês" como uma variável de medida, com março como 1 e novembro como 9, você não precisa preocupe-se que fevereiro (mês 12) seja próximo a março, porque os ursos hibernam de dezembro a fevereiro, e você ignoraria esses três meses.

No entanto, se sua variável é realmente circular, existem testes estatísticos especiais muito obscuros projetados apenas para dados circulares. Os capítulos 26 e 27 em Zar (1999) são um bom lugar para começar.

Variáveis ​​nominais

As variáveis ​​nominais classificam as observações em categorias discretas. Exemplos de variáveis ​​nominais incluem sexo (os valores possíveis são masculino ou feminino), genótipo (os valores são AA, Aa, ou aa), ou condição do tornozelo (os valores são normais, entorse, ligamento rompido ou quebrado). Uma boa regra prática é que uma observação individual de uma variável nominal pode ser expressa como uma palavra, não um número. Se você tiver apenas dois valores do que normalmente seria uma variável de medição, é nominal em vez disso: pense nisso como "presente" x "ausente" ou "baixo" x "alto". Variáveis ​​nominais são freqüentemente usadas para dividir indivíduos em categorias, de forma que outras variáveis ​​possam ser comparadas entre as categorias. Na comparação da largura da cabeça em isópodes masculinos e femininos, os isópodes são classificados por sexo, uma variável nominal, e a variável de medição da largura da cabeça é comparada entre os sexos.

Variáveis ​​nominais também são chamadas de variáveis ​​categóricas, discretas, qualitativas ou de atributo. "Categórico" é um nome mais comum do que "nominal", mas alguns autores usam "categórico" para incluir o que estou chamando de "nominal" e o que estou chamando de "classificado", enquanto outros autores usam "categórico" apenas para o que estou chamando de variáveis ​​nominais. Vou ficar com "nominal" para evitar essa ambigüidade.

Variáveis ​​nominais são freqüentemente resumidas como proporções ou porcentagens. Por exemplo, se você contar o número de homens e mulheres A. vulgare em uma amostra de Newark e uma amostra de Baltimore, você pode dizer que 52,3% dos isópodes em Newark e 62,1% dos isópodes em Baltimore são fêmeas. Essas porcentagens podem parecer uma variável de medição, mas na verdade representam uma variável nominal, sexo. Você determinou o valor da variável nominal (masculino ou feminino) em 65 isópodes de Newark, dos quais 34 eram mulheres e 31 eram homens. Você pode plotar 52,3% em um gráfico como uma forma simples de resumir os dados, mas deve usar os 34 números femininos e 31 masculinos em todos os testes estatísticos.

Pode ajudar a entender a diferença entre medidas e variáveis ​​nominais se você imaginar o registro de cada observação em um caderno de laboratório. Se você estiver medindo a largura da cabeça de isópodes, uma observação individual pode ser "3,41 mm". Essa é claramente uma variável de medição. Uma observação individual do sexo pode ser "feminina", o que claramente é uma variável nominal. Mesmo que você não registre o sexo de cada isópode individualmente, mas apenas conte o número de machos e fêmeas e anote esses dois números, a variável subjacente é uma série de observações de "macho" e "fêmea".

Variáveis ​​classificadas

Variáveis ​​classificadas, também chamadas de variáveis ​​ordinais, são aquelas cujas observações individuais podem ser ordenadas da menor para a maior, embora os valores exatos sejam desconhecidos. Se você sacudir um monte de A. vulgare para cima, eles rolam em bolas, então, depois de um tempo, começam a se desenrolar e andar. If you wanted to know whether males and females unrolled at the same time, but your stopwatch was broken, you could pick up the first isopod to unroll and put it in a vial marked "first," pick up the second to unroll and put it in a vial marked "second," and so on, then sex the isopods after they've all unrolled. You wouldn't have the exact time that each isopod stayed rolled up (that would be a measurement variable), but you would have the isopods in order from first to unroll to last to unroll, which is a ranked variable. While a nominal variable is recorded as a word (such as "male") and a measurement variable is recorded as a number (such as "4.53"), a ranked variable can be recorded as a rank (such as "seventh").

You could do a lifetime of biology and never use a true ranked variable. When I write an exam question involving ranked variables, it's usually some ridiculous scenario like "Imagine you're on a desert island with no ruler, and you want to do statistics on the size of coconuts. You line them up from smallest to largest. " For a homework assignment, I ask students to pick a paper from their favorite biological journal and identify all the variables, and anyone who finds a ranked variable gets a donut I've had to buy four donuts in 13 years. The only common biological ranked variables I can think of are dominance hierarchies in behavioral biology (see the dog example on the Kruskal-Wallis page) and developmental stages, such as the different instars that molting insects pass through.

The main reason that ranked variables are important is that the statistical tests designed for ranked variables (called "non-parametric tests") make fewer assumptions about the data than the statistical tests designed for measurement variables. Thus the most common use of ranked variables involves converting a measurement variable to ranks, then analyzing it using a non-parametric test. For example, let's say you recorded the time that each isopod stayed rolled up, and that most of them unrolled after one or two minutes. Two isopods, who happened to be male, stayed rolled up for 30 minutes. If you analyzed the data using a test designed for a measurement variable, those two sleepy isopods would cause the average time for males to be much greater than for females, and the difference might look statistically significant. When converted to ranks and analyzed using a non-parametric test, the last and next-to-last isopods would have much less influence on the overall result, and you would be less likely to get a misleadingly "significant" result if there really isn't a difference between males and females.

Some variables are impossible to measure objectively with instruments, so people are asked to give a subjective rating. For example, pain is often measured by asking a person to put a mark on a 10-cm scale, where 0 cm is "no pain" and 10 cm is "worst possible pain." This is não a ranked variable it is a measurement variable, even though the "measuring" is done by the person's brain. For the purpose of statistics, the important thing is that it is measured on an "interval scale" ideally, the difference between pain rated 2 and 3 is the same as the difference between pain rated 7 and 8. Pain would be a ranked variable if the pains at different times were compared with each other for example, if someone kept a pain diary and then at the end of the week said "Tuesday was the worst pain, Thursday was second worst, Wednesday was third, etc. " These rankings are not an interval scale the difference between Tuesday and Thursday may be much bigger, or much smaller, than the difference between Thursday and Wednesday.

Just like with measurement variables, if there are a very small number of possible values for a ranked variable, it would be better to treat it as a nominal variable. For example, if you make a honeybee sting people on one arm and a yellowjacket sting people on the other arm, then ask them "Was the honeybee sting the most painful or the second most painful?", you are asking them for the rank of each sting. But you should treat the data as a nominal variable, one which has three values ("honeybee is worse" or "yellowjacket is worse" or "subject is so mad at your stupid, painful experiment that they refuse to answer").

Categorizando

It is possible to convert a measurement variable to a nominal variable, dividing individuals up into a two or more classes based on ranges of the variable. For example, if you are studying the relationship between levels of HDL (the "good cholesterol") and blood pressure, you could measure the HDL level, then divide people into two groups, "low HDL" (less than 40 mg/dl) and "normal HDL" (40 or more mg/dl) and compare the mean blood pressures of the two groups, using a nice simple two-sample t&ndashtest.

Converting measurement variables to nominal variables ("dichotomizing" if you split into two groups, "categorizing" in general) is common in epidemiology, psychology, and some other fields. However, there are several problems with categorizing measurement variables (MacCallum et al. 2002). One problem is that you'd be discarding a lot of information in our blood pressure example, you'd be lumping together everyone with HDL from 0 to 39 mg/dl into one group. This reduces your statistical power, decreasing your chances of finding a relationship between the two variables if there really is one. Another problem is that it would be easy to consciously or subconsciously choose the dividing line ("cutpoint") between low and normal HDL that gave an "interesting" result. For example, if you did the experiment thinking that low HDL caused high blood pressure, and a couple of people with HDL between 40 and 45 happened to have high blood pressure, you might put the dividing line between low and normal at 45 mg/dl. This would be cheating, because it would increase the chance of getting a "significant" difference if there really isn't one.

To illustrate the problem with categorizing, let's say you wanted to know whether tall basketball players weigh more than short players. Here's data for the 2012-2013 men's basketball team at Morgan State University:

Altura
(inches)
Peso
(pounds)
69180
72185
74170
74190
74220
76200
77190
77225
78215
78225
80210
81208
81220
86270
Height and weight of the Morgan State University men's basketball players.

If you keep both variables as measurement variables and analyze using linear regression, you get a P value of 0.0007 the relationship is highly significant. Tall basketball players really are heavier, as is obvious from the graph. However, if you divide the heights into two categories, "short" (77 inches or less) and "tall" (more than 77 inches) and compare the mean weights of the two groups using a two-sample t&ndashtest, the P value is 0.043, which is barely significant at the usual P<0.05 level. And if you also divide the weights into two categories, "light" (210 pounds and less) and "heavy" (greater than 210 pounds), you get 6 who are short and light, 2 who are short and heavy, 2 who are tall and light, and 4 who are tall and heavy. The proportion of short people who are heavy is não significantly different from the proportion of tall people who are heavy, when analyzed using Fisher's exact test (P=0.28). So by categorizing both measurement variables, you have made an obvious, highly significant relationship between height and weight become completely non-significant. This is not a good thing. I think it's better for most biological experiments if you don't categorize.

Likert items

Social scientists like to use Likert items: they'll present a statement like "It's important for all biologists to learn statistics" and ask people to choose 1=Strongly Disagree, 2=Disagree, 3=Neither Agree nor Disagree, 4=Agree, or 5=Strongly Agree. Sometimes they use seven values instead of five, by adding "Very Strongly Disagree" and "Very Strongly Agree" and sometimes people are asked to rate their strength of agreement on a 9 or 11-point scale. Similar questions may have answers such as 1=Never, 2=Rarely, 3=Sometimes, 4=Often, 5=Always.

Strictly speaking, a Likert scale is the result of adding together the scores on several Likert items. Often, however, a single Likert item is called a Likert scale.

There is a lot of controversy about how to analyze a Likert item. One option is to treat it as a nominal variable with five (or seven, or however many) items. The data would then be summarized by the proportion of people giving each answer, and analyzed using chi-square or G&ndashtests. However, this ignores the fact that the values go in order from least agreement to most, which is pretty important information. The other options are to treat it as a ranked variable or a measurement variable.

Treating a Likert item as a measurement variable lets you summarize the data using a mean and standard deviation, and analyze the data using the familiar parametric tests such as anova and regression. One argument against treating a Likert item as a measurement variable is that the data have a small number of values that are unlikely to be normally distributed, but the statistical tests used on measurement variables are not very sensitive to deviations from normality, and simulations have shown that tests for measurement variables work well even with small numbers of values (Fagerland et al. 2011).

A bigger issue is that the answers on a Likert item are just crude subdivisions of some underlying measure of feeling, and the difference between "Strongly Disagree" and "Disagree" may not be the same size as the difference between "Disagree" and "Neither Agree nor Disagree" in other words, the responses are not a true "interval" variable. As an analogy, imagine you asked a bunch of college students how much TV they watch in a typical week, and you give them the choices of 0=None, 1=A Little, 2=A Moderate Amount, 3=A Lot, and 4=Too Much. If the people who said "A Little" watch one or two hours a week, the people who said "A Moderate Amount" watch three to nine hours a week, and the people who said "A Lot" watch 10 to 20 hours a week, then the difference between "None" and "A Little" is a lot smaller than the difference between "A Moderate Amount" and "A Lot." That would make your 0-4 point scale not be an interval variable. If your data actually were in hours, then the difference between 0 hours and 1 hour is the same size as the difference between 19 hours and 20 hours "hours" would be an interval variable.

Personally, I don't see how treating values of a Likert item as a measurement variable will cause any statistical problems. It is, in essence, a data transformation: applying a mathematical function to one variable to come up with a new variable. In chemistry, pH is the base-10 log of the reciprocal of the hydrogen activity, so the difference in hydrogen activity between a ph 5 and ph 6 solution is much bigger than the difference between ph 8 and ph 9. But I don't think anyone would object to treating pH as a measurement variable. Converting 25-44 on some underlying "agreeicity index" to "2" and converting 45-54 to "3" doesn't seem much different from converting hydrogen activity to pH, or micropascals of sound to decibels, or squaring a person's height to calculate body mass index.

The impression I get, from briefly glancing at the literature, is that many of the people who use Likert items in their research treat them as measurement variables, while most statisticians think this is outrageously incorrect. I think treating them as measurement variables has several advantages, but you should carefully consider the practice in your particular field it's always better if you're speaking the same statistical language as your peers. Because there is disagreement, you should include the number of people giving each response in your publications this will provide all the information that other researchers need to analyze your data using the technique they prefer.

All of the above applies to statistics done on a single Likert item. The usual practice is to add together a bunch of Likert items into a Likert scale a political scientist might add the scores on Likert questions about abortion, gun control, taxes, the environment, etc. and come up with a 100-point liberal vs. conservative scale. Once a number of Likert items are added together to make a Likert scale, there seems to be less objection to treating the sum as a measurement variable even some statisticians are okay with that.

Independent and dependent variables

Another way to classify variables is as independent or dependent variables. An independent variable (also known as a predictor, explanatory, or exposure variable) is a variable that you think may cause a change in a dependent variable (also known as an outcome or response variable). For example, if you grow isopods with 10 different mannose concentrations in their food and measure their growth rate, the mannose concentration is an independent variable and the growth rate is a dependent variable, because you think that different mannose concentrations may cause different growth rates. Any of the three variable types (measurement, nominal or ranked) can be either independent or dependent. For example, if you want to know whether sex affects body temperature in mice, sex would be an independent variable and temperature would be a dependent variable. If you wanted to know whether the incubation temperature of eggs affects sex in turtles, temperature would be the independent variable and sex would be the dependent variable.

As you'll see in the descriptions of particular statistical tests, sometimes it is important to decide which is the independent and which is the dependent variable it will determine whether you should analyze your data with a two-sample t&ndashtest or simple logistic regression, for example. Other times you don't need to decide whether a variable is independent or dependent. For example, if you measure the nitrogen content of soil and the density of dandelion plants, you might think that nitrogen content is an independent variable and dandelion density is a dependent variable you'd be thinking that nitrogen content might affect where dandelion plants live. But maybe dandelions use a lot of nitrogen from the soil, so it's dandelion density that should be the independent variable. Or maybe some third variable that you didn't measure, such as moisture content, affects both nitrogen content and dandelion density. For your initial experiment, which you would analyze using correlation, you wouldn't need to classify nitrogen content or dandelion density as independent or dependent. If you found an association between the two variables, you would probably want to follow up with experiments in which you manipulated nitrogen content (making it an independent variable) and observed dandelion density (making it a dependent variable), and other experiments in which you manipulated dandelion density (making it an independent variable) and observed the change in nitrogen content (making it the dependent variable).

Referências

MacCallum, R. C., S. B. Zhang, K. J. Preacher, and D. D. Rucker. 2002. On the practice of dichotomization of quantitative variables. Psychological Methods 7: 19-40.

Zar, J.H. 1999. Biostatistical analysis. 4th edition. Prentice Hall, Upper Saddle River, NJ.

&lArr Previous topic|Next topic &rArr Table of Contents

This page was last revised December 4, 2014. Its address is http://www.biostathandbook.com/variabletypes.html. It may be cited as:
McDonald, J.H. 2014. Handbook of Biological Statistics (3rd ed.). Sparky House Publishing, Baltimore, Maryland. This web page contains the content of pages 6-13 in the printed version.

©2014 by John H. McDonald. Você provavelmente pode fazer o que quiser com este conteúdo, consulte a página de permissões para obter detalhes.


Potential applications for flow cytometry

The potential applications of analysis by flow cytometry are numerous, including the detection and measurement of:

  • Protein expression—throughout the entire cell, even the nucleus
  • Protein post translational modifications—includes cleaved and phosphorylated proteins
  • RNA—including IncRNA, miRNA, and mRNA transcripts
  • Cell health status—from viability to late-stage apoptosis or programmed cell death
  • Cell cycle status—providing a powerful tool to assess cells in G0/G1 phase versus S phase, G2, or polyploidy, including analysis of cell proliferation and activation
  • Identification and characterization of distinct subsets of cells within a heterogeneous sample—including distinguishing central effector memory cells from exhausted T cells or even regulatory T cells

An additional capability of specialized flow cytometers is the ability to sort cells and recover the subsets for post experimental use. This specialized flow cytometer is called a fluorescence activated cell sorter (FACS), a term that is sometimes erroneously used interchangeably with ‘flow cytometer’. This usage is incorrect. A flow cytometer is an analytical machine that does not perform cell sorting. Cell sorters use fluidics and fluorescence components similar to those in flow cytometers, but are able to divert a specific population from within a heterogeneous sample into a separate tube, typically based on specified fluorescence characteristics. If collected under sterile conditions, these cells can be further cultured, manipulated, and studied.


What is the dependent variable of a relative fluorescence graph? - Biologia

When to Use . . .

. . . a Line graph.

Line graphs are used to track changes over short and long periods of time. When smaller changes exist, line graphs are better to use than bar graphs. Line graphs can also be used to compare changes over the same period of time for more than one group.

. . . a Pie Chart.

Pie charts are best to use when you are trying to compare parts of a whole. They do not show changes over time.

. . . a Bar Graph.

Bar graphs are used to compare things between different groups or to track changes over time. However, when trying to measure change over time, bar graphs are best when the changes are larger.

. . . an Area Graph.

Area graphs are very similar to line graphs. They can be used to track changes over time for one or more groups. Area graphs are good to use when you are tracking the changes in two or more related groups that make up one whole category (for example public and private groups).

. . . an X-Y Plot.

X-Y plots are used to determine relationships between the two different things. The x-axis is used to measure one event (or variable) and the y-axis is used to measure the other. If both variables increase at the same time, they have a positive relationship. If one variable decreases while the other increases, they have a negative relationship. Sometimes the variables don't follow any pattern and have no relationship.


Tables and graphs

What are tables and graphs?
Tables and graphs are visual representations. They are used to organise information to show patterns and relationships. A graph shows this information by representing it as a shape. Researchers and scientists often use tables and graphs to report findings from their research. In newspapers, magazine articles, and on television they are often used to support an argument or point of view.

Why do we want students to know about tables and graphs?
Tables and graphs can be useful tools for helping people make decisions. However, they only provide part of a story. Inferences often have to be made from the data shown. As well as being able to identify clearly what the graph or table is telling us, it is important to identify what parts of the story are missing. This can help the reader decide what other information they need, or whether the argument should be rejected because the supporting evidence is suspect. Students need to know how to critique the data and the way it is presented. A table or graph can misrepresent information by

  • leaving out important information. Student absences gives an example of a graph with missing features.
  • constructing it in such a way that it misrepresents relationships. This may be because of poor skills, or it may be done deliberately to bolster a particular argument, for example using 2-dimensional shapes to inflate apparent growth. See Newspaper stories for examples of misleading graphs.

It is easy, if students are not skilful at reading graphs and tables, to interpret them incorrectly. They can make wrong decisions because they are basing them on false inferences. When constructing graphs and tables, it is also possible to misrepresent the data. Research suggests that students often regard tables and graphs as an end in themselves. Few refer to them as a source of evidence, or as a way of exploring patterns and relationships in data or information.

The curriculum
Tables and graphs are relevant to almost all areas of the curriculum. The conventions of tables and graphs are consistent across all curricula. It is the context in which they are used that identifies them as science, social sciences, geography, etc. The table below gives examples of English, mathematics, and science ARB resources that include tables or graphs.

Examples from the Assessment Resource Banks

Mesas Graphs
inglês
Construct a graph to show trends in a character's emotions related to a particular event: Cuthbert’s Babies.
Matemática
Complete a table to show the amount of staff members' Christmas bonus, then use this to calculate how much money is left over: $200 bonus.
Matemática
Complete and use a table to graph the cost per hour of repairing a car: Car maintenance.
Ciência
Complete a table about properties of paper towels: The best mopper upper.
Ciência
Interpret a graph of a car's journey and add to the graph to represent a further description of the journey: A car journey.

Key competencies
Investigating tables and graphs potentially strengthens several key competencies.

  • Using language, symbols, and texts: Knowing about graphs and tables strengthens students' ability to access and critique others' ideas. It also helps them to effectively communicate their own. The statement that students' "confidently use ICT" (p. 12) reinforces the role assistive technology has for tables and graphs. This should include organising, analysing, and making sense of information as well as being able to "access and provide information and to communicate with others" (Ministry of Education, 2007, p. 12).
  • Participating and contributing: Interpreting and critiquing sometimes conflicting data is a necessary skill for making decisions. Tables and graphs are a useful tool for organising available data for decision making. They are also a useful way of providing evidence to convince others towards a particular argument.
  • Thinking: Analysing and synthesising data from various sources is an important part of developing arguments and decision making.

What are the problem areas for students?
The National Education Monitoring Project (NEMP) identified two relevant sets of skills

NEMP (2003) reported that many New Zealand students

  • did not give their graphs and tables an appropriate title
  • did not label the axes appropriately
  • had difficulty with working with more than one variable at a time, i.e. comparing, calculating, and working with multiple sources.

Trials of ARB resources have identified further areas of difficulty for students.

Língua
Some technical vocabulary can cause problems for some students.

Some students are only familiar with the everyday meaning of table. These students draw a kitchen table when asked to "draw a table". Go to Language barriers.

  • In mathematics and science the term range is often used to refer to a single number whereas in everyday situations we tend to use the word "range" to refer to the set of numbers between a lower and upper limit. For example in the question "What is the range of temperature fluctuations shown in this place?" the correct answer would be 14 °C if range is interpreted in a mathematical sense and 35°C to 49°C if range is interpreted in an every day context. Mathematics also refers to the y-axis of a graph as the range (the x-axis is called the domain).

Mesas
In our ARB trials we have found that most students can complete simple table-reading tasks. Students have had difficulty with:

  • constructing more complex tables, e.g. two-way tables
  • transforming data from texts
  • interpolating and extrapolating information
  • answering questions that involve calculations.
  • comparing (for example, identifying differences)
  • answering questions about the least (as opposed to the most)
  • considering a number of features to make a decision
  • using information in a table if they haven't also some contextual knowledge
  • using the information in the table to justify decisions.

However, many students also do not complete these sorts of tasks well in contexts other than tables. Organising the information into a table is a helpful strategy for assisting students to develop these skills.

Graphs
In our ARB trials we have found students may have difficulty with

  • selecting an appropriate graph to communicate their findings
  • providing a title for the graph
  • naming the axes
  • reading the scale of the axes, and relating them to the shape of or trends in the graph
  • deciding on the appropriate scale to use when constructing graphs
  • marking sub-units on the axes at regular intervals (although occasionally marking at irregular intervals may be acceptable)
  • including the units of measure (plus any multipliers) on each axis of a graph
  • answering questions that involve calculations
  • plotting information from an article/ written text
  • identifying trends, explaining or synthesising relationships between two graphs, or two or more variables
  • reading the overall shape or trend of a graph
  • interpreting time/distance graphs. They read or construct them as a picture of what happened, for example
    interpreting when the line goes up as going uphill
    going back to the starting point to reach "home".

At Year 4 most students can read the information on a simple graph. Pie graphs may be more difficult than bar or line graphs. At Year 8 many students can extrapolate information from a simple line graph. At Year 10 most students are reasonably successful at converting a straight-forward table to a graph.

When making decisions about students' interpretation of graphs, it is important to also consider their familiarity with the context.
Lack of knowledge about the context may affect their ability to interpret the graph.

Variables – what are they?
In graphs and tables the components that are being compared or measured are called variables. For example, if the question is: How does shadow length vary during a day? The length of the shadow is one variable, and the time of day is the other. It is often useful to describe variables as either dependent or independent. The dependent variables are what can be seen to be changing in relation to the particular levels of the independent variables. In the above example

  • the independent variable is the time of day
  • the length of the shadow is the dependent variable as it depends upon the time of day.

In many instances, however, there is no obvious connection of this type between the variables. In other situations we are interested in how the many variables interact with each other. There are 4 main types of variables:

  • categoric variable – described by a word label, not a number, e.g., different brands of paper towel
  • ordered variable – categoric variables that can be put in order, e.g., cool, warm, hot
  • discrete variable – described by whole numbers only, e.g., 1, 2, 3 teaspoons
  • continuous variable – described by any number or part number, e.g., 35.5°.

An investigation can have any combination of variables. This is defined by the question. Variables which are subject to some sort of random, statistical errors are known as random variables. Most variables in real investigations are of this type (and are usually just referred to as variables).

Constructing tables
Tables are

  • an organiser for an investigation
  • a way of presenting data in a report
  • an organiser to assist comprehension and thinking.

For investigations with no numerical data it is usually better to use a table to present the data. A table with numerous variables can be broken down into smaller tables that look at each variable separately. The interaction between the various variables can then be explored.

  • The independent variables (if they have been identified) go in the left hand columns, the dependent variables on the right.
  • Any column heading should have all the information needed to define the table's meaning. A categoric variable should include a description of the class. A discrete or continuous variable should identify units and any multipliers (e.g., hundreds of people, millions of dollars, kilometres).
  • A title summarises what the table is showing.
  • When investigating, the order of the entries is arbitrary. When reporting results, they should be sorted into an order.
  • Sometimes it is better to put data into bands, e.g., < 10 years, 10-15 years, 16-20 years… this makes it more manageable, and easier to see trends and patterns.
  • A table helps organise information so it is easier to see patterns and relationships.
  • If a variable is continuous the table reveals a lot more information. It may show the range, interval, and number of readings.
  • Tables with multiple variables can provide a lot of information. They can be read by selecting and controlling factors to search for patterns in the data.
  • It can be difficult to see numerical relationships and patterns. A graph may make these clearer.
  • When clumping information into bands, there is no indication of how many are in each category.

Constructing graphs
Purposes
Graphs are

  • a way of exploring the relationships in data
  • a way of displaying and reporting data, making it easier to report patterns and relationships, shapes of distributions, and trends.

Estrutura
Any graph used to report findings should show

  • the significant features and findings of the investigation in a fair and easily read way
  • the underlying structure of an investigation in terms of the relationships between and within the variables
  • the units of measurement
  • the number of readings (though sometimes these will be in the accompanying text)
  • the range and interval of readings, where appropriate.

It is good practice (but only a convention) to put the dependent variable on the horizontal (x) axis and the independent on the vertical (y) axis.

Bar graphs
Bar graphs should be used for categoric, ordered, and discrete variables. If the number of units in a discrete variable is large it may be displayed as a continuous variable.

Line graphs
Line graphs should be used for continuous variables.

Pie graphs
Pie graphs (sometimes called pie or circle charts) are used to show the parts that make up a whole. They can be useful for comparing the size of relative parts. Because it is difficult to compare different circle graphs, and often hard to compare the angles of different sectors of the pie, it is sometimes better to choose other sorts of graphs.

Histograms
Use histograms when y-axis gives the frequency of, or occurrences for continuous data that has been sorted into groups, for example, 20-24 metres. All bars are usually of equal width. They can be turned into line graphs by connecting the middle of the top section of each vertical bar. Histograms are not joined up bar graphs and should not be used for categoric data (unless the number of units in each group is large).

What a graph can tell you
On a graph you get an overall shape of a variable or the relationships between variables. A line graph represents a numerical or mathematical relationship and so has more information "buried" in it than other graphs. Line graphs can sometimes be used to make predictions for values that were not measured, by interpolating or extrapolating the trend, or by looking at the shape.

  • Graphs can tell you a lot about the design of an investigation, but they don't tell you everything. For example, they don't usually tell you which variables were controlled, the sample size, or the method of measurement. So there are lots of questions to ask to find out about validity and reliability, and also about the actual context of the investigation.
  • The scales on the axes can be stretched or shrunk to emphasise one side of a relationship or to make a point that may not be justified by the data.
  • A graph implies a relationship but not necessarily a cause. For example, a graph may show that houses cost less in March than they did in February, but it does not show why this happened. We may infer it is because the interest rates have gone up.

Interpreting tables and graphs
Gott and Duggan identified layers of complexity to reading, interpreting, and analysing data shown in tables and graphs. Esses incluem

  • reading off particular data from points on the table or graph (easy)
  • selecting sections of relevant data from complex data sets (more complex)
  • identifying and interpreting patterns within different types of data (most complex).

A study of 12 and 14 year olds found that individual students noticed the patterns of line graphs in different ways. Their responses were grouped into five categories.

How students interpreted line graphs:

Categoria Descrição Example of student response
No pattern - -
Numerical patterns Identified numerical patterns generated from one or both axes. These were irrelevant to the graphs' "messages". Some students were distracted from generalising about the relationships by obvious numerical patterns. The numbers if put in order go even, odd, odd, even and so on.
Graphical patterns Described the shape or direction of the line. These students did not relate this shape to what the axes represented. It goes down and then back up.
Unrelated trends in variable Described a general trend in the separate variables but did not relate these to one another, or described a trend in one variable but not the other. The length of the shadow decreased.
Generalised relationships between variables Were able to generalise a relationship between dependant and independent variables. Prior experience of the context appeared to be a factor in being able to make generalisations. The higher the ball was dropped from the higher it bounced back.

Key questions to ask
The questions below

  • assist students to critique their own and others' tables and graphs
  • provide useful teaching points for teachers as they plan for next learning

Teachers need to consider the age of their students and reword at an appropriate level.

  • Is the information presented appropriately for the design of the investigation?
  • What does the table or graph not tell us about the design of the investigation?
  • What does the information in the table or graph tell us? (Are there any patterns in the data?)
  • What does the data shown not tell us that might invalidate our interpretation?
  • Do the patterns suggest an association, a difference, or a change between the variables?
  • Can we use the pattern in the data to predict and generalise? (This includes being aware of the limitations of the presentation of the data.)
  • Are there alternative interpretations for the pattern of the data? Might other factors be causing the pattern? Have the limitations of the data been clearly identified?

Implications for teaching
Construção

  • Teach not only the agreed conventions, but also the reasons for these.
  • Students are more likely to include titles and name the axes if they understand their purpose.
  • Support students to think about the most appropriate type of table or graph to present their data.
  • Assist students to select an appropriate scale for their data.
  • Younger students may benefit from physically representing data with props, including themselves.
  • Interactive whiteboards, Excel spreadsheets, graphic calculators and other forms of ICT have been used successfully by some teachers for developing skills in constructing graphs. Some computer programmes can be used to generate graphs. Discussion is an important part of using these props and tools.
  • Develop the vocabulary to describe parts of tables and graphs.

Interpretação

  • Assist students to investigate the story the table or graph tells.
  • Give students practice in investigating the relationships presented in tables and graphs, and making inferences from them.
  • Teach students to break a graph into sections, read separately, and then reconstruct to tell the story.
  • Encourage students to decide what other information they need to know before they can make decisions based on the data represented.
  • Develop vocabulary that describes and compares.

Possible progressions in teaching about graphs
Progressions in constructing and interpreting graphs should be used with caution. Students' skill levels are likely to be influenced by


Agradecimentos

We thank M. Brandeis, C. Norbury, J. Pines, S. Taylor, G. Wahl, and T. Jeang for plasmids and T. Lorca for anti-Xenopus Cdc20 antibodies. R. Pepperkok, D. Zicha, C. Gray, and D. Aubyn gave wonderful support for live cell imaging, and members of the Hunt laboratory gave excellent discussions and help with the paper. We are grateful to Jonathan Pines and Nicole den Elzen for keeping in touch throughout the work.

This work was supported by an Erwin Schrödinger fellowship of the Austrian Science Promotion Fund to S. Geley, a Training and Mobility of Researchers grant FMRX-CT98-0179 to T. Hunt, and by Boehringer Ingelheim and grants from the Austrian Industrial Research Promotion Fund and the Austrian Science Promotion Fund to J.-M. Peters.


Assista o vídeo: Variáveis DEPENDENTES X Variáveis INDEPENDENTES (Novembro 2021).