Como comparar dois fatores calculados em matematica

Artigo escrito com a colaboração de Bruna Faria

A Análise de Variância ou ANOVA é um procedimento usado para comparar a distribuição de três ou mais grupos em amostras independentes.

A análise de variância é também uma forma de resumir um modelo de regressão linear através da decomposição da soma dos quadrados para cada fonte de variação no modelo e, utilizando o teste F, testar a hipótese de que qualquer fonte de variação no modelo é igual a zero.

Contextualizando uma aplicação da Anova

Suponha um curso preparatório para o ENEM que tenha em seu corpo docente três professores de matemática, que são responsáveis por diferentes turmas de alunos. A direção da escola suspeita que a variação do desempenho dos alunos nas provas de matemática do ENEM pode ser explicada pelo trabalho desenvolvido pelos seus professores.

Sendo assim, a direção resolveu verificar as notas na prova de matemática dos alunos de cada professor e calculou a média das notas de cada turma.

Como comparar dois fatores calculados em matematica

Mas será que essa informação é suficiente para afirmar que o desempenho dos alunos de cada turma é realmente diferente? E se um dos professores tiver em sua turma um aluno que não se preparou e errou quase todas as questões? Esse aluno não seria responsável por ter diminuído a média do grupo de alunos desse professor?

Para verificar então se realmente o desempenho dos alunos variou de acordo com o professor, é necessário a utilização de teste estatístico, que além de considerar a média das notas, leva também em conta a variação das notas dentro de cada turma.

A Análise de Variância

Um dos objetivos da aplicação da ANOVA é realizar o teste estatístico para verificar se há diferença entre distribuição de uma medida entre três ou mais grupos. Em nosso exemplo, podemos definir as hipóteses do teste como:

  • H0: Não existe diferença entre o desempenho das notas dos alunos de cada professor.
  • H1: Há pelo menos um professor com alunos com desempenho diferente.

Mas o que significa diferença entre as distribuições? Qual a relação entre as distribuições das notas dos alunos de cada professor e as hipóteses testadas pela análise de variância?

Caso os três grupos de alunos apresentem mesma variabilidade e a mesma média de desempenho, suas distribuições tendem a se sobrepor, confirmando a hipótese de que não existe diferença entre o desempenho das notas dos alunos de cada professor. Caso contrário, quando os grupos apresentam a mesma variabilidade interna e médias de desempenho diferentes, as distribuições se distanciam quanto mais as médias de desempenho se diferenciam.

Como comparar dois fatores calculados em matematica

O modelo ANOVA e seus pressupostos

Para aplicação da análise de variância, são necessárias algumas suposições, sendo elas:

  1. As observações são independentes, ou seja, cada elemento amostral (aluno) deve ser independente;
  2. Os grupos comparados apresentam a mesma variância;
  3. Os erros são independentes e provenientes de uma distribuição normal com média igual a zero e variância constante.

Cabe ressaltar que os grupos de alunos de cada professor podem ser vistos como três níveis de um mesmo fator, sendo que o objetivo é saber se o fator professor exerce alguma influência na variação do desempenho das notas de matemática.

Quais são os resultados gerados pela análise de variância?

As informações geradas na análise de variância estão resumidas na tabela abaixo. Nela são apresentados os graus de liberdade, a soma de quadrados, o quadrado médio, a estatística F e o valor-p.

Fonte de VariaçãoGraus de LiberdadeSoma de QuadradosQuadrado MédioEstatística FValor P
Tratamentos256.80628.4035,250,010
Resíduos33178.7835.418
Total35235.589

Os graus de liberdade são calculados com base no número de professores (grupos) e no número total de alunos.

A soma de quadrados mede a variação dos dados. A soma de quadrados total mede a variação total nos dados, a soma de quadrados dos tratamentos mede a variação entre os professores de cada turma e a soma dos quadrados dos resíduos mede a variação dentro de cada turma, ou seja, mede a variação dos alunos de cada professor.

O quadrado médio é a razão entre a soma de quadrados e os graus de liberdade e a estatística F, pode ser encontrada na tabela de distribuição F de Fisher- Snedecor.

Como interpretar os resultados da ANOVA?

Tomando como base a tabela anterior, pode-se concluir que existe pelo menos dois professores com alunos com desempenho significativamente diferentes ao avaliar o valor-p = 0,010 (menor que o nível de significância estabelecido de 0,05).

A conclusão da ANOVA pode ser feita também com base na Estatística F. A estatística F tem distribuição F de Fisher-Snedecor com k-1 e n-k graus de liberdade, onde k é o número de grupos (k = 3) e n é o número de observações (n = 36). Neste caso fictício, obteríamos F ≅ 3,32 e como a Estatística F (5,25) foi maior que o F tabelado (3,32), conclui-se que existe pelo menos dois professores com alunos com desempenho significativamente diferentes.

Mas como saber quais professores com alunos com desempenhos diferentes diferem entre si? A forma de averiguar isto é complementar a ANOVA, através da utilização do teste de comparação múltipla, como por exemplo, o teste de Tukey (veja aqui nosso artigo sobre o teste).

Se interessou por Análise de Variância e os resultados obtidos ao utilizar esta técnica?  Não deixe de se registrar em nosso Blog, para acompanhar nossas publicações e caso tenha alguma dúvida, entre em contato com nossos Data Talkers.

Você está em Estatística > Estatística básica para pesquisa de mercado ▼

A análise de variância é um teste estatístico amplamente difundido entre os analistas, e visa fundamentalmente verificar se existe uma diferença significativa entre as médias e se os fatores exercem influência em alguma variável dependente.

Os fatores propostos podem ser de origem qualitativa ou quantitativa, mas a variável dependente necessariamente deverá ser contínua.

Haja visto que trata-se de um teste bastante difundido e inúmeros bons softwares estatísticos e planilhas eletrônicas possuem o recurso disponível, não haverá aprofundamento desta técnica neste capítulo, sendo recomendada literatura especializada.

A principal aplicação da ANOVA (analysis of variance) é a comparação de médias oriundas de grupos diferentes, também chamados tratamentos, como por exemplo médias históricas de questões de satisfação, empresas que operam simultaneamente com diferentes rendimentos, entre muitas outras aplicações.

Existem dois métodos para calcular-se a variância: dentro de grupos (MQG) e a variância das médias (MQR).

Em uma Anova, calcula-se esses dois componentes de variância. Se a variância calculada usando a média (MQR) for maior do que a calculada (MQG) usando os dados pertencentes a cada grupo individual, isso pode indicar que existe uma diferença significativa entre os grupos.

Existem dois tipos de problemas a serem resolvidos através da Anova: a níveis fixos ou a níveis aleatórios. A aleatoriedade determinada a questão do problema.

Na grande maioria dos casos trata-se de níveis fixos, afinal o segundo tipo de problema (aleatório) somente surgirá quando ocorrer um estudo envolvendo uma escolha aleatória de fatores (em 10 lotes de produção, escolhe-se apenas 5, entre 15 máquinas de um total de 20, por exemplo).

Tabela de Análise de Variância ou tabela ANOVA

Fonte de Variação

SQ

GDL

MQ

Teste F

Entre Grupos

SQG

K – 1

MQG

MQG/MQR

Dentro dos Grupos

SQR

N-K

MQR

Total

SQT

N-1

- SQT = SQG + SQR (mede a variação geral de todas as observações).

- SQT é a soma dos quadrados totais, decomposta em:

- SQG soma dos quadrados dos grupos (tratamentos), associada exclusivamente a um efeito dos grupos

- SQR soma dos quadrados dos resíduos, devidos exclusivamente ao erro aleatório, medida dentro dos grupos.

- MQG = Média quadrada dos grupos

- MQR = Média quadrada dos resíduos (entre os grupos)

- SQG e MQG: medem a variação total entre as médias

- SQR e MQR: medem a variação das observações de cada grupo

f = MQG

MQR

N – 1=(K – 1) + (N – K)

SQT = SQG + SQR

MQG = SQG (K – 1)

A hipótese nula sempre será rejeitada quando f calculado for maior que o valor tabelado. Da mesma forma, se MQG for maior que MQR, rejeita-se a hipótese nula.

Quadro

Fonte de variação SQ (soma dos quadrados) GDL (g.l) MQ (quadrados médio) Teste F

Entre Grupos

Dentro dos grupos

Total

Se o teste f indicar diferenças significativas entre as médias, e os níveis forem fixos, haverá interesse em identificar quais as médias que diferem entre si.

Calcular o desvio padrão das médias;

Sx =

Como comparar dois fatores calculados em matematica
, ,onde nc é a soma do número de cada variável (grupo) dividido pelo número de variáveis.

Calcular o limite de decisão (ld)

3 x Sx

Ordenar as médias em ordem crescente ou decrescente e compara-las duas a duas. A diferença será significativa se for maior que Ld.

Se o teste f indicar diferenças significativas entre as médias, e os níveis forem aleatórios, haverá interesse em identificar a estimativa dos componentes de variação.

Como comparar dois fatores calculados em matematica

Como comparar dois fatores calculados em matematica

Como comparar dois fatores calculados em matematica

O valor encontrado acima indicará a variabilidade total entre grupos, indicando se é considerado significativa ou não.

Exemplo (níveis fixos):

Um pesquisador realizou um estudo para verificar qual posto de trabalho gerava mais satisfação para o funcionário. Para isso, durante um mês, 10 funcionários foram entrevistados.  Ao final de um mês os funcionários responderam um questionário gerando uma nota para o bem estar do funcionário.


Postos

Funcionários

1

2

3

1

7

5

8

2

8

6

9

3

7

7

8

4

8

6

9

5

9

5

8

6

7

6

8

7

8

7

9

8

6

5

10

9

7

6

8

10

6

6

9

Resumo

Grupo

Contagem

Soma

Média

Variância

1

10

73

7,3

0,9

2

10

59

5,9

0,544444

3

10

86

8,6

0,488889

ANOVA

Fonte da variação

SQ

gl

MQ

F

valor-P

F crítico

Entre grupos

36,46667

2

18,23

28,29

2,37E-07

3,35

Dentro dos grupos

17,4

27

0,64

Total

53,86667

29

Como f calculado é maior do que o f tabelado, rejeita-se a hipótese nula em prol da hipótese alternativa ao risco de 5%.

Há diferenças significativas entre os grupos. Observa-se que MQG é muito superior a MQR, indicando uma forte variância entre os grupos.

1. Calcular o desvio padrão das médias;

Como comparar dois fatores calculados em matematica

2. Calcular o limite de decisão (Ld)

3 x Sx

3. Ordenar as médias em ordem crescente ou decrescente e compara-las duas a duas.

5,9

7,3

8,6

x1 – x2 = - 1,4

x1 – x3 = - 2,7

x2 – x3 = - 1,3

As três diferenças são menores que o Ld, conclui-se portanto que as médias diferem entre si.

Como referenciar: "Análise de variância" em Só Matemática. Virtuous Tecnologia da Informação, 1998-2022. Consultado em 04/09/2022 às 20:18. Disponível na Internet em https://www.somatematica.com.br/estat/ap35.php