O objetivo deste trabalho é estudar as distribuições amostrais envolvidas na Análise de Variância (ANOVA), compreendendo tanto os fundamentos teóricos quanto a aplicação prática por meio de dados simulados. O foco é evidenciar como as distribuições amostrais (especialmente a distribuição F de Fisher-Snedecor) são utilizadas para testar hipóteses sobre médias populacionais, além de desenvolver habilidades em programação estatística com a linguagem R, simulando dados e interpretando os resultados obtidos.
A Análise de Variância (ANOVA) é uma ferramenta estatística amplamente utilizada na Engenharia e em diversas áreas científicas para comparar médias entre dois ou mais grupos. A base teórica da ANOVA depende de distribuições amostrais, especialmente da distribuição F, derivada da razão entre duas variâncias qui-quadrado independentes.
Neste relatório, inicialmente são apresentados os conceitos fundamentais de distribuições amostrais, com ênfase na distribuição F. Em seguida, descreve-se a estrutura da ANOVA, seus pressupostos e interpretação dos componentes da Tabela ANOVA.
Na etapa prática, foi utilizado o software R para simular conjuntos de dados sob diferentes cenários (com e sem diferenças significativas entre médias) e realizar análises ANOVA. O código desenvolvido permite gerar amostras com variâncias homogêneas e testar hipóteses com base na estatística F, avaliando o valor de p e a significância estatística. Os dados simulados possibilitaram observar como se comportam as distribuições amostrais sob diferentes condições.
Os principais passos realizados incluem:
Geração de amostras de diferentes populações normais;
Verificação dos pressupostos (normalidade e homocedasticidade);
Aplicação do teste ANOVA (função aov() e summary() no R);
Visualização dos dados (boxplots, histogramas e densidades);
Interpretação dos resultados em termos de significância estatística.
## grupo produtividade.Min. produtividade.1st Qu. produtividade.Median
## 1 Equipe_A 29.10015 33.51934 35.35996
## 2 Equipe_B 32.93992 36.04699 37.58017
## 3 Equipe_C 36.35374 39.74352 40.89287
## produtividade.Mean produtividade.3rd Qu. produtividade.Max.
## 1 35.42487 36.64618 40.36074
## 2 37.84623 40.16563 41.76144
## 3 41.31946 42.90035 47.50687
## Df Sum Sq Mean Sq F value Pr(>F)
## grupo 2 351.1 175.57 22.94 4.91e-08 ***
## Residuals 57 436.3 7.65
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Shapiro-Wilk normality test
##
## data: residuals(anova_resultado)
## W = 0.99284, p-value = 0.9791
## Warning: pacote 'car' foi compilado no R versão 4.4.3
## Carregando pacotes exigidos: carData
## Warning: pacote 'carData' foi compilado no R versão 4.4.3
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.0338 0.9668
## 57
O estudo das distribuições amostrais no contexto da ANOVA é essencial para compreender como decisões estatísticas são tomadas com base em dados experimentais. A distribuição F, principal elemento da ANOVA, permite testar se há evidência suficiente para rejeitar a hipótese de igualdade entre médias de diferentes grupos.
Por meio das simulações em R, foi possível visualizar na prática como a estatística F varia conforme os dados e como os pressupostos influenciam a validade dos resultados. A integração entre teoria e prática fortaleceu o entendimento dos conceitos estatísticos envolvidos e evidenciou a importância de uma análise criteriosa ao aplicar testes inferenciais em projetos de engenharia e pesquisa.