Sumário


1 Objetivo

O objetivo deste trabalho é estudar as distribuições amostrais envolvidas na Análise de Variância (ANOVA), compreendendo tanto os fundamentos teóricos quanto a aplicação prática por meio de dados simulados. O foco é evidenciar como as distribuições amostrais (especialmente a distribuição F de Fisher-Snedecor) são utilizadas para testar hipóteses sobre médias populacionais, além de desenvolver habilidades em programação estatística com a linguagem R, simulando dados e interpretando os resultados obtidos.

2 Apresentação do relatório

A Análise de Variância (ANOVA) é uma ferramenta estatística amplamente utilizada na Engenharia e em diversas áreas científicas para comparar médias entre dois ou mais grupos. A base teórica da ANOVA depende de distribuições amostrais, especialmente da distribuição F, derivada da razão entre duas variâncias qui-quadrado independentes.

Neste relatório, inicialmente são apresentados os conceitos fundamentais de distribuições amostrais, com ênfase na distribuição F. Em seguida, descreve-se a estrutura da ANOVA, seus pressupostos e interpretação dos componentes da Tabela ANOVA.

Na etapa prática, foi utilizado o software R para simular conjuntos de dados sob diferentes cenários (com e sem diferenças significativas entre médias) e realizar análises ANOVA. O código desenvolvido permite gerar amostras com variâncias homogêneas e testar hipóteses com base na estatística F, avaliando o valor de p e a significância estatística. Os dados simulados possibilitaram observar como se comportam as distribuições amostrais sob diferentes condições.

Os principais passos realizados incluem:

Geração de amostras de diferentes populações normais;

Verificação dos pressupostos (normalidade e homocedasticidade);

Aplicação do teste ANOVA (função aov() e summary() no R);

Visualização dos dados (boxplots, histogramas e densidades);

Interpretação dos resultados em termos de significância estatística.

##      grupo produtividade.Min. produtividade.1st Qu. produtividade.Median
## 1 Equipe_A           29.10015              33.51934             35.35996
## 2 Equipe_B           32.93992              36.04699             37.58017
## 3 Equipe_C           36.35374              39.74352             40.89287
##   produtividade.Mean produtividade.3rd Qu. produtividade.Max.
## 1           35.42487              36.64618           40.36074
## 2           37.84623              40.16563           41.76144
## 3           41.31946              42.90035           47.50687
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## grupo        2  351.1  175.57   22.94 4.91e-08 ***
## Residuals   57  436.3    7.65                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(anova_resultado)
## W = 0.99284, p-value = 0.9791
## Warning: pacote 'car' foi compilado no R versão 4.4.3
## Carregando pacotes exigidos: carData
## Warning: pacote 'carData' foi compilado no R versão 4.4.3
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.0338 0.9668
##       57

3 Conclusão

O estudo das distribuições amostrais no contexto da ANOVA é essencial para compreender como decisões estatísticas são tomadas com base em dados experimentais. A distribuição F, principal elemento da ANOVA, permite testar se há evidência suficiente para rejeitar a hipótese de igualdade entre médias de diferentes grupos.

Por meio das simulações em R, foi possível visualizar na prática como a estatística F varia conforme os dados e como os pressupostos influenciam a validade dos resultados. A integração entre teoria e prática fortaleceu o entendimento dos conceitos estatísticos envolvidos e evidenciou a importância de uma análise criteriosa ao aplicar testes inferenciais em projetos de engenharia e pesquisa.