Este trabalho tem como objetivo estudar os procedimentos de comparações múltiplas, com foco no Teste SNK. Para isso, buscamos:
Investigar quem desenvolveu o teste;
Identificar as situações ideais para sua aplicação;
Demonstrar sua aplicação utilizando o software R;
Apresentar os procedimentos analíticos e cálculos à mão.
O presente relatório tem como finalidade apresentar um estudo detalhado sobre o teste de comparações múltiplas conhecido como SNK (Student-Newman-Keuls). A pesquisa contempla aspectos históricos, fundamentos teóricos, aplicação prática em dados simulados no R (voltados à Engenharia Civil) e, por fim, o detalhamento dos cálculos manuais que embasam o teste.
O Teste SNK é uma evolução do teste t de Student, criado por William Sealy Gosset, que publicava sob o pseudônimo “Student”. Em 1939, Milton Newman introduziu um procedimento passo-a-passo para comparar médias de forma ordenada. Posteriormente, em 1952, Maurice Keuls refinou esse método, levando à formulação do teste que hoje conhecemos como Student-Newman-Keuls (SNK).
Esse teste foi desenvolvido com o objetivo de detectar diferenças significativas entre médias de tratamentos sem aumentar consideravelmente a probabilidade de erro do tipo I, como ocorre com múltiplas aplicações do teste t. Assim, o SNK equilibra sensibilidade e controle de erro.
O Teste SNK é indicado para ser utilizado após uma ANOVA significativa, ou seja, quando o teste F indica que ao menos uma média difere das demais. Ele é apropriado para:
Comparar médias de tratamentos em experimentos com 3 ou mais níveis;
Delineamentos simples como DIC (Delineamento Inteiramente Casualizado) ou DBC (Delineamento em Blocos Casualizados);
Situações em que se deseja maior sensibilidade em comparações ordenadas.
## Warning: pacote 'agricolae' foi compilado no R versão 4.4.3
## Df Sum Sq Mean Sq F value Pr(>F)
## tratamento 3 125.82 41.94 23.29 4.43e-06 ***
## Residuals 16 28.81 1.80
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## $statistics
## MSerror Df Mean CV
## 1.800765 16 31.4218 4.270683
##
## $parameters
## test name.t ntr alpha
## SNK tratamento 4 0.05
##
## $snk
## Table CriticalRange
## 2 2.997999 1.799181
## 3 3.649139 2.189948
## 4 4.046093 2.428171
##
## $means
## resistencia std r se Min Max Q25 Q50
## Aditivo1 28.29036 1.2165328 5 0.6001274 27.15929 30.33806 27.65473 28.10576
## Aditivo2 31.94682 1.3961875 5 0.6001274 30.48193 34.05808 31.17578 31.46521
## Aditivo3 30.30790 0.6394632 5 0.6001274 29.44416 31.22408 30.11068 30.35981
## Aditivo4 35.14214 1.8343537 5 0.6001274 32.44340 37.32299 34.38537 35.64721
## Q75
## Aditivo1 28.19393
## Aditivo2 32.55310
## Aditivo3 30.40077
## Aditivo4 35.91176
##
## $comparison
## NULL
##
## $groups
## resistencia groups
## Aditivo4 35.14214 a
## Aditivo2 31.94682 b
## Aditivo3 30.30790 b
## Aditivo1 28.29036 c
##
## attr(,"class")
## [1] "group"
Esse código aplica o teste SNK no R utilizando o pacote “agricolae”, agrupando os tratamentos por letras conforme suas diferenças estatísticas.
Vamos supor as seguintes médias ordenadas:
Tratamento
Média (MPa)
A - 28.0
B - 30.0
C - 32.0
D - 35.0
Suponha que temos 5 repetições por tratamento e o QMResíduo (Erro médio quadrático) obtido pela ANOVA foi 1.44.
Fórmula do erro padrão:
## SE = √(QMresíduo / n)
Substituindo os valores:
## SE = √(1.44 / 5) = √0.288 = 0.5366
Código em R:
## [1] 0.5366563
Agora, calculamos os valores críticos q de Tukey para diferentes distâncias (usando k = 4 tratamentos, gl = 16, alfa = 0.05):
## [1] 2.997999 3.649139 4.046093
Cálculo do DMS para cada distância (r):
## r=2 r=3 r=4
## 1.608895 1.958333 2.171361
Verificação das diferenças entre médias:
Diferenças:
Comparamos cada diferença com seu respectivo DMS. Se for maior, é significativa.
## Comparação Diferença DMS Resultado
## 1 D-A (r=4) 7 2.171 Significativa
## 2 D-B (r=3) 5 1.958 Significativa
## 3 D-C (r=2) 3 1.609 Significativa
## 4 C-A (r=3) 4 1.958 Significativa
## 5 B-A (r=2) 2 1.609 Significativa
O Teste SNK é uma alternativa interessante para comparações múltiplas após a ANOVA, oferecendo um bom balanço entre controle do erro do tipo I e poder de detecção de diferenças reais. É especialmente útil em experimentos com tratamentos ordenados, como nesse exemplo com diferentes aditivos de concreto.