132 TESTES NÃO-PARAMÉTRICOS
6.2.1 Testes de aderência pelo x^2
Essa forma de testar a aderência foi desenvolvida por Karl Pearson e baseia-se na estatística
2 _ ""k (O; -Ed _ ""k o; l^21
Xv -"'i=t E -"'i=t -E -n (6.1)
i i '
sendo:
rl a estatística de teste, com v graus de liberdade;
Oi a freqüência observada de uma determinada classe ou valor da variável;
Ei a freqüência esperada, segundo o modelo testado, dessa classe ou valor da
variável;
n = I.1=1 Oi= I.1= 1 Ei = número de elementos da amostra;
k = número de classes ou valores considerados.
Pearson mostrou que, se o modelo testado for verdadeiro e se todasEi~ 5, a quantidade
definida em (6.1) terá aproximadamente distribuição x; com v = k - 1 - m, sendo k o
número de parcelas somadas e m o número de parâmetros do modelo estimados indepen-
dentemente a partir da amostra. A subtração de 1 ao valor de k deve-se a existência da
restrição I.1= 1 oi= n entre as freqüências observadas. O cálculo das freqüências esperadas é
feito através da expressão
(6.2)
onde Pi é a probabilidade, segundo o modelo, de se obter um valor da variável na classe
considerada, e n é o número de elementos da amostra. Essa expressão resulta do fato de
que cada freqüência observada oi terá, para população infinita, distribuição binomial com
parâmetros n e Pit sendo, portanto, sua expectância calculada conforme expusemos.
O fato de a quantidade definida em ( 6.1) se distribuir aproximadamente segundo um
x2 não deve surpreender, pois
(6.3)
e, havendo várias classes, Je; = ✓ nPi = ✓ nPi(1-Pi) , pois os Pi deverão ser pequenos. Ora,
sendo Ei ~ 5, a distribuição binomial das oi aproxima-se da normal, e o valor entre parênteses
no segundo membro de (6.3) seria aproximadamente um valor dez. Como a distribuição x2
surge de uma soma de valores de z ao quadrado, resulta que o somatório deveria mesmo
fornecer uma variável com distribuição próxima do x2.
O teste é unilateral, devendo a hipótese H 0 ser rejeitada se zt > zt a· Isso é razoável,
pois, se o modelo testado estiver longe da realidade, as freqüências observadas irão diferir
bastante das esperadas, e a variável de teste tenderá a crescer.
l^2 l Como essa expressão implica uma aproximação de distribuições binomiais por normais, a correção de
continuidade (ver Al .4.5, no Ap. 1), já mencionada anteriormente no texto, poderá ser aplicada, para maior
rigor, na execução do teste. Para tanto, calcular-se-ia o rl através de
2 _ Lk (IO;-E;l-0,5)^2
Xv - i=l E, •