Pedro Luiz de Oliveira Costa Neto - Estatística (2002, Editora Blucher) - libgen.lc

(Flamarion) #1

132 TESTES NÃO-PARAMÉTRICOS


6.2.1 Testes de aderência pelo x^2


Essa forma de testar a aderência foi desenvolvida por Karl Pearson e baseia-se na estatística


2 _ ""k (O; -Ed _ ""k o; l^21
Xv -"'i=t E -"'i=t -E -n (6.1)
i i '

sendo:

rl a estatística de teste, com v graus de liberdade;
Oi a freqüência observada de uma determinada classe ou valor da variável;
Ei a freqüência esperada, segundo o modelo testado, dessa classe ou valor da
variável;
n = I.1=1 Oi= I.1= 1 Ei = número de elementos da amostra;
k = número de classes ou valores considerados.

Pearson mostrou que, se o modelo testado for verdadeiro e se todasEi~ 5, a quantidade
definida em (6.1) terá aproximadamente distribuição x; com v = k - 1 - m, sendo k o
número de parcelas somadas e m o número de parâmetros do modelo estimados indepen-
dentemente a partir da amostra. A subtração de 1 ao valor de k deve-se a existência da
restrição I.1= 1 oi= n entre as freqüências observadas. O cálculo das freqüências esperadas é
feito através da expressão

(6.2)

onde Pi é a probabilidade, segundo o modelo, de se obter um valor da variável na classe
considerada, e n é o número de elementos da amostra. Essa expressão resulta do fato de
que cada freqüência observada oi terá, para população infinita, distribuição binomial com
parâmetros n e Pit sendo, portanto, sua expectância calculada conforme expusemos.

O fato de a quantidade definida em ( 6.1) se distribuir aproximadamente segundo um
x2 não deve surpreender, pois

(6.3)

e, havendo várias classes, Je; = ✓ nPi = ✓ nPi(1-Pi) , pois os Pi deverão ser pequenos. Ora,
sendo Ei ~ 5, a distribuição binomial das oi aproxima-se da normal, e o valor entre parênteses
no segundo membro de (6.3) seria aproximadamente um valor dez. Como a distribuição x2

surge de uma soma de valores de z ao quadrado, resulta que o somatório deveria mesmo


fornecer uma variável com distribuição próxima do x2.

O teste é unilateral, devendo a hipótese H 0 ser rejeitada se zt > zt a· Isso é razoável,
pois, se o modelo testado estiver longe da realidade, as freqüências observadas irão diferir
bastante das esperadas, e a variável de teste tenderá a crescer.

l^2 l Como essa expressão implica uma aproximação de distribuições binomiais por normais, a correção de
continuidade (ver Al .4.5, no Ap. 1), já mencionada anteriormente no texto, poderá ser aplicada, para maior
rigor, na execução do teste. Para tanto, calcular-se-ia o rl através de
2 _ Lk (IO;-E;l-0,5)^2
Xv - i=l E, •
Free download pdf