TABELAS DE CONTINGÊNCIA-TESTE DE INDEPENDÊNCIA 139
Uma indagação que pode ser objeto de um teste simples é se as variáveis qualitativas
envolvidas são ou não independentes. Ou seja, podemos desejar testar as hipóteses:
H 0 : as variáveis são independentes;
H 1 : as variáveis não são independentes, ou seja, elas apresentam algum grau de associa-
ção entre si.
Tal teste pode ser feito pelo x,2, de maneira semelhante ao visto em 6.2.1, ou seja, pela
quantidade
2 r s (Ou -Eu )^2 r s oj
Xv -Li=I I. J=l E-- -Li=l I. J=l & -n,
y y
sendo:
rl a estatística de teste, com v graus de liberdade;
r o número de linhas do corpo da tabela;
s o número de colunas do corpo da tabela;
Ou a freqüência observada na interseção da linha i com a coluna};
Eu a freqüência esperada na interseção da linha i-com a coluna};
n = I.f= 1 I.J 1 Ou= o número de elementos da amostra.
As freqüências esperadas de cada cela da tabela são calculadas por
(6.6)
(6.7)
onde Pu é a probabilidade de ocorrer uma observação na cela considerada. Ora, havendo
independência entre as variáveis ( conforme H 0 ), temos que
Pg =Pi.· P.J, [^5 l (6.8)
onde Pi. é a probabilidade marginal correspondente à linha i e p J a probabilidade marginal
correspondente à coluna}.
Como não conhecemos as probabilidades marginais, deveremos estimá-las, através
das correspondentes freqüências relativas pf. e PJ· Ora,
~! 1 = J;. e p'. = J1
· n •J n '
:.E·· -nfJ:p • =n~'p'· -nJ;· .JJ _ J;JJ.
(^0 1) · · (^1 1) · •J n n n
(6.9)
Isso nos fornece a regra prática para o cálculo das freqüências esperadas: multiplicar o
total da linha pelo total da coluna e dividir pela freqüência total n, conforme será visto no
exemplo a seguir. A restrição vista em 6.2.1, segundo a qual Eu ~ 5, também deve ser
respeitada aqui. [^61
Quanto ao número de graus de liberdade com que a variável de teste ri, deverá ser
testada, sua determinação pode ser feita verificando-se quantas das freqüências observadas
Ou permanecem "livres" após a determinação das freqüências esperadas. Ora, estas foram
determinadas com base na fixação dos totais marginais. Então, respeitados esses totais, o
número de valores Ou com grau de liberdade será
v = (r-l)(s-1), (6.10)
[^5 l Essa expressão resulta da aplicação direta da definição de variáveis independentes, dada no Ap. 1.
[^61 A esse respeito, ver também a Ref. 20.