TABELAS DE CONTINGÊNCIA - TESTE DE INDEPENDÊNCIA 137
Assim, o teste de aderência a uma distribuição normal pode ser feito mediante o uso do
"papel de probabilidade normal", que é um papel quadriculado em que uma das escalas está
subdividida conforme os percentis de uma distribuição normal. Se plotarmos na escala li-
near os valores da variável e na "escala normal" os valores da freqüência relativa acumulada,
os pontos assim determinados no corpo do papel deverão se orientar aproximadamente
segundo uma reta, se a hipótese de normalidade da distribuição for verdadeira.
Como ilustração, tomemos os dez valores abaixo, já ordenados, que retiramos ao acaso
de uma população reconhecidamente normal:
213
228
215
232
221
238
222
240
226
252
A plotagem desses valores no papel de probabilidade normal é apresentada na Fig. 6.1.
A regra para se plotarem n valores ordenados é a de se estabelecer a correspondência entre
o i-º valor e o percentil 50(2i - 1)/n. Assim, no nosso exemplo, os dez valores orde-
nados correspondem aos percentis 5%, 15%, ... , 95%, distribuídos simetricamente em proba-
bilidade.
6.3 Tabelas de contingência - teste de independência
Quando existem duas ou mais variáveis qualitativas de interesse, a representação tabular
das freqüências observadas pode ser feita através de uma tabela de contingência. No caso
de duas variáveis apenas, essa representação torna-se muito cômoda, mediante uma simples
tabela de duas entradas.
Seja, por exemplo, uma amostra de cem pessoas, que foram entrevistadas quanto a
suas opiniões sobre determinado projeto de lei, tendo sido obtidos os resultados dados na
Tab. 6.4.
1 J, ,tt ' '~"'
'Iabela 6.4 Opinião de homens e mulheres sobre determinado projeto de lei
l'iC
,, ''
Sexo
Opinião
Totais
Favorável Desfavorável Indiferente
Homens 33 12 15 60
Mulheres 7 20 13 40
Totais 40 32 28 100
Temos uma tabela de contingência de dimensão 2 x 3, pois a variável "sexo" apresenta
duas classificações possíveis, e a variável "opinião", três classificações. As freqüências
registradas na parte interna indicam que 33 homens foram favoráveis, 12 foram desfa-
voráveis, etc., no total geral de 100 pessoas entrevistadas. A linha e a coluna de totais dão
as distribuições de freqüências marginais, isto é, as distribuições de cada variável qualitativa
considerada individualmente, não importando a outra variável.
Com a tabela de contingência, conseguimos uma maneira conveniente de fazer a
descrição dos dados da amostra quando temos duas ou mais variáveis qualitativas a
considerar. Passemos agora à análise dos dados fornecidos pela tabela.