DISTRBIUIÇÕES AMOSTRAIS 47
3.4.2 Distribuições amostrais de/ e p'
Consideremos agora a freqüênciaJcom que foi observada alguma característica na amostra.
Essa característica poderá ser uma das classificações de uma variável qualitativa, um ou
mais valores de uma variável quantitativa discreta, ou o fato de um valor de uma variável
quantitativa contínua cair em um dado intervalo. A freqüênciaJ é uma estatística, pois é
determinada em função dos elementos da amostra.
Evidentemente, podemos, para cada elemento da amostra, considerar a ocorrência de
um sucesso, caso a característica desejada se verifique, e de um fracasso, em caso contrário.
Seja p a probabilidade de ocorrência de sucesso para cada elemento da amostra. Se a
população é infinita ou a amostragem é feita com reposição, p é constante para todos os
elementos da amostra, e os resultados observados para todos eles serão independentes.
Nessas condições, o Cálculo de Probabilidades nos ensina que a distribuição amostral de
freqüênciaJ será uma distribuição binomial de parâmetros n e p, seguindo-se, pelas
propriedades da distribuição binomial, que
μ(J)=np,
a^2 (J) = np(l -p).
(3.6)
(3.7)
A freqüência relativap', por sua vez, sendo simplesmente o quociente deJpelo tamanho
da amostra n, terá média e variância que são facilmente obtidas pela aplicação das
propriedades (a) e (c), vistas em 3.4.1. Assim, temos
(3.8)
(3.9)
o tipo de distribuição de p' continua, para todos os efeitos, sendo uma distribuição
binomial, porém cujos possíveis valores foram comprimidos entre O e 1 com intervalos de
1/n, ao invés de variarem de O a n segundo os números naturais, o que ocorre na distribuição
binomial propriamente dita.
Sendo a amostra suficientemente grande, podemos aproximar as distribuições de/ e p'
por distribuições normais de mesma média e mesmo desvio-padrão. Em termos práticos, em
geral, podemos considerar que a amostra será suficientemente grande, para efeito dessa
aproximação, se np ~ 5 e n(l -p) ~ 5.
3.4.3 Graus de liberdade de uma estatística
Afirmamos em 2.3.3 que a variância de uma amostra deve ser calculada por
(3.10)
ou por expressões equivalentes. A razão pela qual se recomenda usar n -1 ao invés de n no
denominador da expressão será apresentada no Cap. 4. No entanto antecipamos que a
necessidade dessa correção está relacionada com o número de graus de liberdade dessa
estatística. A questão dos graus de liberdade é, possivelmente, abstrata, mas procuraremos
ilustrá-la melhor a seguir.