DISTRBIUIÇÕES AMOSTRAIS 45
Vemos, portanto, que a média em torno da qual devem variar os possíveis valores da
estatística x é a própria média μ da população. Um resultado que não deixa de ser intuitivo.
Esse resultado é extensivo ao caso de amostragem sem reposição de populações finitas,
pois a aplicação da propriedade (b) não exige a independência das variáveis xi e todas
essas variáveis tem a mesma distribuição de probabilidade quando aprioristicamente
consideradas em relação ao processo de amostragem.
Quanto à variância, o Cálculo de Probabilidades nos ensina que:
c) multiplicando os valores de uma variável aleatória por uma constante, a variância
fica multiplicada pelo quadrado dessa constante;
d) a variância de uma soma de variáveis aleatórias independentes é igual à soma das
variâncias.
Logo, lembrando (3.1) e usando as propriedades, temos
Vemos, portanto, que a variância com que se dispersam os possíveis valores da estatística
x é n vezes menor que a variância da população de onde é retirada a amostra. Isso se deve
à própria essência do processo aleatório, que faz com que haja, dentro da amostra, uma
natural compensação entre valores mais elevados e valores mais baixos, produzindo valores
de x que tendem a ser tanto mais próximos da média μ da população quanto maior o
tamanho da amostra n. Resulta imediatamente que
- a
a(X)=ax = ,Jn (3.4)
No caso de amostragem sem reposição de populações finitas, em que a independência
entre os valores xi não se verifica, demonstra-se que
2 - a^2 N-n
a (X)= n. N -1 '
onde N é o número de elementos da população e o fator
N-n
N-1
(3.5)
é chamadoJator de população.finita. Note-se que esse fator tende à unidade quando o
tamanho da população tende ao infinito. Além disso, sendo esse fator menor que 1, tem-se
que a^2 (.f) será menor para populações finitas que para populações supostas infinitamente
grandes.
Quanto à forma da distribuição amostral de x, seremos também auxiliados por dois
importantes resultados do Cálculo de Probabilidades. Esses resultados são dados pelo "teorema
das combinações lineares (de variáveis normais independentes)" e pelo "teorema do limite
central", ambos enunciados no Ap. 1 (item Al.4.3).
Assim, se a distribuição da população for normal, a distribuição amostral de x será
também normal para qualquer tamanho de amostra, devido ao primeiro teorema, pois x