48 AMOSTRAGEM - DISTRIBUIÇÕES AMOSTRAIS
Tomemos, por exemplo, as estatísticas x = I.1= 1 xiln e I.7= 1 (xi -μ)^2 /n. (^7 J Essas estatís-
ticas têm n graus de liberdade e tal fato pode ser entendido como indicando haver n valores
xi livres que devem ser considerados para podermos calcular o valor da estatística. Em
outras palavras, se desconhecermos quaisquer dos valores Xi da amostra, não poderemos
determinar o valor da estatística, pois todos os valores da amostra são livres, podendo
variar aleatoriamente.
Já a estatística s^2 (x), conforme definida na expressão (3.10), por usar x ao invés do
parâmetro populacional μ, tem um grau de liberdade a menos. Isso porque o cálculo dessa
estatística pressupõe que anteriormente já se tenha calculado x, para o que usamos já uma
vez todos os valores da amostra, os quais estariam sendo usados pela segunda vez para o
cálculo de s^2 • (SJ Ora, no momento de usarmos novamente os valores da amostra para o
cálculo de s^2 , esses valores têm apenas n - 1 graus de liberdade, pois, dados quaisquer
n - 1 deles, o valor restante estará perfeitamente determinado, pelo fato de já conhecermos
sua média aritmética x, não sendo, portanto, livre.
Outra interpretação poderá ser dada geometricamente, se considerarmos os n valores
de uma amostra como correspondendo a um ponto num espaço n-dimensional. O valor de
uma estatística qualquer definida em função dos valores dessa amostra pode ser considerado
função do pont9 correspondente nesse espaço. Se, para o cálculo dessa estatística, vamos
verificar pela primeira vez os valores da amostra, teremos n graus de liberdade, ou seja, o
ponto correspondente tem a possibilidade de se deslocar conforme as n direções do espaço.
Se, porém, como no caso de s2, já conhecemos x, isso implica uma restrição linear entre os
n valores, pois
X1 +X2+ .. ·+Xn =nx.
Ora, essa é a expressão de um hiperplano no espaço n-dimensional, significando que o
ponto considerado deve estar sobre esse hiperplano, tendo, pois, um grau de liberdade a
menos. A introdução de outras restrições levaria à perda de mais graus de liberdade. Por
outro lado, torna-se claro que os valores da amostra podem ser usados para o cálculo de
estatísticas independentes no máximo n vezes, após o que não haveria mais graus de
liberdade e, portanto, qualquer consulta à amostra seria desnecessária. Adotaremos o símbolo
v para denotar o número de graus de liberdade de uma estatística.
3.4.4 Distribuição amostral de s2 - distribuições ,r^191
Já sabemos que a variância de uma amostra deve ser calculada por (3.10),
"'°n ( -)2
5 2(x) = ""'i=l xi -x ,
n-1
ou por outras expressões equivalentes.
A distribuição amostral da estatística s^2 (x), conforme definida em (3.1 O), está
relacionada com uma família de distribuições de probabilidades de grande importância em
diversos problemas de Estatística Indutiva, que são as distribuições tipo r. Devemos,
[7J Essa estatística será comentada no capítulo seguinte.
[SI Na expressão citada no texto, a necessidade de conhecermos x está evidente, porém as demais expressões
para o cálculo de s2, como (2.12) e a (2.13) também contêm.x, embora implicitamente, conforme frisamos
anteriormente.
[^91 Pronuncia-se "qui quadrado".