Pedro Luiz de Oliveira Costa Neto - Estatística (2002, Editora Blucher) - libgen.lc

(Flamarion) #1

66 ESTIMAÇÃO DE PARÂMETROS


4.3.5 Estimação por ponto com base em diversas amostras

Suponhamos que dispomos de k amostras. Cada amostra irá fornecer uma estimativa para
um dado parâmetro, e essas estimativas irão diferir entre si, mesmo que as amostras sejam
provenientes de uma mesma população, pois resultam de um processo aleatório. Entretanto
podemos, em geral, combinar esses resultados, de modo a oferecer uma estimativa única
para o parâmetro em questão, quando aplicável.


No caso de estimação da médiaμ ou de uma proporção p, só terá sentido combinar as
estimativas se todas as amostras forem provenientes de uma mesma população, ou de
populações infinitas com mesma média e mesma proporção p. Podemos então, simplesmente,
fundir as diversas amostras em uma única amostra maior; usando a média x e a freqüência
relativa p' fornecidas por essa amostra. Isso equivale a calcular a média ponderada das
diversas médias e freqüências relativas amostrais tomando como pesos de ponderação os
tamanhos das respectivas amostras, o que se pode perceber com fácilidade.f^9 l


No caso de estimação da variância cr^2 e do desvio-padrão cr, podemos também imaginar
os dados originais reunidos em uma única amostra maior, desde que as amostras sejam
provenientes de uma mesma população ou de populações de mesma média e variância.
Entretanto o procedimento de se tomar a média (ponderada em relação aos tamanhos das
amostras) dos diversos resultados das amostras individuais não iria mais fornecer um
resultado final idêntico nem seria o mais adequado.


No caso de cr^2 , se desejamos realizar a estimação usando as variâncias das diversas
amostras, devemos realizar a ponderação usando como pesos os graus de liberdade de cada
amostra ( o que, afinal, também é feito nos casos deμ e p). Ou seja, adotamos como estimativa
de cr2 a quantidade s'fi, dada por

2 _ (n1 -l)sf + (n 2 - l)sJ + .. · + (nk -l)s; poJ
Sp - ~-~-~-~~-~~-----'--=-.
n 1 + n 2 + ... + nk -k

(4.18)

Deve-se notar que também essa estimativa não será idêntica à que se obteria através
da reunião dos dados em uma amostra única, embora ambos os processos sejam válidos
nas condições mencionadas.

A estimativa s'fi tem a vantagem de poder ser utilizada se as diversas amostras provierem
de populações com médias diferentes, porém com mesma variância cr^2 • Nesse caso, evi-
dentemente, não teria sentido reunir as diversas amostras em uma única amostra maior.

Se as amostras forem razoavelmente grandes, poderemos adotar --fsl como uma boa
estimativa para o desvio-padrão cr, nos casos discutidos. Por outro lado, se tivermos amostras
pequenas de mesmo tamanho, a estimativa justa de crserá simplesmente a média aritmética
dos desvios-padrão corrigidos, calculados pela expressão ( 4.16).

l^9 l Deixamos a demonstração dessa afirmativa a cargo dos leitores interessados.
l^10 J A razão para esse procedimento está em valer para sft a relação, expressa por (3.16) e (3.1 7), com a
família de distribuições x^2 • De fato, sft é um estimador justo de a^2 , o que resulta de μ(st) = a^2 e das
propriedades da média. Por outro lado, a expressão ( 4 .18) pode ser escrita

s}(n 1 +n 2 + .. •+nk-k) = L~ (n;-1)sf


cr2 1~1 cr2 •
onde, de acordo com (3.16), as parcelas do segundo membro têm distribuições x~,.... 1 e são independentes.
Portanto, devido à aditividade do x^2 , o primeiro membro tem distribuição x ~-k, onde n = "i,ni. Inversamente,
podemos escrever a relação
2 2 2
Sp = -!:Ji · Xn-k.
Free download pdf