196 CORRELAÇÃO E REGRESSÃO
8.5 Induções quanto aos parâmetros da reta
Os mesmos problemas de estimação e testes de hipóteses sobre parâmetros vistos nos Caps.
4 e 5 podem ser considerados no problema da regressão, com referência aos parâmetros a e
/3 da reta teórica. Evidentemente, as conclusões serão baseadas nos valores de a e b
experimentalmente obtidos, que serão estimador ou variável de teste, conforme o caso.
Assim, por exemplo, um caso de muito interesse é o teste das hipóteses
H 0 : /3=0,
H 1 : /3t:-O,
em que a hipótese H 0 é a de não haver regressão. Se H 0 for rejeitada, ficará estatisticamente
provada a existência de regressão, ao nível de significância adotado. Esse teste será estudado
a seguir em sua forma geral.
Não seria muito dificil imaginar que qualquer tentativa de abordar os problemas
mencionados devesse começar pelo estudo das distribuições amostrais de a e b. Isso será
feito, de fato.
Entretanto vamos iniciar a abordagem definindo a variância residual, ou variância
em tomo da reta de mínimos quadrados. Já mencionamos que a idéia do procedimento de
mínimos quadrados é a de minimizar a variação residual em torno da reta obtida. Ora, uma
medida dessa variação é dada pela variância residual, definida por
(8.26)
Vemos que a variância residual é definida semelhantemente à variância de uma amostra
no caso unidimensional, dada pela expressão (2.1 O). Deve-se notar que os Yi dados pela
equação obtida são as estimativas, em função dos Xi, dos valores médios teóricos de Y, da
mesma forma que x era a estimativa de μ no caso unidimensional. Como, para a obtenção
dos J'it necessitamos anteriormente estimar os dois parâmetros a e f3 da reta teórica, a
estatísticas~ terá n - 2 graus de liberdade. Daí se usar n - 2 no denominador de s~. a fim de
conseguir-se uma estimativa justa da variância residual populacional e1i
Neste momento, é oportuno lembrar que, de (8.13) e (8.19), resulta que
(8.27)
Isso permite chegar aos relacionamentos que citamos a seguir, e que são de grande
importância na análise do problema da regressão linear.
a) Se considerarmos a média geraly dos valoresyit e tomarmos as diferenças entre
os valores Yi e Y, teremos
Usando a notação introduzida em (8.5) e lembrando (8.18), teremos, pois,
(8.28)
Note-se que essa soma de quadrados é calculada com base nos desvios da reta de
mínimos quadrados em relação à horizontaly, conforme ilustrado na Fig. 8.13.