INDUÇÕES QUANTO AOS PARÂMETROS DA RETA 199
Vemo.s que r exprime a proporção da variação total de Y (dada por Syy) que é
"explicada" pela reta de mínimos quadrados. Ou, o que dá na mesma, gue a parcela
da variação total explicada pela reta de mínimos quadrados é rSyy.l^14 l Por meio de
complementação, a variação residual corresponde a ( 1 -r)Syy. Por essa razão, r
é chamado coeficiente de determinação ( e 1 -r, coeficiente de indeterminação),
pois seus valores são indicativos de quanto a reta de regressão fica bem determinada
em função da correlação entre os pontos experimentais, dizendo respeito, portanto,
à qualidade da regressão.
Assim, por exemplo, no caso ideal em que r = 1, não haveria variação residual, e
todos os pontos estariam alinhados. Por outro lado, parar=± 0,7, teremos um
coeficiente de determinação igual a 0,49, significando que a reta de regressão não
consegue explicar nem a metade da variação de Y. Por essa razão, para -O, 7 < r <
O, 7, não se deve, em geral, cogitar de se estabelecer a reta de mínimos quadrados.
Por outro lado, podemos considerar que, se lrl ~ 0,9, terá bastante utilidade o
traçado da reta de regressão, pois ela explicará mais de 80% da variação total de Y.
Os resultados (8.31) e (8.32) deixam claro quer :s; 1; logo, fica demonstrada a
afirmação feita em 8 .2, de que -1 :s; r :s; + 1.
Feitas as considerações de (a) a (d), voltemos agora aos problemas de estimação e
testes dos parâmetros da reta de regressão. Para tanto, devemos nos concentrar sobre as
distribuições amostrais das variáveis a e b. Na exposição a respeito, dada a seguir, omitiremos
intencionalmente certas demonstrações, as quais o leitor poderá encontrar no Ap. 5.
Adotadas a hipóteses vistas em 8.3, pode-se demonstrar que a distribuição amostral do
estimador b é tal que
(8.33)
onde a~ é a variância residual, suposta constante. Como em geral não conhecemos a~.
a^2 (b) será estimada por
s2
s^2 (b) = ...!1.... (8.34)
Sxx
Devido à admitida normalidade da variação residual de Y, resulta adicionalmente que a
distribuição amostral de b será também normal, pois b resulta de uma combinação linear
dos valoresy; [^15 1. Logo, podemos, de maneira análoga ao visto no item 5.3.2 para o teste
de uma média populacional quando o desvio-padrão da população é desconhecido, testar a
hipótese H 0 : f3 = {3 0 através da estatística
(8.35)
a qual, sob a validade de H 0 , terá distribuição t de Student com n -2 graus de liberdade
(compativelmente com sR) e, como tal, será testada uni ou bilateralmente, conforme o caso.
1141 Segundo a Referência 23, uma medida mais adequada para a proporção da variação total de Yexplicada
pela reta de mínimos quadrados é dada pelo coeficiente corrigido~ = 1 -(s2R" .si,). Essa observação é extensiva
ao R^2 definido em 8.7.1, sendo o valor corrigido R^2 = 1 -(~/.si,).
1151 Essa afirmação é fácil de compreender a partir da relação (8.18) e lembrando que os valores x; são
supostos não-aleatórios e os de Y; independentes entre si.