190 CORRELAÇÃO E REGRESSÃO
considerar que a variação residual de Y seja normalmente distribuída com média zero e
desvio-padrão constante. Uma tentativa de representar graficamente essa situação é feita
na Fig. 8.10. Frise-se que a linha ali representada é a linha teórica de regressão, da qual
obteremos uma estimativa a partir dos pontos experimentais.
As três hipóteses acima feitas, ou seja, variável(eis) independente(s) isenta(s) de erro,
variação residual normalmente distribuída e variância residual constante correpondem ao
que poderíamos chamar de modelo usual de regressão. Salvo menção contrária, este é o
modelo implicitamente admitido nos seftwares estatísticos que fazem regressão. 191
Figura 8.10
Variação residual
em torno da linha
teórica de
regressão.
y
8.4 Regressão linear simples
Suponhamos ser a linha teórica de regressão uma reta e que queiramos estabelecer a regressão
de Y em função de X. Logo, o modelo é da forma
y=a+f3x+f/l, (8.12)
onde y = a + {3x é a equação da reta teórica de regressão, cujos parâmetros a e /3 serão
estimados através dos pontos experimentais fornecidos pela amostra, obtendo-se uma reta
estimativa na forma
y=a+bx, (8.13)
onde a é a estimativa do parâmetro a e b, também chamado coeficiente de regressão linear,
é a estimativa do parâmetro /3. O símbolo j é utilizado para uma conveniente distinção dos
valores dados pela reta estimativa, das ordenadas dos pontos experimentalmente obtidos.
Existem diversos métodos para a obtenção da reta desejada. O mais simples de todos,
que podemos chamar de método do qjuste visual, consiste simplesmente em traçar
diretamente a reta, com auxílio de uma régua, no diagrama de dispersão, procurando fazer,
da melhor forma possível, com que essa reta passe por entre os pontos. Esse procedimento,
entretanto, somente será razoável se a correlação linear for muito forte, caso contrário
!^91 Não são raros os casos em que a hipótese de homocedasticidade com X claramente não se verifica. Seria
necessário, então, a utilização de algum processo de homogeneização da variância, para se poder aplicar o
modelo usual de regressão.