182 CORRELAÇÃO E REGRESSÃO
y
Figura 8 .8 Correlação negativa. x X;
resulta que
Sxy
(8.3)
A representação abreviada dos somatórios da expressão (8.3) mediante a notação Sxy,
Sxx e Syy é bastante útil, e será por nós adotada. Não é difícil mostrar que
n _ _. - - L X; · LY; ( 8 4 )
Sxy = I.;=1 (x; -x)(y; -y) = I.(x; -x)y; = I.(Y; -y)x; = r. X;Y; ---------..
n
Sxx =1;=1(X; -X) = 1X; ---,
n
1
n - 2 2 (1 X; )^2
n - 2 2 (1 y;)^2
SY.Y =1;=1(Y;-Y) = 1Y; ---n-.
[4] (8.5)
Combinando as expressões anteriores, podemos também chegar facilmente à fórmula
seguinte, para o cálculo direto do coeficiente de correlação linear de Pearson:
(8.6)
O coeficiente de correlação linear de Pearson tem as importantes propriedades de ser
adimensional e de variar entre -1 e + 1, o que não ocorria com a covariância. A vantagem
de ser adimensional está no fato de seu valor não ser afetado pelas unidades adotadas.
Resulta também, como conseqüência, que codificações lineares introduzidas nas variáveis
não afetam o valor der. Por outro lado, o fato de termos - 1 ~ r ~ + 1 ( que será posteriormente
demonstrado), faz com que um dado valor de r seja facilmente interpretado. Como r = - 1
corresponde ao caso de correlação linear negativa perfeita e r = + 1 corresponde ao de
correlação linear positiva perfeita, o significado de valores intermediários é rapidamente
percebido. Esse assunto será aprofundado no item seguinte.
141 Essas últimas expressões já são nossas conhecidas do Cap. 2. A utilização, aqui e na expressão (8.4), das
formas desdobradas, em geral, simplifica o cálculo.