CORRELAÇÃO LINEAR 181
y y
+
+-~------------~X -4--------- ----------x
Figura 8. 6 Correlação linear positiva. Figura 8. 7 Correlação não-linear.
mesma reta com inclinação positiva ou negativa, em que teríamos a correlação linear perfeita.
Na prática, é claro, tal caso dificilmente ocorrerá.
A discussão precedente acerca da maior ou menor tendência de que os pontos do
diagrama se agrupem segundo uma reta esclarece a necessidade do termo linear que temos
tido o cuidado de usar. No presente estudo, estamos interessados em verificar exatamente o
quanto os pontos se aproximam de uma reta, daí estudarmos a correlação linear. Outros
tipos de correlação podem existir, mas não os veremos aqui. Assim, os pontos da Fig. 8. 7
apresentam nítida correlação, mas não linear.
Uma medida do grau e do sinal da correlação linear é dada pela covariância entre as
duas variáveis, definida por
L'-1 (x. -x) (y -y-)
Szy = COV (X,y) = l=I I 1
n-1
(3)
(8.1)
É fácil verificar que a covariância é um indicador do grau e do sinal da correlação. De
fato, por exemplo, no caso de correlação negativa ilustrado na Fig. 8.8, a maioria dos
pontos está nos quadrantes 1 e 3, quando (xi-.x) e (yi-Y) têm sinais opostos, resultando
parcelas negativas no somatório de (8.1).
Entretanto é, em geral, mais conveniente usar-se, para a medida da correlação, o
chamado coeficiente de correlação linear de Pearson, ou, simplesmente, coeficiente de
correlação, definido por
cov (x,y)
r-----
(8.2)
onde sx e sy são os desvios-padrão das variáveis X e Y na amostra. Como
S = i:~_1-^1 (xl. -x)^2
X n-1
e
[^3 l Temos aqui o mesmo problema, já citado anteriormente no Cap. 2, a respeito de se colocar n ou n - 1 no·
denominador. Como estamos pensando na covariância de uma amostra, usaremos n -1.