Pedro Luiz de Oliveira Costa Neto - Estatística (2002, Editora Blucher) - libgen.lc

(Flamarion) #1

CORRELAÇÃO LINEAR 181


y y

+


+-~------------~X -4--------- ----------x
Figura 8. 6 Correlação linear positiva. Figura 8. 7 Correlação não-linear.

mesma reta com inclinação positiva ou negativa, em que teríamos a correlação linear perfeita.
Na prática, é claro, tal caso dificilmente ocorrerá.

A discussão precedente acerca da maior ou menor tendência de que os pontos do
diagrama se agrupem segundo uma reta esclarece a necessidade do termo linear que temos
tido o cuidado de usar. No presente estudo, estamos interessados em verificar exatamente o
quanto os pontos se aproximam de uma reta, daí estudarmos a correlação linear. Outros
tipos de correlação podem existir, mas não os veremos aqui. Assim, os pontos da Fig. 8. 7
apresentam nítida correlação, mas não linear.

Uma medida do grau e do sinal da correlação linear é dada pela covariância entre as
duas variáveis, definida por
L'-1 (x. -x) (y -y-)
Szy = COV (X,y) = l=I I 1
n-1

(3)
(8.1)

É fácil verificar que a covariância é um indicador do grau e do sinal da correlação. De
fato, por exemplo, no caso de correlação negativa ilustrado na Fig. 8.8, a maioria dos
pontos está nos quadrantes 1 e 3, quando (xi-.x) e (yi-Y) têm sinais opostos, resultando
parcelas negativas no somatório de (8.1).
Entretanto é, em geral, mais conveniente usar-se, para a medida da correlação, o
chamado coeficiente de correlação linear de Pearson, ou, simplesmente, coeficiente de
correlação, definido por

cov (x,y)
r-----


  • SxSy '


(8.2)

onde sx e sy são os desvios-padrão das variáveis X e Y na amostra. Como

S = i:~_1-^1 (xl. -x)^2


X n-1

e

[^3 l Temos aqui o mesmo problema, já citado anteriormente no Cap. 2, a respeito de se colocar n ou n - 1 no·
denominador. Como estamos pensando na covariância de uma amostra, usaremos n -1.
Free download pdf