Pedro Luiz de Oliveira Costa Neto - Estatística (2002, Editora Blucher) - libgen.lc

(Flamarion) #1

REGRESSÃO LINEAR MÚLTIPLA 211


Seja, por exemplo, o caso de haver três variáveis envolvidas, as quais denotaremos por
X 1 , X 2 e X 3 • Podemos, é claro, utilizar a expressão (8.3) para calcular os coeficientes de
correlação linear de Pearson para os pares de variáveis. Designemos esses coeficientes de
correlação por r 12 , r13, e r2 3 ,


Ora, r 12 mede a correlação total existente entre X 1 e X 2 , englobados os efeitos que X 3
possa ter causado sobre o comportamento dessas variáveis. Semelhante consideração é
válida para r1 3 e r23,

Entretanto muitas vezes é importante considerar a correlação entre duas das variáveis,
descontado o efeito de uma terceira. Isso equivale a calcular a correlação, por exemplo,
entre X 1 e X 2 , mantida X 3 constante. (É importante notar a diferença fundamental entre
manter X 3 constante e ignorar X 3 .)

O coeficiente de correlação entre X 1 e X 2 , após descontado o efeito de X 3 , será por nós
denominado de coeficiente de co"elação parcial entre X 1 e X 2 com respeito a X 3 , e será
denotado por r 12. 3 • Seu cálculo pode ser feito mediante
(25)
(8.56)

Um exemplo ilustrativo da necessidade de se investigarem as correlações parciais pode
ser o seguinte. Suponhamos que uma empresa subdivida seus compradores potenciais em
diversos setores de vendas. Para cada setor, foram verificadas as seguintes variáveis:

X 1 = número de consumidores potenciais segundo uma pesquisa realizada no período 1;
X 2 = gastos em propaganda no período 2;
X 3 = vendas realizadas no período 3.

As correlações duas a duas entre essas variáveis podem perfeitamente indicar r 12 < o,

r 13 > o e r 23 <O.Este último valor poderia ser erroneamente interpretado como indicativo


de que as vendas tendem a diminuir com o aumento da propaganda. Entretanto vemos, por
r 12 , que, onde o número de consumidores previsto era menor, foram feitos maiores gastos
em propaganda, mas r 13 mostra que isso não foi suficiente para eliminar ou inverter a
tendência que os diversos setores apresentavam de consumir mais ou menos. Simplesmente,
a tendência a diferentes consumos evidenciada pela pesquisa era mais forte que a tendência
à homogeneização do consumo tentada mediante a diversificação dos gastos em propa-
ganda. Esse fato não se traduz no valor r 23 , o qual, portanto, incorpora as diferenças originais
representadas pelos valores de X 1 •

Calculando os coeficientes de correlação parcial poderíamos obter r 12. 3 < O, r 13. 2 > O e
r 23. 1 > O. Este último valor mostraria, então, que, para idênticas condições iniciais quanto
ao número de consumidores potenciais, as vendas tendem a crescer com os gastos em
propaganda.

A idéia da correlação parcial pode ser estendida ao caso de mais de três variáveis.
Assim, por exemplo, r 13. 25 representaria a correlação entre as variáveis X 1 e X 3 mantidas
X 2 e X 5 constantes, etc.


[^251 Uma outra interpretação existe também para a quantidade rh_ 3 Supondo que XI seja a variável dependente
em um estudo de regressão, e que se estabelecessem as regressões lineares de X 1 em função de X 3 e de X 1
em função de X 2 e X 3 , a quantidade T1 2. 3 representa a melhoria relativa de representação da equação

múltipla em relação à simples (ver, a propósito, o item 8.8.2). Mais especificamente, rh. 3 representa a


quantidade (resíduo sobre a reta-resíduo sobre o plano)/resíduo sobre a reta. Para maiores esclarecimentos,
ver a Ref. 23. Por outro lado, uma interessante análise geométrica da questão é apresentada na Ref. 21.
Free download pdf