21 6 CORRELAÇÃO E REGRESSÃO
8.8.2 Análise de melhoria
Foi discutido em 8.3 que o problema de regressão pode tornar-se mais complexo pelo fato
de não conhecermos de antemão o modelo adequado para a equação que iremos determinar.
Seria, então, o caso de investigarmos diversas equações e utilizar aquela que melhor se
ajustasse aos pontos experimentais. Em particular, poderíamos desejar encontrar a equação
de um polinômio que melhor representasse o fenômeno em estudo.
Essa idéia, entretanto, não pode ser levada a efeito em toda sua extensão, pois sempre
encontraríamos um polinômio de grau n - 1 que se ajustaria sem desvio a todos os n pontos
experimentais. Esse procedimento eminentemente matemático, entretanto, nada teria de
estatístico, e não se coadunaria com o escopo da Estatística Indutiva, como se pode facilmente
compreender.
Surge então a idéia de se buscarem equações mais elaboradas até o ponto em que a
melhon·a de qjuste conseguida em relação ao modelo anterior seja significativa. Assim, por
exemplo, se vamos procurar a equação de um polinômio que possa ser considerado satisfatório
para a representação de um dado fenômeno, acharemos primeiramente a equação da reta
de regressão. A seguir, verificaremos se a adoção de uma parábola ao invés da reta traz
uma melhoria de ajuste significativa. Se isso acontecer, verificaremos se a cúbica de regressão
apresenta melhoria de ajuste em relação à parábola, e assim sucessivamente. Em geral se
recomenda prosseguir tal análise até que duas etapas sucessivas não tenham produzido
melhoria significativaJ^29 l Evidentemente a idéia central é adotar o modelo mais simples,
desde que um mais complicado não produza uma representação significativamente melhor
do fenômeno.
Veremos, a seguir, como a Análise de Variância permite testar a melhoria no problema
da regressão polinomial. Para tanto, continuamos a admitir como hipótese básica que a
variação residual seja normal, constante e independente em torno da linha teórica de
regressão.
O princípio da Análise de Melhoria está em que a partição da variação total, Syy, dada
pela relação (8.31) no caso da reta, pode ser, de modo análogo, verificada para polinômios
de maior grau. Assim, a soma de quadrados devida à variação residual em torno da reta de
mínimos quadrados pode, por sua vez, ser desdobrada em uma parcela de melhoria de
ajuste explicada pela adoção da parábola e uma parcela devida à variação residual em torno
da parábola, ou seja,
(8.62)
ondejP; designa os valores calculados pela parábola e as somas de quadrados do segundo
membro têm, respectivamente, 1 e n -3 graus de liberdade, e a do primeiro membro, como
sabemos, n -2.
A Fig. 8.1 7 procura ilustrar as parcelas de variação às quais se referem as somas de
quadrados envolvidos.
[^291 Notar que o teste visto em 8.8.1 comprova a melhoria da retay =a+ bx em relação ay = j. Por outro
lado, a recomendação do texto deve-se ao fato de não ser incomum haver uma etapa sem melhoria significativa
e haver melhoria na etapa seguinte.