4.2 – Gráfico de resíduos x ajustes

Ao conduzir uma análise de resíduos, um “gráfico de resíduos x ajustes” é o gráfico criado com mais frequência. É um gráfico de dispersão de resíduos no eixo y e valores ajustados (respostas estimadas) no eixo x. O gráfico é usado para detectar não linearidade, variâncias de erro desiguais e outliers.

Vejamos um exemplo para ver como é um gráfico residual “bem comportado”. Alguns pesquisadores (Urbano- Marquez, et al., 1989) estavam interessados em determinar se o consumo de álcool estava ou não linearmente relacionado à força muscular. Os pesquisadores mediram o consumo total de álcool na vida (x) em uma amostra aleatória de n = 50 homens alcoólatras. Eles também mediram a força (y) do músculo deltóide no braço não dominante de cada pessoa. Um gráfico de linha ajustado dos dados resultantes, (alcoholarm.txt), se parece com:

O gráfico sugere que existe uma relação linear decrescente entre o álcool e a força do braço. Também sugere que não há pontos de dados incomuns no conjunto de dados. E ilustra que a variação em torno da linha de regressão estimada é constante, sugerindo que a suposição de variâncias de erro iguais é razoável.

Aqui está o que os resíduos correspondentes versus gráficos de ajustes se parecem para o conjunto de dados modelo de regressão linear simples com a força do braço como resposta e nível de consumo de álcool como preditor:

Observe que, conforme definido, os resíduos aparecem no eixo y e os valores ajustados aparecem no eixo x. Você deve ser capaz de olhar para trás no gráfico de dispersão dos dados e ver como os pontos de dados ali correspondem aos pontos de dados no gráfico residual versus ajuste aqui. Caso você esteja tendo problemas para fazer isso, observe os cinco pontos de dados no gráfico de dispersão original que aparecem em vermelho. Observe que a resposta prevista (valor ajustado) desses homens (cujo consumo de álcool é em torno de 40) é de cerca de 14 . Além disso, observe o padrão no qual os cinco pontos de dados se desviam da linha de regressão estimada.

Agora veja como e onde esses cinco pontos de dados aparecem no gráfico de resíduos versus ajustes. Seu valor ajustado é cerca de 14 e seu desvio da linha residual = 0 compartilha o mesmo padrão que seu desvio da linha de regressão estimada. Você vê a conexão? Qualquer ponto de dados que cai diretamente na linha de regressão estimada tem um resíduo de 0. Portanto, o resíduo = A linha 0 corresponde à linha de regressão estimada.

Este gráfico é um exemplo clássico de um gráfico de resíduos vs. ajustes bem comportado. Aqui estão as características de um gráfico de resíduos vs. ajustes bem comportado e o que eles sugira sobre a adequação do simpl e modelo de regressão linear:

  • Os resíduos “saltam aleatoriamente” em torno da linha 0. Isso sugere que a suposição de que a relação é linear é razoável.
  • Os resíduos formam aproximadamente uma “faixa horizontal” em torno da linha 0. Isso sugere que as variâncias dos termos de erro são iguais.
  • Nenhum resíduo “se destaca” do padrão aleatório básico de resíduos. Isso sugere que não há outliers.

Em geral, você deseja que seus gráficos residuais vs. ajustes sejam parecidos com o gráfico acima. Não se esqueça, porém, que interpretar esses gráficos é subjetivo. Minha experiência tem sido que os alunos que estão aprendendo a análise residual pela primeira vez tendem a interpretar excessivamente esses gráficos, olhando para cada curva e curva como algo potencialmente problemático. tenha cuidado para não colocar muito peso em gráficos residuais versus gráficos de ajustes baseados em pequenos conjuntos de dados. Às vezes, os conjuntos de dados são muito pequenos para fazer a interpretação de um gráfico de resíduos vs. ajustes valer a pena. Não se preocupe! Você aprenderá – com a prática – como “ler” esses gráficos.

Aqui estão os dados com valores ajustados e residuais:

E, aqui está um gráfico de dispersão desses resíduos vs. os valores ajustados:

Dado o tamanho pequeno, parece que os resíduos saltam aleatoriamente em torno do resíduo = Linha 0. A linha horizontal onde resid = 0 (linha tracejada vermelha) representa observações potenciais com resíduos iguais a zero, indicando que tais observações cairiam exatamente na linha de regressão ajustada.

subir

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *