4.2-잔차 vs. 적합도 도표

잔차 분석을 수행 할 때 “잔차 대 적합도 도표”는 가장 자주 생성되는 도표입니다. y 축의 잔차와 x 축의 적합치 (추정 응답)의 산점도입니다. 이 플롯은 비선형 성, 불균등 오류 분산 및 특이 치를 감지하는 데 사용됩니다.

예를 들어 “잘 작동하는”잔차 플롯이 어떻게 생겼는지 살펴 보겠습니다. 일부 연구원 (Urbano- Marquez, et al., 1989)는 알코올 섭취가 근력과 선형 적으로 관련이 있는지 여부를 결정하는 데 관심이있었습니다. 연구자들은 n = 50 명의 알코올 중독자 표본에서 알코올의 총 평생 소비량 (x)을 측정했습니다. 각 개인의 비 우성 팔에있는 삼각근의 강도 (y). 결과 데이터 (alcoholarm.txt)의 적합 선 그림은 다음과 같습니다.

이 플롯은 알코올과 팔의 힘 사이에 감소하는 선형 관계가 있음을 시사합니다. 또한 데이터 세트에 비정상적인 데이터 포인트가 없음을 나타냅니다. 그리고 추정 된 회귀선 주변의 변동이 일정하다는 것을 보여줍니다. 이는 동일한 오차 분산의 가정이 합리적임을 시사합니다.

다음은 데이터 세트에 대한 해당 잔차 대 적합치 그림의 모습입니다. 반응으로 팔 강도를, 예측 자로 알코올 소비 수준을 사용하는 간단한 선형 회귀 모델 :

정의 된대로 잔차는 y 축에 표시되고 적합치는 x 축에 표시됩니다. 데이터의 산점도를 되돌아보고 여기에있는 잔차 대 적합도 플롯의 데이터 포인트에 해당하는 데이터 포인트를 확인할 수 있어야합니다. 그렇게하는 데 문제가있는 경우 원래 산점도에서 빨간색으로 표시되는 5 개의 데이터 포인트를 살펴보십시오. 이러한 남성 (알코올 소비량이 약 40 인)의 예측 응답 (적합 값)은 약 14입니다. . 또한 5 개의 데이터 포인트가 추정 회귀선에서 벗어나는 패턴을 확인합니다.

이제이 5 개의 데이터 포인트가 잔차 대 적합치 그림에서 어떻게 그리고 어디에 나타나는지 살펴보십시오. 적합치는 약 14입니다. 잔차 = 0 선과의 편차는 추정 회귀선과의 편차와 동일한 패턴을 공유합니다. 연결이 보이십니까? 추정 회귀 선에 직접 떨어지는 모든 데이터 포인트는 잔차가 0입니다. 따라서 잔차 = 0 선은 추정 된 회귀선에 해당합니다.

이 그림은 잘 작동하는 잔차 대 적합치 그림의 전형적인 예입니다. 다음은 잘 작동하는 잔차 대 적합치 그림의 특성과 그 특징입니다. 간체의 적절성에 대해 제안 e 선형 회귀 모델 :

  • 잔차가 0 선 주위에서 “무작위로 튀어 오릅니다”. 이것은 관계가 선형이라는 가정이 합리적이라는 것을 의미합니다.
  • 잔차는 대략 0 선 주위에 “수평 밴드”를 형성합니다. 이는 오차항의 분산이 동일하다는 것을 의미합니다.
  • 잔차의 기본 랜덤 패턴에서 “눈에 띄는”잔차는 하나도 없습니다. 이는 특이 치가 없다는 것을 의미합니다.

일반적으로 잔차 대 적합치 그림이 위 그림과 비슷하게 보이기를 원합니다. 이러한 플롯을 해석하는 것은 주관적이라는 것을 잊지 마십시오. 처음으로 잔차 분석을 배우는 학생들은 이러한 플롯을 과도하게 해석하는 경향이 있으며 모든 비틀림과 회전을 잠재적으로 문제가 될 수있는 것으로 간주하는 경향이 있습니다. 특히 다음을 원할 것입니다. 작은 데이터 세트를 기반으로 한 잔차 vs. 적합도 플롯에 너무 많은 가중치를 두지 않도록주의하십시오. 때로는 데이터 세트가 너무 작아서 잔차 대 적합도 도표를 가치있게 해석 할 수 없습니다. 걱정하지 마세요. 연습을 통해 이러한 플롯을 “읽는”방법을 배우게됩니다.

다음은 적합치와 잔차가있는 데이터입니다.

다음은 이러한 잔차와 적합치의 산점도입니다.

작은 크기를 감안할 때 잔차가 잔차 주변에서 무작위로 튀는 것처럼 보입니다. 0 라인. resid = 0 (빨간색 파선) 인 수평선은 잔차가 0 인 잠재적 관측치를 나타내며, 이러한 관측치는 적합 회귀선에 정확히 속함을 나타냅니다.

위로

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다