4.2 – Tracé des résidus par rapport aux ajustements

Lors de la réalisation dune analyse des résidus, un «diagramme des résidus par rapport aux ajustements» est le diagramme le plus fréquemment créé. Il sagit dun nuage de points des résidus sur laxe y et des valeurs ajustées (réponses estimées) sur laxe des x. Le tracé est utilisé pour détecter la non-linéarité, les variances derreur inégales et les valeurs aberrantes.

Examinons un exemple pour voir à quoi ressemble un tracé résiduel «bien comporté». Certains chercheurs (Urbano- Marquez, et al., 1989) souhaitaient déterminer si la consommation dalcool était liée ou non linéairement à la force musculaire. Les chercheurs ont mesuré la consommation totale dalcool (x) à vie sur un échantillon aléatoire de n = 50 hommes alcooliques. Ils ont également mesuré la force (y) du muscle deltoïde dans le bras non dominant de chaque personne. Un graphique linéaire ajusté des données résultantes, (alcoholarm.txt), ressemble à:

Le graphique suggère quil existe une relation linéaire décroissante entre lalcool et la force du bras. Cela suggère également quil ny a pas de points de données inhabituels dans lensemble de données. Et cela montre que la variation autour de la droite de régression estimée est constante, ce qui suggère que lhypothèse de variances derreur égales est raisonnable.

Voici à quoi ressemble le tracé des résidus correspondants en fonction de lajustement pour lensemble de données. modèle de régression linéaire simple avec la force du bras comme réponse et le niveau de consommation dalcool comme prédicteur:

Notez que, comme défini, les résidus apparaissent sur laxe des y et les valeurs ajustées apparaissent sur laxe des x. Vous devriez être en mesure de revenir sur le nuage de points des données et de voir comment les points de données correspondent aux points de données dans le diagramme des valeurs résiduelles en fonction des ajustements ici. Au cas où vous auriez du mal à faire cela, regardez les cinq points de données du nuage de points dorigine qui apparaissent en rouge. Notez que la réponse prévue (valeur ajustée) de ces hommes (dont la consommation dalcool est denviron 40) est denviron 14 . Notez également le modèle dans lequel les cinq points de données sécartent de la droite de régression estimée.

Maintenant, regardez comment et où ces cinq points de données apparaissent dans le diagramme des résidus par rapport aux ajustements. Leur valeur ajustée est denviron 14 et leur écart par rapport à la droite résiduelle = 0 partage le même schéma que leur écart par rapport à la droite de régression estimée. Voyez-vous la connexion? Tout point de données qui tombe directement sur la droite de régression estimée a un résidu de 0. Par conséquent, le résidu = La ligne 0 correspond à la droite de régression estimée.

Ce graphique est un exemple classique dun diagramme des résidus par rapport aux ajustements bien comporté. Voici les caractéristiques dun diagramme des résidus par rapport aux ajustements bien comportés et ce quils suggérer la pertinence de la simpl e modèle de régression linéaire:

  • Les résidus « rebondissent au hasard » autour de la ligne 0. Cela suggère que lhypothèse selon laquelle la relation est linéaire est raisonnable.
  • Les résidus forment à peu près une « bande horizontale » autour de la ligne 0. Cela suggère que les variances des termes derreur sont égales.
  • Aucun résidu ne «se démarque» du modèle aléatoire de base des résidus. Cela suggère quil ny a pas de valeurs aberrantes.

En général, vous voulez que vos tracés résiduels / ajustés ressemblent à ceux ci-dessus. Noubliez pas cependant que linterprétation de ces graphiques est subjective. Mon expérience a été que les étudiants qui apprennent lanalyse résiduelle pour la première fois ont tendance à sur-interpréter ces graphiques, en considérant chaque détour comme quelque chose de potentiellement gênant. Vous aurez particulièrement envie de attention à ne pas accorder trop de poids aux tracés résiduels par rapport aux tracés ajustés basés sur de petits ensembles de données. Parfois, les ensembles de données sont tout simplement trop petits pour que linterprétation dun tracé des résidus par rapport aux ajustements en vaille la peine. Ne vous inquiétez pas! Vous apprendrez – avec de la pratique – comment « lire » ces graphiques.

Voici les données avec valeurs ajustées et résidus:

Et voici un nuage de points de ces résidus par rapport aux valeurs ajustées:

Compte tenu de la petite taille, il apparaît que les résidus rebondissent aléatoirement autour du résidu = Ligne 0. La ligne horizontale où resid = 0 (ligne pointillée rouge) représente les observations potentielles avec des résidus égaux à zéro, indiquant que ces observations tomberaient exactement sur la droite de régression ajustée.

haut

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *