Vidéo: Comment Matéo est devenu LIBRE et HEUREUX en partant de RIEN avec son ami SOPRANO (8/365) 2025
La régression linéaire est un excellent outil pour faire des prédictions avec Excel. Lorsque vous connaissez la pente et l'interception de la ligne qui relie deux variables, vous pouvez prendre une nouvelle valeur x- et prédire une nouvelle valeur y-. Dans l'exemple que vous avez étudié, vous obtenez un score SAT et vous prédisez un GPA pour un étudiant de Sahutsket University.
Et si vous connaissiez plus que le score SAT de chaque élève? Que se passerait-il si vous aviez la moyenne de l'école secondaire de l'élève (sur une échelle de 100) et que vous pourriez également utiliser cette information? Si vous pouviez combiner le score SAT avec la moyenne HS, vous pourriez avoir un prédicteur plus précis que le score SAT seul.
Lorsque vous travaillez avec plusieurs variables indépendantes, vous êtes dans le domaine de la régression multiple. Comme dans la régression linéaire, vous trouverez des coefficients de régression pour la droite la mieux ajustée à l'aide d'un diagramme de dispersion. Encore une fois, le mieux ajusté signifie que la somme des distances au carré entre les points de données et la ligne est un minimum.
Cependant, avec deux variables indépendantes, vous ne pouvez pas afficher un diagramme de dispersion en deux dimensions. Vous avez besoin de trois dimensions, et cela devient difficile à dessiner.
Pour l'exemple SAT-GPA, l'équation de régression se traduit par
GPA prédite = a + b 1 (SAT) + b 2 (Moyenne des études secondaires)
Vous pouvez tester des hypothèses sur l'ajustement global et sur les trois coefficients de régression.
Vérifions les capacités d'Excel pour trouver des coefficients.
Quelques points à garder à l'esprit:
- Vous pouvez avoir un nombre quelconque de variables x-.
- Attendez-vous à ce que le coefficient de SAT passe de la régression linéaire à la régression multiple. Attendez-vous à ce que l'interception change également.
- Attendez-vous à ce que l'erreur-type de l'estimation passe de la régression linéaire à la régression multiple. Comme la régression multiple utilise plus d'informations que la régression linéaire, elle réduit l'erreur.
