Vidéo: la régression linéaire multiple avec Excel 2024
La régression linéaire est une méthode statistique qui analyse et trouve des relations entre deux variables. En analyse prédictive, il peut être utilisé pour prédire une valeur numérique future d'une variable.
Considérons un exemple de données qui contient deux variables: les données passées comprenant les heures d'arrivée d'un train et le temps de retard correspondant. Supposons que vous vouliez prédire quel serait le retard pour le prochain train. Si vous appliquez une régression linéaire à ces deux variables - les temps d'arrivée et de retard - vous pouvez générer une équation linéaire telle que
Retard = a + (b * Heure d'arrivée) + d
Cette équation exprime la relation entre le temps de retard et l'heure d'arrivée. Les constantes a et b sont les paramètres du modèle. La variable d est le terme d'erreur (également connu sous le nom reste ) - une valeur numérique qui représente le décalage entre les deux variables retard > et heure d'arrivée . Si l'erreur n'est pas égale à zéro, cela peut indiquer qu'il existe des critères affectant la variable delay .
du modèle de régression linéaire, b, et d . La régression linéaire est (comme vous pouvez l'imaginer) la plus appropriée pour les données linéaires. Mais il est très sensible aux valeurs aberrantes dans les points de données. Les valeurs aberrantes dans vos données peuvent avoir un impact significatif sur le modèle. Il est recommandé de supprimer ces valeurs aberrantes de l'ensemble d'apprentissage si vous prévoyez d'utiliser la régression linéaire pour votre modèle prédictif.