Comment modéliser les relations de données linéaires avec R - les variables

Une analyse de variance pour vos données peut également être écrite comme un modèle linéaire dans R, où vous utilisez un facteur comme variable prédictive pour modéliser une variable réponse.

Bien sûr, les variables prédictives peuvent aussi être des variables continues. Par exemple, le poids d'une voiture a évidemment une influence sur le kilométrage. Mais ce serait bien d'avoir une idée de l'ampleur de cette influence. Essentiellement, vous voulez trouver l'équation qui représente la ligne de tendance. Vous trouverez les données dont vous avez besoin pour vérifier cela dans le jeu de données mtcars.

Comment construire un modèle linéaire

La fonction lm () vous permet de spécifier n'importe quoi, du modèle linéaire le plus simple aux modèles d'interaction complexes.

Pour modéliser le kilométrage en fonction du poids d'une voiture, vous utilisez la fonction lm (), comme ceci: >> Modèle <- lm (mpg ~ wt, data = mtcars)

Vous fournissez deux arguments:

Une formule qui décrit le modèle:

Ici, vous modélisez la variable mpg en fonction de la variable wt. Une trame de données qui contient les variables dans la formule:
Ici, vous utilisez le cadre de données mtcars. Vous pouvez spécifier de nombreux modèles complexes avec l'interface de la formule lorsque vous connaissez votre chemin.

L'objet résultant est une liste avec une structure très complexe, mais dans la plupart des cas, vous n'avez pas à vous en préoccuper. L'objet modèle contient beaucoup d'informations nécessaires au calcul des diagnostics et des nouvelles prédictions.

Comment extraire des informations du modèle

Plutôt que de plonger dans l'objet modèle et de trouver l'information quelque part dans l'objet liste, vous pouvez utiliser certaines fonctions qui vous aident à obtenir les informations nécessaires à partir du modèle. Par exemple, vous pouvez extraire un vecteur nommé avec les coefficients du modèle en utilisant la fonction coef (), comme ceci:

coef. Modèle coef. Modèle (Intercept) wt 37. 285126 -5. 344472

Ces coefficients représentent l'ordonnée à l'origine et la pente de la ligne de tendance. Vous pouvez l'utiliser pour tracer la ligne de tendance sur un nuage de points des données. Vous le faites en deux étapes:

Vous tracez le nuage de points avec les données.

Vous utilisez la fonction plot () pour cela.

Vous utilisez la fonction abline () pour dessiner la ligne de tendance en fonction des coefficients.
Le code suivant vous donne l'intrigue: >> intrigue (mpg ~ wt, données = mtcars)> abline (a = modèle coef [1], b = modèle coef [2])

L'argument abline () a représente l'interception, et b représente la pente de la ligne de tendance que vous voulez tracer. Vous tracez une ligne verticale en définissant l'argument v sur l'interception avec l'axe

à la place.Les lignes horizontales sont tracées en plaçant l'argument v sur l'interception avec l'axe y . Vous trouverez ci-dessous un aperçu des fonctions permettant d'extraire des informations de l'objet modèle lui-même. Ces fonctions fonctionnent avec différents objets de modèle, y compris ceux construits par aov () et lm (). De nombreux auteurs proposent également les mêmes fonctions pour les modèles construits par les fonctions de leur package. Ainsi, vous pouvez toujours essayer d'utiliser ces fonctions d'extraction en combinaison avec d'autres fonctions du modèle.

Fonction

Description

Comment modéliser les relations de données linéaires avec R - les variables

Le choix des éditeurs

coef ()	Retourne un vecteur avec les coefficients du modèle
confint ()	Retourne une matrice avec les limites supérieure et inférieure de la > intervalle de confiance pour chaque coefficient du modèle
fitted ()	Retourne un vecteur avec les valeurs ajustées pour chaque observation
résiduels ()	Retourne un vecteur avec les résidus pour chaque observation < vcov () Renvoie la matrice de variance-covariance pour le coefficient

coef ()

Retourne un vecteur avec les coefficients du modèle

confint ()

Retourne une matrice avec les limites supérieure et inférieure de la > intervalle de confiance pour chaque coefficient du modèle

fitted ()

Retourne un vecteur avec les valeurs ajustées pour chaque

observation

résiduels ()

Retourne un vecteur avec les résidus pour chaque observation < vcov ()

Renvoie la matrice de variance-covariance pour le coefficient

Comment modéliser les relations de données linéaires avec R - les variables

Table des matières:

Vidéo: Corrélation et régression linéaire 2025

Comment construire un modèle linéaire

Le choix des éditeurs

Comment adapter les normes journalistiques aux blogs de maman - Les nuls

Comment accepter les commentaires des membres de la communauté en ligne - mannequins

Comment ajouter NoFollow Tag - mannequins

Le choix des éditeurs

Ce qu'il faut faire et ne pas faire pour vos tableaux de bord et rapports Excel - les nuls

Emplacements de confiance et macros Excel - mannequins

Transformez une colonne de données en deux dans Excel 2016 - des nuls

Le choix des éditeurs

Dix domaines à couvrir avec les fournisseurs d'entrepôts de données - les nuls

L'avenir des entrepôts de données à l'ère du Big Data - mannequins

Les catégories principales de Business Intelligence - les nuls

Le choix des éditeurs

Comment adopter la posture de golf correcte - mannequins

Comment éviter de skier votre coup de départ dans le golf - les nuls

Comment aligner une balle de golf pour un putt - mannequins

En évitant les ratés du petit jeu - les mannequins

Le choix des éditeurs

Adobe CS5 Dreamweaver AP Div Comportements - mannequins

Images d'arrière-plan adobe CS5 Dreamweaver - nuls

3 Façons de promouvoir votre site Dreamweaver avec des sites sociaux - dummies

Adobe CS5 Dreamweaver CSS et compatibilité du navigateur - dummies

Catégories populaires