Accueil Finances personnelles Comment créer un modèle d'analyse prédictive avec régression R - les nuls

Comment créer un modèle d'analyse prédictive avec régression R - les nuls

Vidéo: Corrélation et Régression Linéaire Simple avec R 2025

Vidéo: Corrélation et Régression Linéaire Simple avec R 2025
Anonim

Vous souhaitez créer un modèle d'analyse prédictive que vous pouvez évaluer en utilisant des résultats connus. Pour ce faire, nous allons diviser notre ensemble de données en deux ensembles: un pour la formation du modèle et un pour tester le modèle. Une répartition 70/30 entre les ensembles de données d'apprentissage et de formation suffira. Les deux lignes de code suivantes calculent et stockent les tailles de chaque ensemble: >> trainSize testSize <- nrow (autos) - trainSize

Pour afficher les valeurs, tapez le nom de la variable utilisée pour stocker la valeur et appuyez sur Entrée. Voici la sortie:

>> trainSize [1] 279> testSize [1] 119

Ce code détermine les tailles des jeux de données que vous avez l'intention de créer pour nos jeux de données d'apprentissage et de test. Vous n'avez toujours pas créé ces ensembles. De plus, vous ne voulez pas simplement appeler les 279 premières observations de l'ensemble de formation et appeler les 119 dernières observations de l'ensemble de test. Cela créerait un mauvais modèle parce que l'ensemble de données semble ordonné. Plus précisément, la colonne modelYear est classée du plus petit au plus grand.

En examinant les données, vous pouvez voir que la plupart des autos plus lourdes, à huit cylindres, à plus grande cylindrée et plus puissantes se trouvent en haut de l'ensemble de données. De cette observation, sans avoir à exécuter d'algorithmes sur les données, vous pouvez déjà dire que (en général pour ce jeu de données) voitures plus anciennes par rapport aux voitures plus récentes comme suit:

sont plus lourds

ont huit cylindres

  • ont plus grand déplacement

  • Avoir une plus grande puissance

    Bon, évidemment, beaucoup de gens connaissent quelque chose sur les automobiles, alors devinez ce que sont les corrélations ne sera pas trop tiré par les cheveux après avoir vu les données. Quelqu'un avec beaucoup de connaissances de l'automobile peut-être déjà connu sans même regarder les données.
  • Ceci est juste un exemple simple d'un domaine (voitures) auquel de nombreuses personnes peuvent s'identifier. S'il s'agissait de données sur le cancer, cependant, la plupart des gens ne comprendraient pas immédiatement ce que chaque attribut signifie.

C'est là qu'un expert du domaine et un modeleur de données sont essentiels au processus de modélisation. Les experts du domaine peuvent avoir la meilleure connaissance des attributs les plus importants (ou les moins importants) et de la manière dont les attributs sont en corrélation les uns avec les autres.

Ils peuvent suggérer au modélisateur de données les variables à expérimenter. Ils peuvent donner des poids plus importants à des attributs plus importants et / ou des poids plus petits à des attributs de moindre importance (ou les supprimer complètement).

Vous devez donc créer un jeu de données d'apprentissage et un jeu de données de test réellement représentatif de l'ensemble. Une façon de le faire est de créer l'ensemble d'apprentissage à partir d'une sélection aléatoire de l'ensemble de données entier.De plus, vous voulez que ce test soit reproductible pour que vous puissiez apprendre du même exemple.

Fixez ainsi la graine pour le générateur aléatoire afin que nous ayons le même jeu d'entraînement "aléatoire". Le code suivant fait cette tâche: >> set. seed (123)> training_indices <- exemple (seq_len (nrow (autos)), size = trainSize)> trainSet testSet <- autos [-training_indices,]

Le jeu d'apprentissage contient 279 observations, ainsi que les résultats (mpg) de chaque observation. L'algorithme de régression utilise le résultat pour former le modèle en examinant les relations entre les variables prédictives (l'un des sept attributs) et la variable de réponse (mpg).

L'ensemble de test contient le reste des données (c'est-à-dire la partie non incluse dans l'ensemble d'apprentissage). Vous devriez remarquer que l'ensemble de test inclut également la variable de réponse (mpg). 

Lorsque vous utilisez la fonction de prédiction (du modèle) avec l'ensemble de test, il ignore la variable de réponse et utilise uniquement les variables de prédicteur tant que les noms de colonne sont identiques à ceux de l'ensemble d'apprentissage.

Pour créer un modèle de régression linéaire qui utilise l'attribut mpg comme variable de réponse et toutes les autres variables comme variables prédictives, tapez la ligne de code suivante: >> model

Comment créer un modèle d'analyse prédictive avec régression R - les nuls

Le choix des éditeurs

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Pour approfondir votre conscience consciente, vous devez pratiquer une méditation de pleine conscience sur une base quotidienne. Familiarisez-vous avec certaines des médiations suivantes. Avec le temps, vous deviendrez plus conscient de votre vie quotidienne. Body Meditation Meditation - Cette méditation implique de passer environ une demi-heure, en prenant conscience de ...

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Les Templiers sont presque aussi fictifs dans Dan Brown Le code Da Vinci comme les chevaliers Jedi sont dans Star Wars. Bien que le héros Robert Langdon hésite d'abord à élever les Templiers dans ses cours, parce que la mention même d'eux fait ressortir les amants du complot, Brown n'a aucun problème à les faire participer ...

Démystification des mythes communs sur la franc-maçonnerie - mannequins

Démystification des mythes communs sur la franc-maçonnerie - mannequins

La franc-maçonnerie moderne existe depuis 1717. Les premières contre-vérités concoctées sur l'Ordre sont apparues en impression à peu près en même temps. Les États-Unis étaient consumés par l'hystérie anti-maçonnique à la fin des années 1820, et l'Europe a fait de Mason-bashing un sport populaire pendant deux siècles, le liant souvent à la propagande antisémite. Internet n'a que ...

Le choix des éditeurs

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

Dans la boîte de dialogue Configurer l'affichage dans PowerPoint, cliquez sur le bouton Configurer l'affichage dans l'onglet Diaporama du ruban Office 2011 pour Mac, ou choisissez Diaporama → Configurer l'affichage dans la barre de menus. Dans les deux cas, la boîte de dialogue Configurer l'affichage polyvalent apparaît. Choisir un type de spectacle dans PowerPoint 2011 pour Mac ...

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement d'un fichier sur lequel vous travaillez dans Office 2011 pour Mac est aussi simple que de cliquer sur le bouton Enregistrer dans la barre d'outils Standard, en appuyant sur Commande-S ou en choisissant Fichier → Enregistrer. Si votre fichier a été enregistré précédemment, l'enregistrement du fichier remplace la copie existante du fichier par votre version mise à jour. Si votre fichier n'a pas ...

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Dans Office 2011 pour Mac, l'ajout d'une nouvelle présentation de diapositive à une diapositive dans la vue Diapositive maître de PowerPoint 2011 est une tâche assez simple à effectuer. Suivez ces étapes pour commencer: Assurez-vous que vous êtes en mode Masque des diapositives. Choisissez Affichage → Maître → Masque de diapositives dans la barre de menus. Cliquez sur l'onglet Masque des diapositives du ruban, ...

Le choix des éditeurs

Sélectionnez PowerPoint 2007 Objects - dummies

Sélectionnez PowerPoint 2007 Objects - dummies

Avant de pouvoir modifier un objet PowerPoint 2007 sur une diapositive, vous devez le sélectionner. Dans les présentations PowerPoint, les objets peuvent être du texte, des graphiques, des images clipart, des formes, etc. Voici quelques instructions pour sélectionner les objets PowerPoint 2007: Objets texte: Pour sélectionner un objet texte PowerPoint 2007, déplacez le point d'insertion sur le texte qui ...

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Le contrôle shapePoint de powerPoint vous permet style des objets de ligne ou la bordure pour les objets de forme solide sur vos diapositives PowerPoint. Le contrôle Shape Outline se trouve dans le groupe Styles de formes de l'onglet Outils de dessin. Vous pouvez modifier les paramètres suivants pour le contour: Couleur: Définit la couleur utilisée pour ...

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 est le logiciel de présentation le plus puissant disponible pour créer et éditer la diapositive montrer des présentations pour le travail, la maison ou l'école. PowerPoint 2016 offre un certain nombre de raccourcis clavier utiles pour effectuer des tâches rapidement. Voici quelques raccourcis pour le formatage PowerPoint commun, l'édition et les tâches de fichiers et de documents. De plus, après avoir créé votre chef-d'œuvre, vous ...