Accueil Finances personnelles Utilisation de l'ajustement de courbe dans Predictive Analytics - L'ajustement de courbe

Utilisation de l'ajustement de courbe dans Predictive Analytics - L'ajustement de courbe

Table des matières:

Vidéo: Nuage de points et régression linéaire 2025

Vidéo: Nuage de points et régression linéaire 2025
Anonim

L'ajustement de courbe est un processus utilisé dans l'analyse prédictive dont l'objectif est de créer une courbe qui représente la fonction mathématique qui correspond le mieux aux points de données réels (originaux) dans une série de données.

La courbe peut traverser chaque point de données ou rester dans la masse des données, en ignorant certains points de données dans l'espoir de tirer des tendances à partir des données. Dans les deux cas, une seule fonction mathématique est assignée à l'ensemble des données, dans le but d'ajuster tous les points de données en une courbe qui délimite les tendances et facilite la prédiction.

L'ajustement de la courbe peut être réalisé de l'une des trois manières suivantes:

  • En trouvant un ajustement exact pour chaque point de données (un processus appelé interpolation )

  • En restant dans la plus grande partie des données tout en ignorant certains points de données dans l'espoir d'extraire les tendances des données

  • En utilisant le lissage des données pour obtenir une fonction qui représente le graphique lissé

L'ajustement de courbe peut être utilisé pour remplir les points de données possibles afin de remplacer les valeurs manquantes ou aider les analystes à visualiser les données.

Lorsque vous créez un modèle d'analyse prédictive, évitez d'adapter votre modèle à votre échantillon de données. Un tel modèle échouera - misérablement - à prédire des ensembles de données similaires mais variables en dehors de l'échantillon de données. Ajuster un modèle de trop près à un échantillon de données particulier est une erreur classique appelée overfitting .

Les malheurs de l'overfitting

En fait, le surajustement d'un modèle est ce qui se passe quand on surmène le modèle pour représenter uniquement les données de votre échantillon - ce qui n'est pas une bonne représentation des données dans son ensemble. Sans un ensemble de données plus réaliste, le modèle peut alors être confronté à des erreurs et à des risques lorsqu'il sera opérationnel - et les conséquences pour votre entreprise peuvent être sérieuses.

Le surimpression d'un modèle est un piège courant car les gens veulent créer des modèles qui fonctionnent - et sont donc tentés de continuer à modifier les variables et les paramètres jusqu'à ce que le modèle fonctionne parfaitement - avec trop peu de données. L'erreur est humaine. Heureusement, il est également humain de créer des solutions réalistes.

Pour éviter de superposer votre modèle à votre jeu de données, assurez-vous de disposer d'un ensemble de données de test distinct de vos données d'exemple. Vous pouvez ensuite mesurer les performances de votre modèle de manière indépendante avant de rendre le modèle opérationnel.

Ainsi, une protection générale contre le surajustement consiste à diviser vos données en deux parties: les données d'entraînement et les données d'essai. La performance du modèle par rapport aux données de test vous dira si le modèle est prêt pour le monde réel.

Une autre bonne pratique consiste à s'assurer que vos données représentent la plus grande population du domaine pour lequel vous modélisez. Tout un modèle surentraîné connaît les caractéristiques spécifiques de l'ensemble de données pour lequel il a été formé. Si vous entraînez le modèle uniquement sur (par exemple) les ventes de raquettes en hiver, ne soyez pas surpris s'il échoue lamentablement lorsqu'il est à nouveau utilisé pour des données d'une autre saison.

Comment éviter un surajustement

Il vaut la peine de le répéter: Trop de réglages du modèle peuvent entraîner un surapprentissage. Un tel ajustement inclut trop de variables dans l'analyse. Gardez ces variables au minimum. N'incluez que les variables que vous considérez absolument nécessaires - celles que vous jugez importantes pour le résultat.

Cette idée ne vient que d'une connaissance intime du domaine d'activité dans lequel vous vous trouvez. C'est là que l'expertise des experts du domaine peut vous aider à ne pas tomber dans le piège de la surenchère.

Voici une liste des meilleures pratiques pour vous aider à éviter de sur-adapter votre modèle:

  • Choisissez un jeu de données représentatif de la population dans son ensemble.

  • Divisez votre ensemble de données en deux parties: données d'entraînement et données de test.

  • Gardez les variables analysées à un minimum sain pour la tâche à accomplir.

  • Demandez l'aide d'experts en connaissances du domaine.

Sur le marché boursier, par exemple, une technique analytique classique est back-testing : un modèle est comparé à des données historiques pour rechercher la meilleure stratégie de trading.

Supposons que, après avoir appliqué son nouveau modèle aux données générées par un marché haussier récent, et modifié le nombre de variables utilisées dans son analyse, l'analyste crée ce qui ressemble à une stratégie de trading optimale - une stratégie qui générerait les meilleurs rendements. si il pourrait revenir en arrière et échanger seulement pendant l'année qui a produit les données d'essai. Malheureusement, il ne peut pas. S'il essaie d'appliquer ce modèle dans un marché baissier actuel, regardez ci-dessous: Il subira des pertes en appliquant un modèle trop optimisé pour une période de temps étroite et un ensemble de conditions qui ne correspondent pas aux réalités actuelles. (Tellement pour des bénéfices hypothétiques.)

Le modèle a fonctionné seulement pour ce marché haussier disparu parce qu'il était surentraîné, portant les marques du contexte qui a produit les données d'échantillon - complet avec ses spécificités, les aberrantes, et les défauts. Toutes les circonstances entourant cet ensemble de données ne seront probablement pas répétées à l'avenir, ou dans une représentation réelle de la population entière - mais elles se sont toutes manifestées dans le modèle sur-ajusté.

Si la sortie d'un modèle est trop précise, considérez un indice pour regarder de plus près. Demandez l'aide d'experts en connaissances du domaine pour voir si vos résultats sont vraiment trop bons pour être vrais, et exécutez ce modèle sur plus de données de test pour d'autres comparaisons.

Utilisation de l'ajustement de courbe dans Predictive Analytics - L'ajustement de courbe

Le choix des éditeurs

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Pour approfondir votre conscience consciente, vous devez pratiquer une méditation de pleine conscience sur une base quotidienne. Familiarisez-vous avec certaines des médiations suivantes. Avec le temps, vous deviendrez plus conscient de votre vie quotidienne. Body Meditation Meditation - Cette méditation implique de passer environ une demi-heure, en prenant conscience de ...

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Les Templiers sont presque aussi fictifs dans Dan Brown Le code Da Vinci comme les chevaliers Jedi sont dans Star Wars. Bien que le héros Robert Langdon hésite d'abord à élever les Templiers dans ses cours, parce que la mention même d'eux fait ressortir les amants du complot, Brown n'a aucun problème à les faire participer ...

Démystification des mythes communs sur la franc-maçonnerie - mannequins

Démystification des mythes communs sur la franc-maçonnerie - mannequins

La franc-maçonnerie moderne existe depuis 1717. Les premières contre-vérités concoctées sur l'Ordre sont apparues en impression à peu près en même temps. Les États-Unis étaient consumés par l'hystérie anti-maçonnique à la fin des années 1820, et l'Europe a fait de Mason-bashing un sport populaire pendant deux siècles, le liant souvent à la propagande antisémite. Internet n'a que ...

Le choix des éditeurs

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

Dans la boîte de dialogue Configurer l'affichage dans PowerPoint, cliquez sur le bouton Configurer l'affichage dans l'onglet Diaporama du ruban Office 2011 pour Mac, ou choisissez Diaporama → Configurer l'affichage dans la barre de menus. Dans les deux cas, la boîte de dialogue Configurer l'affichage polyvalent apparaît. Choisir un type de spectacle dans PowerPoint 2011 pour Mac ...

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement d'un fichier sur lequel vous travaillez dans Office 2011 pour Mac est aussi simple que de cliquer sur le bouton Enregistrer dans la barre d'outils Standard, en appuyant sur Commande-S ou en choisissant Fichier → Enregistrer. Si votre fichier a été enregistré précédemment, l'enregistrement du fichier remplace la copie existante du fichier par votre version mise à jour. Si votre fichier n'a pas ...

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Dans Office 2011 pour Mac, l'ajout d'une nouvelle présentation de diapositive à une diapositive dans la vue Diapositive maître de PowerPoint 2011 est une tâche assez simple à effectuer. Suivez ces étapes pour commencer: Assurez-vous que vous êtes en mode Masque des diapositives. Choisissez Affichage → Maître → Masque de diapositives dans la barre de menus. Cliquez sur l'onglet Masque des diapositives du ruban, ...

Le choix des éditeurs

Sélectionnez PowerPoint 2007 Objects - dummies

Sélectionnez PowerPoint 2007 Objects - dummies

Avant de pouvoir modifier un objet PowerPoint 2007 sur une diapositive, vous devez le sélectionner. Dans les présentations PowerPoint, les objets peuvent être du texte, des graphiques, des images clipart, des formes, etc. Voici quelques instructions pour sélectionner les objets PowerPoint 2007: Objets texte: Pour sélectionner un objet texte PowerPoint 2007, déplacez le point d'insertion sur le texte qui ...

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Le contrôle shapePoint de powerPoint vous permet style des objets de ligne ou la bordure pour les objets de forme solide sur vos diapositives PowerPoint. Le contrôle Shape Outline se trouve dans le groupe Styles de formes de l'onglet Outils de dessin. Vous pouvez modifier les paramètres suivants pour le contour: Couleur: Définit la couleur utilisée pour ...

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 est le logiciel de présentation le plus puissant disponible pour créer et éditer la diapositive montrer des présentations pour le travail, la maison ou l'école. PowerPoint 2016 offre un certain nombre de raccourcis clavier utiles pour effectuer des tâches rapidement. Voici quelques raccourcis pour le formatage PowerPoint commun, l'édition et les tâches de fichiers et de documents. De plus, après avoir créé votre chef-d'œuvre, vous ...