Vidéo: How to build your first predictive model 2024
Partie de Predictive Analytics For Dummies Cheat Sheet
Un projet d'analyse prédictive réussi est exécuté étape par étape. En vous plongeant dans les détails du projet, observez ces étapes importantes:
-
Définir les objectifs commerciaux
Le projet commence par l'utilisation d'un objectif commercial bien défini. Le modèle est censé répondre à une question commerciale. Indiquer clairement cet objectif vous permettra de définir la portée de votre projet, et vous fournira le test exact pour mesurer son succès.
-
Préparation des données
Vous utiliserez des données historiques pour former votre modèle. Les données sont généralement dispersées sur plusieurs sources et peuvent nécessiter un nettoyage et une préparation. Les données peuvent contenir des enregistrements en double et des valeurs aberrantes; en fonction de l'analyse et de l'objectif commercial, vous décidez de les conserver ou de les supprimer. En outre, les données peuvent avoir des valeurs manquantes, peuvent nécessiter une certaine transformation et peuvent être utilisées pour générer des attributs dérivés ayant un pouvoir prédictif plus important pour votre objectif. Dans l'ensemble, la qualité des données indique la qualité du modèle.
-
Échantillonnage de vos données
Vous devez diviser vos données en deux ensembles: les ensembles de données d'apprentissage et de test. Vous construisez le modèle en utilisant le jeu de données d'entraînement. Vous utilisez l'ensemble de données de test pour vérifier l'exactitude de la sortie du modèle. Cela est absolument crucial. Sinon, vous courez le risque de surcharger votre modèle en formant le modèle avec un ensemble de données limité, au point qu'il sélectionne toutes les caractéristiques (le signal et le bruit) qui ne sont vraies que pour cet ensemble de données. Un modèle qui est surajusté pour un ensemble de données spécifique fonctionnera misérablement lorsque vous l'exécuterez sur d'autres ensembles de données. Un jeu de données de test garantit un moyen valable de mesurer avec précision les performances de votre modèle.
-
Construction du modèle
Parfois, les données ou les objectifs métier se prêtent à un algorithme ou un modèle spécifique. D'autres fois, la meilleure approche n'est pas si claire. Pendant que vous explorez les données, exécutez autant d'algorithmes que possible. comparer leurs sorties. Basez votre choix du modèle final sur les résultats globaux. Parfois, il vaut mieux exécuter simultanément un ensemble de modèles sur les données et choisir un modèle final en comparant leurs résultats.
-
Déploiement du modèle
Après avoir créé le modèle, vous devez le déployer pour en tirer parti. Ce processus peut nécessiter une coordination avec d'autres ministères. Viser à construire un modèle déployable. Assurez-vous également de savoir comment présenter vos résultats aux parties prenantes de manière compréhensible et convaincante afin qu'ils adoptent votre modèle.Une fois le modèle déployé, vous devez surveiller ses performances et continuer à l'améliorer. La plupart des modèles se désintègrent après une certaine période de temps. Gardez votre modèle à jour en le rafraîchissant avec les nouvelles données disponibles.