Vidéo: SAS Forum 2013 - Introduction - Emmanuel Lechypre (Partie 1) 2024
Faire des prédictions analytiques avec de nouvelles données, vous utilisez simplement la fonction avec une liste des sept valeurs d'attribut. Le code suivant fait ce travail: >> newPrediction <- predict (modèle,
liste (cylindres = facteur (4), déplacement = 370,puissance = 150, poids = 3904, accélération = 12, modelYear = facteur (70), origine = facteur (1)),
intervalle = "prédire", niveau = 95)
Voici le code et la sortie de la nouvelle valeur de prédiction:
Une fois que vous avez évalué le modèle avec l'ensemble de données de test et que vous êtes satisfait de sa précision, vous pouvez avoir confiance que vous avez construit un bon modèle prédictif. Vous devrez attendre que les résultats de l'entreprise mesurent l'efficacité de votre modèle prédictif.
Il peut y avoir des optimisations que vous pouvez faire pour construire un modèle prédictif meilleur et plus efficace. En expérimentant, vous pouvez trouver la meilleure combinaison de prédicteurs pour créer un modèle plus rapide et plus précis.
Une façon de construire un sous-ensemble des caractéristiques est de trouver la corrélation entre les variables et de supprimer les variables hautement corrélées. En supprimant les variables redondantes qui n'ajoutent rien (ou ajoutent très peu d'informations) à l'ajustement, vous pouvez augmenter la vitesse du modèle. Cela est particulièrement vrai lorsque vous traitez de nombreuses observations (rangées de données) où la puissance ou la vitesse de traitement peut être un problème.
Pour un grand ensemble de données, plus d'attributs dans une rangée de données ralentiront le traitement. Vous devriez donc essayer d'éliminer autant d'informations redondantes que possible.