Vidéo: Le Data Mining en 35 Leçons - Session 19 : Présentation de Données pour des Tâches de Régression 2024
Les systèmes de moyenne et de vote peuvent également fonctionner correctement lorsque vous utilisez un mélange d'apprentissage machine différent algorithmes. C'est l'approche de moyennage, et elle est largement utilisée lorsque vous ne pouvez pas réduire la variance estimée.
Lorsque vous essayez d'apprendre des données, vous devez essayer différentes solutions, modélisant ainsi vos données à l'aide de différentes solutions d'apprentissage automatique. C'est une bonne pratique de vérifier si vous pouvez mettre certains d'entre eux avec succès dans des ensembles en utilisant des moyennes de prédiction ou en comptant les classes prévues. Le principe est le même que dans l'établissement de prédictions non corrélées, lorsque les modèles mélangés peuvent produire moins de prédictions affectées par la variance. Pour atteindre une moyenne efficace, vous devez
- Divisez vos données en ensembles d'apprentissage et de test.
- Utilisez les données d'apprentissage avec différents algorithmes d'apprentissage automatique.
- Enregistrer les prédictions de chaque algorithme et évaluer la viabilité du résultat en utilisant l'ensemble de test.
- Corréler toutes les prédictions disponibles entre elles.
- Choisissez les prédictions qui corrèlent le moins et faites la moyenne de leur résultat. Ou, si vous classifiez, choisissez un groupe de prédictions les moins corrélées et, pour chaque exemple, choisissez comme nouvelle classe la prédiction de la classe prédite par la majorité d'entre elles.
- Testez la prédiction récemment calculée ou votée par la majorité par rapport aux données de test. En cas de succès, vous créez votre modèle final en faisant la moyenne des résultats de la partie des modèles de l'ensemble réussi.
Pour comprendre quels sont les modèles les moins corrélés, prendre les prédictions une par une, corréler les unes avec les autres et faire la moyenne des corrélations pour obtenir une corrélation moyennée. Utilisez la corrélation moyennée pour classer les prédictions sélectionnées les mieux adaptées à la moyenne.