Vidéo: Classification Supervisée - Machine Learning | Matters Meetup | Laurent Morelli 2025
Dans analyse supervisée, les deux entrées et la sortie préférée fait partie des données d'apprentissage. Le modèle d'analyse prédictive est présenté avec les résultats corrects dans le cadre de son processus d'apprentissage. Un tel apprentissage supervisé suppose des exemples pré-classifiés: Le but est d'apprendre le modèle à partir de la classification précédemment connue afin qu'il puisse correctement étiqueter le prochain point de données inconnu en fonction de ce qu'il a appris.
Lorsque l'entraînement du modèle est terminé, une fonction mathématique est déduite en examinant les données d'entraînement. Cette fonction sera utilisée pour marquer les nouveaux points de données.
Pour que cette approche fonctionne correctement, les données d'entraînement - ainsi que les données de test - doivent être soigneusement sélectionnées. Le modèle formé devrait être capable de prédire l'étiquette correcte pour un nouveau point de données rapidement et précisément, en fonction du ou des types de données que le modèle a vu dans les données d'apprentissage.
L'analyse supervisée offre des avantages distincts:
-
L'analyste est responsable du processus.
-
L'étiquetage est basé sur des classifications connues.
-
Les erreurs d'étiquetage peuvent être facilement résolues.
Le revers de ces avantages est un ensemble tout aussi différent d'inconvénients potentiels:
-
Toutes les erreurs de la phase d'entraînement seront renforcées plus tard.
-
La classification fournie par l'analyste peut ne pas décrire adéquatement la population entière.
-
Le modèle peut être incapable de détecter les classes qui s'écartent de l'ensemble d'apprentissage d'origine.
-
L'hypothèse selon laquelle les groupes au sein des données ne se chevauchent pas - et qu'ils peuvent facilement être séparés - peut ne pas être valide.