Table des matières:
Vidéo: Machine Learning Basics | What Is Machine Learning? | Introduction To Machine Learning | Simplilearn 2025
apprentissage supervisé
- apprentissage non supervisé
- apprentissage par renforcement
- apprentissage supervisé
apprentissage supervisé
se produit lorsqu'un algorithme apprend par l'exemple les données et les réponses cibles associées qui peuvent être constituées de valeurs numériques ou d'étiquettes de chaînes, telles que des classes ou des étiquettes, afin de prédire plus tard la réponse correcte lorsqu'elles sont posées avec de nouveaux exemples. L'approche supervisée est en effet similaire à l'apprentissage humain sous la supervision d'un enseignant. L'enseignant fournit de bons exemples à mémoriser à l'élève, et l'élève tire ensuite des règles générales de ces exemples spécifiques.
Apprentissage non supervisé
se produit lorsqu'un algorithme apprend à partir d'exemples simples sans réponse associée, laissant à l'algorithme le soin de déterminer lui-même les modèles de données. Ce type d'algorithme a tendance à restructurer les données en quelque chose d'autre, comme de nouvelles caractéristiques qui peuvent représenter une classe ou une nouvelle série de valeurs non corrélées. Ils sont très utiles pour fournir aux humains des informations sur la signification des données et de nouvelles entrées utiles pour les algorithmes d'apprentissage automatique supervisés.
L'algorithme d'automatisation marketing tire ses suggestions de ce que vous avez acheté dans le passé. Les recommandations sont basées sur une estimation du groupe de clients auquel vous ressemblez le plus, puis sur vos préférences probables basées sur ce groupe.
Apprentissage par renforcement
L'apprentissage par renforcement
se produit lorsque vous présentez l'algorithme avec des exemples sans étiquettes, comme dans l'apprentissage non supervisé. Cependant, vous pouvez accompagner un exemple de retour positif ou négatif en fonction de la solution proposée par l'algorithme.L'apprentissage par renforcement est connecté à des applications pour lesquelles l'algorithme doit prendre des décisions (le produit est donc prescriptif, pas simplement descriptif, comme dans un apprentissage non supervisé), et les décisions ont des conséquences. Dans le monde humain, c'est comme apprendre par essais et erreurs. Les erreurs vous aident à apprendre parce qu'elles sont pénalisées (coût, perte de temps, regret, douleur, etc.), vous apprenant qu'un certain plan d'action est moins susceptible de réussir que d'autres. Un exemple intéressant d'apprentissage par renforcement se produit lorsque les ordinateurs apprennent à jouer à des jeux vidéo par eux-mêmes.
Dans ce cas, une application présente l'algorithme avec des exemples de situations spécifiques, telles que le fait que le joueur soit coincé dans un labyrinthe en évitant un ennemi. L'application permet à l'algorithme de connaître le résultat des actions qu'il entreprend, et l'apprentissage se produit en essayant d'éviter ce qu'il découvre dangereux et de poursuivre sa survie. Vous pouvez voir comment la société Google DeepMind a créé un programme d'apprentissage de renforcement qui joue les vieux jeux vidéo d'Atari. Lorsque vous regardez la vidéo, remarquez à quel point le programme est maladroit et maladroit au début, mais s'améliore progressivement avec l'entraînement jusqu'à ce qu'il devienne un champion.