3 Types d'Apprentissage Automatique - les nuls

Vidéo: Machine Learning Basics | What Is Machine Learning? | Introduction To Machine Learning | Simplilearn 2025

< L'apprentissage automatique peut prendre plusieurs formes, selon l'algorithme et ses objectifs. Vous pouvez diviser les algorithmes d'apprentissage automatique en trois groupes principaux en fonction de leur objectif:

apprentissage supervisé

apprentissage non supervisé
apprentissage par renforcement
apprentissage supervisé

apprentissage supervisé

se produit lorsqu'un algorithme apprend par l'exemple les données et les réponses cibles associées qui peuvent être constituées de valeurs numériques ou d'étiquettes de chaînes, telles que des classes ou des étiquettes, afin de prédire plus tard la réponse correcte lorsqu'elles sont posées avec de nouveaux exemples. L'approche supervisée est en effet similaire à l'apprentissage humain sous la supervision d'un enseignant. L'enseignant fournit de bons exemples à mémoriser à l'élève, et l'élève tire ensuite des règles générales de ces exemples spécifiques.

Vous devez distinguer entre les problèmes de régression, dont la cible est une valeur numérique, et les problèmes de classification, dont la cible est une variable qualitative, telle qu'une classe ou une variable. Une tâche de régression détermine les prix moyens des maisons dans la région de Boston, et une tâche de classification distingue les types de fleurs d'iris en fonction de leurs mesures de sépales et de pétales.

Apprentissage non supervisé

L'apprentissage non supervisé

se produit lorsqu'un algorithme apprend à partir d'exemples simples sans réponse associée, laissant à l'algorithme le soin de déterminer lui-même les modèles de données. Ce type d'algorithme a tendance à restructurer les données en quelque chose d'autre, comme de nouvelles caractéristiques qui peuvent représenter une classe ou une nouvelle série de valeurs non corrélées. Ils sont très utiles pour fournir aux humains des informations sur la signification des données et de nouvelles entrées utiles pour les algorithmes d'apprentissage automatique supervisés.

Comme une sorte d'apprentissage, il ressemble aux méthodes que les humains utilisent pour comprendre que certains objets ou événements appartiennent à la même classe, par exemple en observant le degré de similitude entre les objets. Certains systèmes de recommandation que vous trouvez sur le web sous la forme d'automatisation du marketing sont basés sur ce type d'apprentissage.

L'algorithme d'automatisation marketing tire ses suggestions de ce que vous avez acheté dans le passé. Les recommandations sont basées sur une estimation du groupe de clients auquel vous ressemblez le plus, puis sur vos préférences probables basées sur ce groupe.

Apprentissage par renforcement

L'apprentissage par renforcement

se produit lorsque vous présentez l'algorithme avec des exemples sans étiquettes, comme dans l'apprentissage non supervisé. Cependant, vous pouvez accompagner un exemple de retour positif ou négatif en fonction de la solution proposée par l'algorithme.L'apprentissage par renforcement est connecté à des applications pour lesquelles l'algorithme doit prendre des décisions (le produit est donc prescriptif, pas simplement descriptif, comme dans un apprentissage non supervisé), et les décisions ont des conséquences. Dans le monde humain, c'est comme apprendre par essais et erreurs. Les erreurs vous aident à apprendre parce qu'elles sont pénalisées (coût, perte de temps, regret, douleur, etc.), vous apprenant qu'un certain plan d'action est moins susceptible de réussir que d'autres. Un exemple intéressant d'apprentissage par renforcement se produit lorsque les ordinateurs apprennent à jouer à des jeux vidéo par eux-mêmes.

Dans ce cas, une application présente l'algorithme avec des exemples de situations spécifiques, telles que le fait que le joueur soit coincé dans un labyrinthe en évitant un ennemi. L'application permet à l'algorithme de connaître le résultat des actions qu'il entreprend, et l'apprentissage se produit en essayant d'éviter ce qu'il découvre dangereux et de poursuivre sa survie. Vous pouvez voir comment la société Google DeepMind a créé un programme d'apprentissage de renforcement qui joue les vieux jeux vidéo d'Atari. Lorsque vous regardez la vidéo, remarquez à quel point le programme est maladroit et maladroit au début, mais s'améliore progressivement avec l'entraînement jusqu'à ce qu'il devienne un champion.