Accueil Finances personnelles Mesurer la similarité entre les vecteurs d'apprentissage automatique - les nuls

Mesurer la similarité entre les vecteurs d'apprentissage automatique - les nuls

Table des matières:

Vidéo: Cours de classification 2025

Vidéo: Cours de classification 2025
Anonim

Vous pouvez facilement comparer des exemples de vos données en utilisant des calculs si vous considérez chacun d'eux comme un vecteur. Les informations suivantes décrivent comment mesurer la similarité entre vecteurs pour effectuer des tâches telles que le calcul de la distance entre les vecteurs à des fins d'apprentissage.

Comprendre la similarité

Dans une forme vectorielle, vous pouvez voir chaque variable de vos exemples comme une série de coordonnées, chacune pointant vers une position dans une dimension d'espace différente. Si un vecteur a deux éléments, c'est-à-dire qu'il n'a que deux variables, travailler avec lui revient à vérifier la position d'un objet sur une carte en utilisant le premier chiffre pour la position sur l'axe Est-Ouest et le second sur le Nord- Axe sud.

Exemples de valeurs tracées en points sur un graphique.

Par exemple, les nombres entre parenthèses (1, 2) (3, 2) et (3, 3) sont tous des exemples de points. Chaque exemple est une liste ordonnée de valeurs (appelée un tuple) qui peut être facilement localisé et imprimé sur une carte en utilisant la première valeur de la liste pour x (l'axe horizontal) et la seconde pour y (l'axe vertical). Le résultat est un nuage de points.

Si votre ensemble de données, sous forme matricielle, comporte de nombreuses caractéristiques numériques (les colonnes), idéalement, le nombre d'entités représente les dimensions de l'espace de données, tandis que les lignes (les exemples) représentent chacune point, qui est mathématiquement un vecteur. Lorsque votre vecteur comporte plus de deux éléments, la visualisation devient gênante car la représentation des dimensions au-dessus du tiers n'est pas facile (après tout, nous vivons dans un monde tridimensionnel).

Cependant, vous pouvez vous efforcer de transmettre plus de dimensionnalités par certains moyens, par exemple en utilisant la taille, la forme ou la couleur pour d'autres dimensions. Clairement, ce n'est pas une tâche facile, et souvent le résultat est loin d'être intuitif. Cependant, vous pouvez saisir l'idée de l'emplacement des points dans votre espace de données en imprimant systématiquement de nombreux graphiques tout en considérant les dimensions deux par deux. Ces parcelles sont appelées matrices de nuages ​​de points.

Ne vous inquiétez pas de la multidimensionnalité. Vous étendez les règles que vous avez apprises en deux ou trois dimensions à plusieurs dimensions. Ainsi, si une règle fonctionne dans un espace bidimensionnel, elle fonctionne également dans une zone multiple. Par conséquent, tous les exemples se réfèrent d'abord à des exemples bidimensionnels.

Calcul des distances pour l'apprentissage

Un algorithme peut apprendre en utilisant des vecteurs de nombres qui utilisent des mesures de distance. Souvent l'espace impliqué par vos vecteurs est une métrique qui est un espace dont les distances respectent certaines conditions spécifiques:

  • Aucune distance négative n'existe, et votre distance est nulle seulement lorsque le point de départ et le point final coïncident (appelé non abaissé)).
  • La distance est la même allant d'un point à l'autre et vice versa (appelée symétrie).
  • La distance entre un point initial et un point final est toujours supérieure ou, au pire, identique à la distance allant du point initial au troisième point et de là au point final (inégalité triangulaire < - ce qui signifie qu'il n'y a pas de raccourcis). Les distances qui mesurent un espace métrique sont la distance euclidienne, la distance de Manhattan et la distance de Chebyshev. Ce sont toutes les distances qui peuvent s'appliquer aux vecteurs numériques.

Distance euclidienne

La plus commune est la distance euclidienne, également décrite comme la norme l2 de deux vecteurs (lire cette discussion sur les normes l1, l2 et linfinity). Dans un plan bidimensionnel, la distance euclidienne se répare comme la droite reliant deux points, et vous la calculez comme la racine carrée de la somme de la différence au carré entre les éléments de deux vecteurs. Dans le graphique précédent, la distance euclidienne entre les points (1, 2) et (3, 3) peut être calculée dans R comme sqrt ((1-3) ^ 2 + (2-3) ^ 2), ce qui se traduit par distance d'environ 2. 236.

distance de Manhattan

Une autre mesure utile est la distance de Manhattan (également décrite comme la norme l1 de deux vecteurs). Vous calculez la distance de Manhattan en additionnant la valeur absolue de la différence entre les éléments des vecteurs. Si la distance euclidienne marque l'itinéraire le plus court, la distance de Manhattan marque l'itinéraire le plus long, ressemblant aux directions d'un taxi se déplaçant dans une ville. (La distance est également connue sous le nom de taxicab ou distance de bloc de ville.)

Par exemple, la distance de Manhattan entre les points (1, 2) et (3, 3) est abs (1-3) et abs (2-3), qui se traduit par 3.

Chebyshev distance

La distance de Chebyshev ou la métrique maximale prend le maximum de la différence absolue entre les éléments des vecteurs. C'est une mesure de distance qui peut représenter comment un roi se déplace dans le jeu d'échecs ou, dans la logistique d'entrepôt, les opérations requises par un pont roulant pour déplacer une caisse d'un endroit à l'autre.

Dans l'apprentissage automatique, la distance de Chebyshev peut s'avérer utile lorsque vous avez de nombreuses dimensions à prendre en compte et la plupart d'entre elles sont simplement inutiles ou redondantes (dans Chebyshev, vous choisissez simplement celle dont la différence absolue est la plus grande). Dans l'exemple ci-dessus, la distance est simplement 2, le maximum entre (1-3) et abs (2-3).

Mesurer la similarité entre les vecteurs d'apprentissage automatique - les nuls

Le choix des éditeurs

Conventions de dénomination pour Ruby on Rails - mannequins

Conventions de dénomination pour Ruby on Rails - mannequins

Vous utilisez Ruby on Rails pour créer un site Web application ou application de base de données Web, ce qui est très intelligent de votre part. En fonction de ce que vous utilisez (une application, une relation un-à-plusieurs ou une relation plusieurs-à-plusieurs), vous utilisez différentes variantes des protocoles d'attribution de noms Rails, qui sont expliquées dans les sections suivantes. Ruby Naming for ...

En orbite, panoramique et zoom dans la vue 3D de Blender - mannequins

En orbite, panoramique et zoom dans la vue 3D de Blender - mannequins

En essayant de naviguer dans un espace en trois dimensions à travers un écran bidimensionnel comme un écran d'ordinateur, vous ne pouvez pas interagir avec cet espace 3D virtuel exactement comme vous le feriez dans le monde réel, ou espace de vie. La meilleure façon de visualiser le travail en 3D à travers un programme comme Blender est d'imaginer la vue 3D comme vos yeux ...

Déplacement de clips sur la timeline dans Final Cut Pro HD - Ficelles

Déplacement de clips sur la timeline dans Final Cut Pro HD - Ficelles

Final Cut Pro HD Timeline vous permet d'organiser tous vos clips vidéo et audio afin qu'ils racontent l'histoire que vous voulez raconter. Pour comprendre le fonctionnement de la Timeline, imaginez-la comme une page de partitions, mais plutôt que de placer des notes de musique de différentes durées (noires, demi-notes, ...

Le choix des éditeurs

Contrôle et modification de l'associativité des dimensions dans AutoCAD - Dummies

Contrôle et modification de l'associativité des dimensions dans AutoCAD - Dummies

Lorsque vous ajoutez des dimensions en sélectionnant des objets ou en utilisant l'accrochage aux objets Pour sélectionner des points sur les objets, AutoCAD crée normalement des dimensions associatives, qui sont connectées aux objets et se déplacent avec eux. C'est le cas dans les nouveaux dessins créés à l'origine dans toute version d'AutoCAD à partir de 2002. Si vous ...

Copie de styles de cote existants dans AutoCAD 2008 - mannequins

Copie de styles de cote existants dans AutoCAD 2008 - mannequins

Si vous avez la chance de travailler dans un bureau Quelqu'un a mis en place des styles de cotes qui conviennent à votre secteur d'activité et à votre projet. Vous pouvez le copier et ainsi éviter de devoir créer vos propres styles de cote. (Un style de cote - ou dimstyle pour faire court - est une collection de paramètres de dessin appelée dimension ...

En choisissant un style d'édition AutoCAD -

En choisissant un style d'édition AutoCAD -

Dans AutoCAD vous passez généralement plus de temps à éditer que dessiner des objets. C'est en partie parce que le processus de conception et de rédaction est, par nature, sujet à des changements, et aussi parce que AutoCAD vous permet de modifier facilement les objets proprement. AutoCAD propose trois styles d'édition: Commande-première Sélection-première Objet-direct (poignée) AutoCAD fait référence à l'édition de commandes comme verbe-nom ...

Le choix des éditeurs

Praxis Examen d'éducation élémentaire - Présentations orales - mannequins

Praxis Examen d'éducation élémentaire - Présentations orales - mannequins

Parce que les élèves doivent généralement donner des présentations orales en classe , vous rencontrerez probablement une question sur ce sujet dans l'examen Praxis Elementary Education. Plus formelles que les discussions de groupe, les présentations orales ont leurs propres règles pour le conférencier. Lorsque vous donnez une présentation en classe, il y a plusieurs ...

Praxis Examen d'éducation élémentaire - Littérature et texte d'information - mannequins

Praxis Examen d'éducation élémentaire - Littérature et texte d'information - mannequins

L'examen Praxis Elementary Education sur la littérature et le texte d'information, c'est-à-dire la fiction et la non-fiction. Vous devrez donc vous familiariser avec les différents genres d'écriture. La compréhension du texte est un processus qui se produit au fil du temps.

Praxis Examen d'éducation élémentaire - Connaissance phonologique - mannequins

Praxis Examen d'éducation élémentaire - Connaissance phonologique - mannequins

Vous rencontrerez probablement une ou deux questions qui impliquent des questions phonologiques sensibilisation à l'examen Praxis Elementary Education. La conscience phonologique est une compétence large impliquant la reconnaissance de son. Les lecteurs débutants commencent par apprendre les sons individuels, ou phonèmes, dans des mots parlés. Par exemple, le mot chat a trois phonèmes: / c / / a / / t /. Un lecteur débutant apprend ...