Accueil Finances personnelles Les limites des données d'évaluation en apprentissage automatique - les données d'évaluation

Les limites des données d'évaluation en apprentissage automatique - les données d'évaluation

Vidéo: Juliette ALEMANY : MT180 Normandie - édition 2017 2025

Vidéo: Juliette ALEMANY : MT180 Normandie - édition 2017 2025
Anonim

Les données de notation ont leurs limites dans l'apprentissage automatique Pour que les systèmes de recommandation fonctionnent bien, ils ont besoin de vous connaître ainsi que d'autres personnes, comme vous L'acquisition de données d'évaluation permet à un système de recommandation de tirer des leçons de l'expérience de plusieurs clients.Les données de classement peuvent découler d'un jugement (comme évaluer un produit à l'aide d'étoiles ou de chiffres) ou d'un fait (un binaire 1/0 indique que vous avez acheté le produit, visionné un film ou arrêté de naviguer sur une certaine page Web).

Peu importe la source ou le type de données, les données de classement concernent toujours les comportements. Pour classer un film, vous devez décider de le visionner, de le regarder et ensuite le noter en fonction de votre expérience de visionnage du film Les systèmes de recommandation réels apprennent à partir des données de différentes manières:

  • Filtrage collaboratif: Correspondances évaluateurs basés sur les similitudes de films ou de produits utilisés dans le passé.Vous pouvez obtenir des recommandations basées sur des éléments aimé par des personnes semblables à vous ou sur des articles similaires à ceux que vous aimez.
  • Filtrage basé sur le contenu: Va au-delà du fait que vous ayez regardé un film. Il examine les caractéristiques relatives à vous et à l'animation pour déterminer si une correspondance existe en fonction des catégories plus grandes représentées par les entités. Par exemple, si vous êtes une femme qui aime les films d'action, le recommandeur cherchera des suggestions qui comprennent l'intersection de ces deux catégories.
  • Recommandations basées sur les connaissances: Basé sur les métadonnées, telles que les préférences exprimées par les utilisateurs et les descriptions des produits. Il repose sur l'apprentissage automatique et est efficace lorsque vous n'avez pas assez de données comportementales pour déterminer les caractéristiques de l'utilisateur ou du produit. Cela s'appelle un démarrage à froid et représente l'une des tâches recommandées les plus difficiles, car vous n'avez accès ni au filtrage collaboratif ni au filtrage basé sur le contenu.

Lorsque vous utilisez le filtrage collaboratif, vous devez calculer la similarité. En dehors des distances euclidienne, de Manhattan et de Chebyshev, le reste de cette information traite de la similarité des cosinus. La similarité cosinus mesure la distance cosinus angulaire entre deux vecteurs, ce qui peut sembler un concept difficile à saisir mais qui n'est qu'un moyen de mesurer des angles dans des espaces de données.

Imaginez un espace fait de caractéristiques et ayant deux points. Vous pouvez mesurer la distance entre les points. Par exemple, vous pourriez utiliser la distance euclidienne, qui est un choix parfait quand vous avez peu de dimensions, mais qui échoue lamentablement quand vous avez plusieurs dimensions à cause de la malédiction de la dimensionnalité.

L'idée derrière la distance cosinus est d'utiliser l'angle créé par les deux points reliés à l'origine spatiale (le point où toutes les dimensions sont nulles) à la place. Si les points sont proches, l'angle est étroit, peu importe le nombre de dimensions. S'ils sont loin, l'angle est assez grand.

La similarité des cosinus implémente la distance cosinus comme un pourcentage et est assez efficace pour dire si un utilisateur est similaire à un autre ou si un film peut être associé à un autre parce que les mêmes utilisateurs le favorisent. L'exemple suivant localise les films les plus similaires au film 50, Star Wars.

impression (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

similar_movies <- similarité (MovieLense [50],

MovieLense [-50],

method = "cosinus",

which = "items")

colnames (similar_movies) [qui (similar_movies> 0.70)]

[1] "Toy Story (1995)" < "Empire contre-attaque, The (1980)"

[3] "Les aventuriers de l'arche perdue (1981)"

"Le retour du Jedi (1983)"

Les limites des données d'évaluation en apprentissage automatique - les données d'évaluation

Le choix des éditeurs

Pour les seniors: Comment travailler avec Windows dans Microsoft Windows - les nuls

Pour les seniors: Comment travailler avec Windows dans Microsoft Windows - les nuls

Windows, avec un W majuscule, tire son nom de sa caractéristique principale: Windows, avec un w minuscule. Se familiariser avec Windows signifie apprendre à ouvrir, fermer, redimensionner, déplacer et basculer entre les fenêtres, ce qui est la clé pour jongler avec succès avec plusieurs activités. Chaque programme que vous exécutez occupe sa propre fenêtre. Une fenêtre peut occuper une partie de ...

Comment accepter ou rejeter les cookies dans Safari - dummies

Comment accepter ou rejeter les cookies dans Safari - dummies

Un cookie est un petit fichier qu'un site Web enregistre automatiquement sur le disque dur de votre Mac. Il contient des informations, telles que vos préférences ou votre date de naissance, que le site utilisera lors de vos prochaines visites. Dans Mac OS X Snow Leopard, Safari vous permet de choisir d'accepter ou non tous les cookies ...

Le choix des éditeurs

Construire des boîtes et des lignes Bézier dans QuarkXPress - des nuls

Construire des boîtes et des lignes Bézier dans QuarkXPress - des nuls

Pour créer une boîte ou une ligne dans QuarkXPress plus complexe qu'un simple rectangle, ovale ou starburst, vous entrez dans le domaine du chemin de Bézier. Si vous avez utilisé l'outil Plume dans Adobe Illustrator ou Photoshop, vous comprenez déjà les chemins de Bézier. Il faut un peu de pratique et un esprit détendu ...

Création d'un rapport avec Crystal Reports 10 - témoins

Création d'un rapport avec Crystal Reports 10 - témoins

Lorsque vous démarrez Crystal Reports 10, généralement l'une des trois choses suivantes: créer un rapport, modifier un rapport ou exécuter un rapport sur les données de votre base de données. Les rapports prennent des données à partir d'une base de données, les traitent, les formatent et les affichent ensuite sur une imprimante, un écran d'ordinateur ou un site Web. Crystal Reports ...

Traitant des commentaires Javadoc dans Eclipse - mannequins

Traitant des commentaires Javadoc dans Eclipse - mannequins

Lorsque vous utilisez Eclipse pour écrire du code Java, n'oubliez pas de éditez les commentaires de Javadoc (les choses qui commencent par / **). Vous pouvez ajouter des informations utiles lorsque vous modifiez les commentaires Javadoc et lorsque vous les modifiez, l'aide au code d'Eclipse propose des suggestions. N'oubliez pas ces astuces lorsque vous modifiez vos commentaires Javadoc: Ajouter un commentaire Javadoc: ...

Le choix des éditeurs

Les connexions cachées sur le Nikon D5600 - les nuls

Les connexions cachées sur le Nikon D5600 - les nuls

Ouvrent les couvercles sur les côtés gauche et droit du Nikon D5600 caméra, et vous verrez plusieurs ports de connexions cachées. Les ports de connexion suivants sont indiqués sur cette image: Terminal d'accessoires: ce terminal accepte les accessoires suivants: câble déclencheur à distance Nikon MC-DC2; Télécommandes sans fil WR-1 et WR-R10; et les unités GPS GP-1 / GP-1A. I ...

Les connexions cachées sur votre Nikon D5200 - les nuls

Les connexions cachées sur votre Nikon D5200 - les nuls

ÉParpillés sur l'extérieur de votre appareil photo sont nombreuses commandes que vous utilisez pour changer d'image -prend des paramètres, revoir et modifier vos photos, et effectuer diverses autres opérations. Caché sous le couvercle sur le côté gauche de la caméra, vous trouverez les quatre ports de connexion suivants, étiquetés dans cette figure: Borne accessoire: Vous pouvez brancher le Nikon en option ...

Des boutons et autres commandes du Nikon D7500 - mannequins

Des boutons et autres commandes du Nikon D7500 - mannequins

C'est génial d'avoir une carte pour le boutons et commandes sur votre appareil photo, mais ce n'est pas beaucoup d'aide si vous ne pouvez pas vous rappeler quel bouton appuyer sur quand (et pourquoi). Alors, voici un aperçu des fonctions des contrôles les plus importants. (Certains contrôles ont des fonctions supplémentaires pendant certaines opérations, mais la table ...