Accueil Finances personnelles Les limites des données d'évaluation en apprentissage automatique - les données d'évaluation

Les limites des données d'évaluation en apprentissage automatique - les données d'évaluation

Vidéo: Juliette ALEMANY : MT180 Normandie - édition 2017 2024

Vidéo: Juliette ALEMANY : MT180 Normandie - édition 2017 2024
Anonim

Les données de notation ont leurs limites dans l'apprentissage automatique Pour que les systèmes de recommandation fonctionnent bien, ils ont besoin de vous connaître ainsi que d'autres personnes, comme vous L'acquisition de données d'évaluation permet à un système de recommandation de tirer des leçons de l'expérience de plusieurs clients.Les données de classement peuvent découler d'un jugement (comme évaluer un produit à l'aide d'étoiles ou de chiffres) ou d'un fait (un binaire 1/0 indique que vous avez acheté le produit, visionné un film ou arrêté de naviguer sur une certaine page Web).

Peu importe la source ou le type de données, les données de classement concernent toujours les comportements. Pour classer un film, vous devez décider de le visionner, de le regarder et ensuite le noter en fonction de votre expérience de visionnage du film Les systèmes de recommandation réels apprennent à partir des données de différentes manières:

  • Filtrage collaboratif: Correspondances évaluateurs basés sur les similitudes de films ou de produits utilisés dans le passé.Vous pouvez obtenir des recommandations basées sur des éléments aimé par des personnes semblables à vous ou sur des articles similaires à ceux que vous aimez.
  • Filtrage basé sur le contenu: Va au-delà du fait que vous ayez regardé un film. Il examine les caractéristiques relatives à vous et à l'animation pour déterminer si une correspondance existe en fonction des catégories plus grandes représentées par les entités. Par exemple, si vous êtes une femme qui aime les films d'action, le recommandeur cherchera des suggestions qui comprennent l'intersection de ces deux catégories.
  • Recommandations basées sur les connaissances: Basé sur les métadonnées, telles que les préférences exprimées par les utilisateurs et les descriptions des produits. Il repose sur l'apprentissage automatique et est efficace lorsque vous n'avez pas assez de données comportementales pour déterminer les caractéristiques de l'utilisateur ou du produit. Cela s'appelle un démarrage à froid et représente l'une des tâches recommandées les plus difficiles, car vous n'avez accès ni au filtrage collaboratif ni au filtrage basé sur le contenu.

Lorsque vous utilisez le filtrage collaboratif, vous devez calculer la similarité. En dehors des distances euclidienne, de Manhattan et de Chebyshev, le reste de cette information traite de la similarité des cosinus. La similarité cosinus mesure la distance cosinus angulaire entre deux vecteurs, ce qui peut sembler un concept difficile à saisir mais qui n'est qu'un moyen de mesurer des angles dans des espaces de données.

Imaginez un espace fait de caractéristiques et ayant deux points. Vous pouvez mesurer la distance entre les points. Par exemple, vous pourriez utiliser la distance euclidienne, qui est un choix parfait quand vous avez peu de dimensions, mais qui échoue lamentablement quand vous avez plusieurs dimensions à cause de la malédiction de la dimensionnalité.

L'idée derrière la distance cosinus est d'utiliser l'angle créé par les deux points reliés à l'origine spatiale (le point où toutes les dimensions sont nulles) à la place. Si les points sont proches, l'angle est étroit, peu importe le nombre de dimensions. S'ils sont loin, l'angle est assez grand.

La similarité des cosinus implémente la distance cosinus comme un pourcentage et est assez efficace pour dire si un utilisateur est similaire à un autre ou si un film peut être associé à un autre parce que les mêmes utilisateurs le favorisent. L'exemple suivant localise les films les plus similaires au film 50, Star Wars.

impression (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

similar_movies <- similarité (MovieLense [50],

MovieLense [-50],

method = "cosinus",

which = "items")

colnames (similar_movies) [qui (similar_movies> 0.70)]

[1] "Toy Story (1995)" < "Empire contre-attaque, The (1980)"

[3] "Les aventuriers de l'arche perdue (1981)"

"Le retour du Jedi (1983)"

Les limites des données d'évaluation en apprentissage automatique - les données d'évaluation

Le choix des éditeurs

Résolution des conflits de ressources humaines avec Microsoft Office Project 2007 - dummies

Résolution des conflits de ressources humaines avec Microsoft Office Project 2007 - dummies

Lorsqu'un membre de l'équipe de projet est suropposée dans votre projet Microsoft Office Project 2007, vous pouvez prendre des mesures pour corriger le problème en utilisant les suggestions suivantes. Gardez à l'esprit que les circonstances de votre projet déterminent si une solution particulière est réalisable. Par exemple, vous pouvez ajouter des ressources uniquement si votre budget le permet ...

Comment enregistrer plusieurs lignes de base dans Project 2013 - mannequins

Comment enregistrer plusieurs lignes de base dans Project 2013 - mannequins

Le concept de lignes de base multiples semble presque contraire définition d'une ligne de base. Après tout, le but d'une base de référence est de mettre l'enjeu proverbial dans le sable et de mesurer les progrès contre elle. Vous pouvez conserver plusieurs lignes de base dans Project 2013 à plusieurs fins. Considérez ces raisons: Vous avez un plan de base pour ...

Comment enregistrer une référence dans Project 2013 - mannequins

Comment enregistrer une référence dans Project 2013 - mannequins

Vous pouvez enregistrer une référence à tout moment en ouvrant la boîte de dialogue Définir la ligne de base dans Project 2013. Un paramètre - qui contrôle la manière dont le projet regroupe les données dans les tâches récapitulatives lorsque vous définissez une ligne de base pour une partie des tâches - nécessite une explication. Après avoir enregistré une base de données la première fois dans Project 2013, ...

Le choix des éditeurs

Comment classer les modèles d'analyse prédictive - mannequins

Comment classer les modèles d'analyse prédictive - mannequins

Vous avez plusieurs façons de classer les modèles utilisés pour l'analyse prédictive. En général, vous pouvez les trier en fonction des problèmes métier qu'ils résolvent et des principales fonctions métier qu'ils servent (ventes, publicité, ressources humaines ou gestion des risques, par exemple). L'implémentation mathématique utilisée dans le modèle (comme les statistiques, l'exploration de données et la machine ...

Comment appliquer n'importe quelle grappe de colonies dans l'analyse prédictive - les nuls

Comment appliquer n'importe quelle grappe de colonies dans l'analyse prédictive - les nuls

Un exemple naturel de groupe auto-organisateur vous pouvez appliquer dans le comportement d'analyse prédictive est une colonie de fourmis à la recherche de nourriture. Les fourmis optimisent collectivement leur trajectoire de manière à prendre toujours le chemin le plus court possible vers une cible alimentaire. Même si vous essayez de déranger une colonie de fourmis et de les empêcher de ...

Comment choisir un algorithme pour un modèle d'analyse prédictive - mannequins

Comment choisir un algorithme pour un modèle d'analyse prédictive - mannequins

Diverses statistiques, data-mining et des algorithmes d'apprentissage automatique sont disponibles pour votre modèle d'analyse prédictive. Vous êtes dans une meilleure position pour sélectionner un algorithme après avoir défini les objectifs de votre modèle et sélectionné les données sur lesquelles vous allez travailler. Certains de ces algorithmes ont été développés pour résoudre des problèmes métier spécifiques, améliorer des algorithmes existants ou fournir ...

Le choix des éditeurs

Excel Tableaux de bord et rapports: La fonction VLOOKUP - les nuls

Excel Tableaux de bord et rapports: La fonction VLOOKUP - les nuls

Ne vous feront rien tout bien si vous ne pouvez pas gérer efficacement vos modèles de données. La fonction VLOOKUP est le roi de toutes les fonctions de recherche dans Excel. Le but de VLOOKUP est de trouver une valeur spécifique à partir d'une colonne de données où la valeur de ligne la plus à gauche correspond à un critère donné. Prenez ...

Excel Outils d'analyse de données - dummies

Excel Outils d'analyse de données - dummies

L'outil d'analyse d'excel est un complément utile qui fournit un ensemble complet d'outils d'analyse statistique . Voici quelques outils dans le ToolPak. Outil Analyse Anova: Facteur unique Analyse de variance pour deux échantillons ou plus Anova: Facteur double avec réplication Analyse de la variance avec deux variables indépendantes et observations multiples ...

Excelent Touches de raccourci d'entrée de données - mannequins

Excelent Touches de raccourci d'entrée de données - mannequins

Lorsque vous travaillez dans Excel et saisissez des données dans une cellule, il est essentiel pour compléter l'entrée soit en cliquant sur une autre cellule avec le pointeur de la souris ou en utilisant l'une des touches de raccourci pratiques montrées ici pour déplacer le curseur de la cellule: Appuyez sur les touches To Arrow (& uarr;, & darr; move ...