Vidéo: Recommandation et Filtrage Collaboratif - Machine Learning | Matters Meetup | Laurent Morelli 2024
L'un des systèmes recommandés par Amazon pour l'analyse prédictive filtrage collaboratif basé sur des articles: distribution d'un vaste inventaire de produits à partir de la base de données de l'entreprise lorsqu'un utilisateur consulte un seul article sur le site Web. Vous savez que vous recherchez un système de filtrage collaboratif basé sur des éléments (ou, souvent, un système basé sur le contenu) s'il affiche des recommandations dès la première vue d'élément, même si vous n'avez pas créé de profil.
On dirait de la magie, mais ce n'est pas le cas. Bien que votre profil n'ait pas encore été créé (parce que vous n'êtes pas connecté ou que vous n'avez pas d'historique de navigation sur ce site), le système prend comme hypothèse: Il base sa recommandation sur l'élément elle-même et ce que d'autres clients ont vu ou acheté après (ou avant) l'achat de cet article. Ainsi, vous verrez un message à l'écran comme
-
Les clients ayant acheté cet article ont également acheté …
-
Les internautes ayant acheté des articles de votre historique ont également acheté …
-
Quels autres objets les clients achètent apres avoir regardé cet article?
En substance, la recommandation est basée sur la similarité de l'élément actuellement consulté avec d'autres éléments, sur la base des actions de la communauté d'utilisateurs.
Voici un exemple de matrice de clients et les articles qu'ils ont achetés. Il servira d'exemple de filtrage collaboratif basé sur des articles.
Client | Article 1 | Article 2 | Article 3 | Article 4 | Article 5 | Article 6 |
---|---|---|---|---|---|---|
A | X > X | X | B | |||
X | X | C | ||||
X | X | D | ||||
X | X | X | E | |||
X | X | F | ||||
X | X | X | X | G | ||
X | X | H | ||||
X > I | X | |||||
|
Examinons maintenant la similarité des items calculée en utilisant la formule de similarité des cosinus. La formule pour |
est (A & middot; B) / (|| A || || B ||), où A et B sont des items à comparer. Pour lire l'exemple suivant et découvrir à quel point une paire d'éléments est similaire, localisez simplement la cellule où les deux éléments se croisent. Le nombre sera compris entre 0 et 1. Une valeur de 1 signifie que les éléments sont parfaitement similaires; 0 signifie qu'ils ne sont pas similaires.
0 | 0 | 0 | 0 | Point 5 | 0. 26 | |
0. 29 | 0. 52 | 0. 82 | 0 | Elément 4 | 0. 32 | |
0. 35 | 0. 32 | 0. 82 | 0 | élément 3 | 0. 40 | |
0. 45 | 0. 32 | 0. 52 | 0 | Elément 2 | 0. 67 | |
0. 45 | 0. 35 | 0. 29 | 0 | élément 1 | 0. 67 | |
0. 40 | 0. 32 | 0. 26 | 0 | Article 1 | Article 2 | |
Article 3 | Article 4 | Article 5 | Article 6 | Le système peut fournir une liste de recommandations certaine valeur de similarité ou peut recommander le nombre d'éléments | n |
supérieur.Dans ce scénario, vous pouvez dire que toute valeur supérieure ou égale à 0. 40 est similaire; le système recommandera ces articles. Par exemple, la similitude entre l'élément 1 et l'élément 2 est 0. 67. La similitude entre l'élément 2 et l'élément 1 est la même. Ainsi, il s'agit d'une image en miroir à travers la diagonale de la partie inférieure gauche à la partie supérieure droite. Vous pouvez également voir que l'élément 6 n'est pas similaire aux autres éléments parce qu'il a une valeur de 0. Cette implémentation d'un système de recommandation basé sur des items est simplifiée pour illustrer son fonctionnement. Pour plus de simplicité, n'utilisez qu'un seul critère pour déterminer la similarité des articles: si l'utilisateur a acheté l'article.
Utilisation de profils créés par les utilisateurs qui représentent leurs goûts
Prise en compte du nombre d'utilisateurs (ou de tarifs élevés) d'un article
-
Pesant le nombre d'articles achetés par l'utilisateur similaire au (x) élément (s) potentiel (s) recommandé (s)
-
Hypothèses sur le fait qu'un utilisateur aime un article en fonction de la simple consultation de l'article, même si aucun achat n'a été effectué.
-
Voici deux façons courantes utilisez ce système de recommandation:
-
Hors ligne via une campagne de marketing par e-mail ou si l'internaute est connecté.
Le système peut envoyer des publicités marketing ou faire des recommandations sur le site:
-
Article 3 au client B
Recommandé parce que le client B a acheté les articles 1 et 2 et que les deux articles sont similaires à l'article 3.
-
article 4, puis article 2, client C
recommandé parce que le client C a acheté les articles 3 et 5 L'article 5 est similaire à l'article 4 (valeur de similarité: 0. 82). Le point 2 est similaire au point 3 (valeur de similarité: 0. 45).
-
Article 2 au client D
Recommandé parce que le client D a acheté les articles 3, 4 et 5. L'article 3 est semblable à l'article 2.
-
Article 1 au client E
Recommandé parce que le client E a acheté des articles 2 et 3, les deux sont similaires à l'article 1.
-
Article 3 au client F
Recommandé parce que le client F a acheté les articles 1, 2, 4 et 5. Les articles 1, 2 et 5 sont similaires à l'article 3.
-
Article 2 au client G
Recommandé parce que le client G a acheté les articles 1 et 3. Ils sont tous deux semblables à l'article 2.
-
Article 2, puis article 3, au client H
Recommandé parce que le client H acheté Article 1. L'article 1 est similaire aux articles 2 et 3.
-
Article indéterminé pour le client A
Idéalement, vous devriez avoir beaucoup plus d'articles et d'utilisateurs. De plus, certains articles achetés par un client ressemblent à d'autres articles qu'il n'a pas encore achetés.
-
Article indéterminé pour le client I
Dans ce cas, les données sont insuffisantes pour servir de base à une recommandation. Ceci est un exemple du problème de démarrage à froid.
-
En ligne via une page vue lorsque l'utilisateur n'est pas connecté.
-