Table des matières:
- Visualisation des regroupements cachés dans vos données
- Visualisation des résultats de la classification des données
- Visualisation des valeurs aberrantes dans vos données
- Visualisation des arbres de décision
- Visualisation des prédictions
Vidéo: SAS® Visual Analytics, retours d'expériences - Jérôme Cornillet, SAS France 2024
Souvent, vous devez être en mesure de montrer les résultats de vos analyses prédictives à ceux qui comptent. Voici quelques façons d'utiliser des techniques de visualisation pour rapporter les résultats de vos modèles aux parties prenantes.
Visualisation des regroupements cachés dans vos données
Le regroupement des données est le processus de découverte de groupes cachés d'éléments connexes dans vos données. Dans la plupart des cas, un cluster (regroupement) est constitué d'objets de données du même type, tels que des utilisateurs de réseaux sociaux, des documents texte ou des e-mails. Une façon de visualiser les résultats d'un modèle de clustering de données est présentée ci-dessous, où le graphique représente les communautés sociales (clusters) qui ont été découvertes dans des données collectées auprès d'utilisateurs de réseaux sociaux.
Les données sur les clients ont été collectées sous forme de tableau; Ensuite, un algorithme de classification a été appliqué aux données, et les trois groupes (groupes) ont été découverts: clients fidèles, clients errants et clients à prix réduit. Supposons que les axes X et Y représentent les deux composants principaux générés des données d'origine. L'analyse en composantes principales (ACP) est une technique de réduction des données.
Clustering des clients en trois groupes: fidèles, errants et discount.Ici, la relation visuelle entre les trois groupes suggère déjà où les efforts de marketing améliorés et ciblés pourraient faire le plus de bien.
Visualisation des résultats de la classification des données
Un modèle de classification attribue une classe spécifique à chaque nouveau point de données qu'il examine. Les classes spécifiques, dans ce cas, peuvent être les groupes résultant de votre travail de cluster. La sortie mise en évidence dans le graphique peut définir vos ensembles de cibles. Pour un nouveau client donné, un modèle de classification prédictif tente de prédire à quel groupe le nouveau client appartiendra.
Après avoir appliqué un algorithme de clustering et découvert des regroupements dans les données clients, vous arrivez à un moment de vérité: voici un nouveau client - vous voulez que le modèle prédise quel type de client il ou elle le sera.
L'image montre comment les informations d'un nouveau client sont transmises à votre modèle d'analyse prédictive, lequel prédit à son tour le groupe de clients auquel ce nouveau client appartient. Les nouveaux clients A, B et C sont sur le point d'être affectés aux clusters selon le modèle de classification. L'application du modèle de classification a permis de prédire que le client A appartiendrait aux clients fidèles, que le client B serait un voyageur, et que le client C ne se présenterait qu'à la remise.
Affectation des clients A, B et C à leurs classifications (clusters).Visualisation des valeurs aberrantes dans vos données
Dans le cadre du clustering ou du classement de nouveaux clients, vous rencontrez de temps en temps des valeurs aberrantes (cas spéciaux ne correspondant pas aux divisions existantes).
Vous trouverez ci-dessous quelques valeurs aberrantes qui ne correspondent pas aux clusters prédéfinis. Six clients aberrants ont été détectés et visualisés. Ils se comportent assez différemment que le modèle ne peut pas dire s'ils appartiennent à l'une des catégories définies de clients.
Six clients aberrants défient la catégorisation simplement en se présentant.Visualisation des arbres de décision
De nombreux modèles utilisent arbres de décision comme résultats: Ces diagrammes montrent les résultats possibles de plans d'action alternatifs, disposés comme les branches d'un arbre.
L'image ci-dessous montre un exemple d'arbre utilisé comme classificateur: Il classe les fans de baseball en fonction de quelques critères, principalement le montant dépensé pour les billets et les dates d'achat. À partir de cette visualisation, vous pouvez prédire le type de fan que sera un nouvel acheteur de billets: occasionnel, fidèle, train en marche, irréductible ou autre.
Les attributs de chaque fan sont mentionnés à chaque niveau de l'arbre (nombre total de parties jouées, montant total dépensé, saison); vous pouvez suivre un chemin d'une "racine" particulière à une "feuille" spécifique sur l'arbre, où vous frappez l'une des classes de ventilateur (c1, c2, c3, c4, c5).
Trouver la classe à laquelle appartient un fan de baseball particulier.Supposons que vous souhaitiez déterminer le type de fan de baseball d'un client afin de déterminer le type d'annonces marketing à envoyer au client. Supposons que vous supposiez que les fanatiques de baseball et les fans de train en marche peuvent être persuadés d'acheter une nouvelle voiture quand leur équipe se porte bien et se dirige vers les séries éliminatoires.
Vous souhaiterez peut-être envoyer des annonces marketing et des réductions pour les convaincre de procéder à l'achat. En outre, supposons que vous supposiez que les fans du train en marche puissent être persuadés de voter en faveur de certaines questions politiques. Vous pouvez leur envoyer des annonces marketing pour leur demander ce soutien. Si vous connaissez le type de base de fans que vous avez, l'utilisation d'arbres de décision peut vous aider à décider comment l'aborder en tant que gamme de types de clients.
Visualisation des prédictions
Supposons que vous ayez exécuté une série de modèles d'analyse prédictive, notamment des arbres de décision, des forêts aléatoires et des algorithmes de flocage. Vous pouvez combiner tous ces résultats et présenter un récit cohérent qu'ils soutiennent tous. Ici, la confiance est un pourcentage numérique qui peut être calculé en utilisant une fonction mathématique. Le résultat du calcul encapsule un score de la probabilité d'occurrence possible.
Sur l'axe des x, les preuves à l'appui représentent la source de contenu qui a été analysée avec des modèles d'analyse de contenu qui ont identifié les résultats possibles. Dans la plupart des cas, votre modèle prédictif aurait traité un grand ensemble de données, en utilisant des données provenant de diverses sources, pour obtenir ces résultats possibles. Ainsi, vous devez afficher uniquement les preuves les plus importantes dans votre visualisation.
Affichage uniquement des preuves les plus importantes dans la visualisation.Ci-dessus, un résumé des résultats obtenus en appliquant l'analyse prédictive est présenté comme une visualisation qui illustre les résultats possibles, avec un score de confiance et des preuves à l'appui pour chacun. Trois scénarios possibles sont affichés:
- L'inventaire de l'article A ne répondra pas à la demande si vous n'expédiez pas 100 unités par semaine au magasin S. (Indice de confiance: 98%.)
- Le nombre de ventes augmentera de 40% si vous augmentez la production de l'article A d'au moins 56%. (Indice de confiance: 83%.)
- Une campagne de marketing en Californie augmentera les ventes des articles A et D mais pas du produit K. (Indice de confiance: 72%)
Le score de confiance représente la probabilité que chaque scénario arriver, selon votre modèle d'analyse prédictive. Notez qu'ils sont listés ici dans l'ordre décroissant de vraisemblance.
Ici, les preuves à l'appui les plus importantes consistent en la manière dont les extraits de plusieurs sources de contenu sont présentés sur l'axe des x. Vous pouvez vous y référer si vous avez besoin d'expliquer comment vous êtes arrivé à un scénario possible particulier - et de tracer les preuves qui le soutiennent.
Le pouvoir derrière cette visualisation est sa simplicité. Imaginez, après des mois d'application de l'analyse prédictive à vos données, en vous frayant un chemin à travers plusieurs itérations, que vous marchiez dans une réunion avec le décideur. Vous êtes armé d'une visualisation par diapositive de trois scénarios possibles qui pourraient avoir un impact énorme sur l'entreprise. Une telle visualisation crée des discussions efficaces et peut conduire la direction à des moments «aha».