Table des matières:
- Extraction de données dans des missions commerciales spécifiques
- Exploration de données et intelligence artificielle
- Exploration de données et statistiques
Vidéo: Data Mining: How You're Revealing More Than You Think 2024
Comparé à l'interrogation, à la création de rapports ou même à OLAP, vous pouvez obtenir des informations sans avoir à poser de questions spécifiques.
L'exploration de données joue deux rôles principaux dans votre mission de business intelligence:
-
Le rôle "Dites-moi ce qui peut arriver": Le premier rôle de l'exploration de données est prédictif. pourrait arriver. "En utilisant des connaissances cachées dans votre entrepôt de données, les probabilités et la probabilité de tendances et d'occurrences futures vous sont présentées et présentées.
-
Le rôle "Dites-moi quelque chose d'intéressant": En plus des événements et occurrences futurs possibles, l'exploration de données tente également d'extraire des informations intéressantes que vous devriez probablement connaître, telles que relation inhabituelle entre les ventes de deux produits différents et comment cette relation varie selon le placement dans vos magasins de détail.
Bien que bon nombre de ces informations intéressantes soient susceptibles d'exister, quelles questions poseriez-vous si vous utilisiez un outil d'interrogation ou d'OLAP, et comment interpréteriez-vous les résultats? Data mining vous aide dans cette tâche ardue de déterminer quelles questions poser en faisant une grande partie du travail de grognement pour vous.
Extraction de données dans des missions commerciales spécifiques
L'exploration de données est particulièrement adaptée à ces types de missions commerciales spécifiques:
-
Détection de fraude
-
Détermination de l'efficacité du programme marketing
-
une clientèle importante ou la population générale, vous devriez cibler dans le cadre d'un programme de marketing
-
Gestion du cycle de vie du client, y compris la mission de fidélisation de la clientèle
-
Exécution de scénarios de simulation et de scénarios de processus métier avancés
Pensez à ce qui se cache derrière chacune des missions de la liste précédente:
-
Une grande quantité de données
-
Une taille encore plus grande nombre de combinaisons de diverses données
-
Analyse intensive des ensembles de résultats, impliquant généralement des algorithmes complexes et des techniques statistiques avancées
Maintenant, réfléchissez à ce que vous auriez à faire si vous utilisiez un outil de reporting ou OLAP pour accomplir ces missions. Vous trouveriez quasiment impossible d'exécuter complètement l'une des missions précédentes si vous deviez poser une question et obtenir un résultat, poser une autre question et obtenir un autre résultat, puis répéter ces étapes.
Exploration de données et intelligence artificielle
Si vous êtes dans le domaine des technologies de l'information (TI) depuis au moins une décennie, certains des termes précédents peuvent sembler vaguement familiers.Débloquer des connaissances cachées? Fonctionnalité prédictive? Attendez une minute - c'est de l'intelligence artificielle!
Dès les premiers jours de l'informatique commerciale, il y a eu un énorme intérêt à développer des «machines à penser» capables de traiter de grandes quantités de données et de prendre des décisions basées sur cette analyse.
L'intérêt pour l'intelligence artificielle (IA) a atteint son apogée au milieu des années 1980. À cette époque, les fournisseurs de bases de données travaillaient à la production de systèmes de gestion de base de connaissances (SGB); d'autres fournisseurs ont sorti des shells de systèmes experts, ou des frameworks de développement d'applications basés sur l'intelligence artificielle qui utilisaient des techniques telles que le chaînage en aval et le chaînage en retour pour conseiller les utilisateurs sur les décisions; et les réseaux de neurones ont été positionnés comme le prochain grand développement de l'IA.
L'intérêt pour l'intelligence artificielle a diminué au début des années 1990, lorsque les attentes dépassaient les capacités disponibles et que d'autres frénésies, comme la migration client / serveur et (bien sûr) l'entreposage de données, occupaient une place centrale.
Maintenant, l'IA est de retour!
La technique AI la plus utilisée dans l'exploration de données est celle des réseaux de neurones. À l'origine, les réseaux neuronaux étaient envisagés comme un modèle de traitement qui imiterait la façon dont le cerveau humain résout les problèmes, en utilisant des neurones et un traitement hautement parallèle pour résoudre les problèmes.
L'application d'algorithmes de réseau de neurones aux domaines de l'informatique décisionnelle que gère le data mining (encore une fois, des missions prédictives et des missions «dites-moi quelque chose d'intéressant») semble être une solution naturelle.
Bien que le jeu de data mining / réseau de neurones mérite d'être vérifié, vous devriez le faire avec précaution. Vous pouvez trouver beaucoup de technologies intéressantes et passionnantes qui, entre les mains de ceux qui ne comprennent pas les algorithmes, échoueront probablement.
Toutefois, avec les connaissances et l'éducation appropriées, vous pouvez vous engager à intégrer ce type de traitement dans votre cadre de business intelligence en tant qu'appariement d'analyse technique pour l'analyse métier OLAP.
Exploration de données et statistiques
Le domaine le plus avancé de l'exploration de données est l'application de techniques statistiques avancées par rapport aux volumes importants de données de votre entrepôt de données. Différents outils utilisent différents types de techniques statistiques, adaptés aux domaines particuliers qu'ils essaient d'aborder.
Sans arrière-plan statistique, vous risquez d'être dérouté par une grande partie de l'exploration de données. Vous devez faire beaucoup de travail pour former les algorithmes et construire les règles pour assurer des résultats corrects avec des ensembles de données plus volumineux. Cependant, en supposant que vous soyez à l'aise avec ce concept, ou ayez un collègue qui peut vous aider, voici quelques-uns des algorithmes les plus répandus:
-
Algorithmes de classification: Prédire une ou plusieurs variables discrètes, basées sur l'autre attributs dans l'ensemble de données. En utilisant des algorithmes de classification, l'outil d'exploration de données peut examiner de grandes quantités de données et vous informer que, par exemple, «Les clients qui sont conservés pendant au moins deux générations d'achats de produits ont généralement ces caractéristiques: Ils ont un revenu de 75 000 $, et ils possèdent leur propre maison."
-
Algorithmes de régression: Prédit une ou plusieurs variables continues, telles que le profit ou la perte, basées sur d'autres attributs de l'ensemble de données. Les algorithmes de régression sont guidés par les informations historiques présentées à l'outil d'exploration de données «au fil du temps», mieux connues sous le nom d'informations séries temporelles .
-
Algorithmes de segmentation: Divisez les données en groupes ou en groupes d'éléments ayant des propriétés similaires.
-
Algorithmes d'association: Trouvez des corrélations entre différents attributs dans un ensemble de données. L'application la plus courante de ce type d'algorithme crée des règles d'association, que vous pouvez utiliser dans une analyse de panier de consommation. Notez que, par exemple, si un client achète un progiciel particulier, il a 65% de chances d'acheter au moins deux packs d'extension spécifiques au produit dans un délai de deux semaines.
-
Algorithmes d'analyse de séquence: Résumez des séquences ou des épisodes fréquents dans les données, tels qu'un flux de chemin Web.
Beaucoup d'autres méthodes existent. Dépoussiérer ce vieux livre de statistiques et commencer à lire.