Accueil Finances personnelles Data Mining - nuls

Data Mining - nuls

Table des matières:

Vidéo: Data Mining: How You're Revealing More Than You Think 2025

Vidéo: Data Mining: How You're Revealing More Than You Think 2025
Anonim

Comparé à l'interrogation, à la création de rapports ou même à OLAP, vous pouvez obtenir des informations sans avoir à poser de questions spécifiques.

L'exploration de données joue deux rôles principaux dans votre mission de business intelligence:

  • Le rôle "Dites-moi ce qui peut arriver": Le premier rôle de l'exploration de données est prédictif. pourrait arriver. "En utilisant des connaissances cachées dans votre entrepôt de données, les probabilités et la probabilité de tendances et d'occurrences futures vous sont présentées et présentées.

  • Le rôle "Dites-moi quelque chose d'intéressant": En plus des événements et occurrences futurs possibles, l'exploration de données tente également d'extraire des informations intéressantes que vous devriez probablement connaître, telles que relation inhabituelle entre les ventes de deux produits différents et comment cette relation varie selon le placement dans vos magasins de détail.

    Bien que bon nombre de ces informations intéressantes soient susceptibles d'exister, quelles questions poseriez-vous si vous utilisiez un outil d'interrogation ou d'OLAP, et comment interpréteriez-vous les résultats? Data mining vous aide dans cette tâche ardue de déterminer quelles questions poser en faisant une grande partie du travail de grognement pour vous.

Extraction de données dans des missions commerciales spécifiques

L'exploration de données est particulièrement adaptée à ces types de missions commerciales spécifiques:

  • Détection de fraude

  • Détermination de l'efficacité du programme marketing

  • une clientèle importante ou la population générale, vous devriez cibler dans le cadre d'un programme de marketing

  • Gestion du cycle de vie du client, y compris la mission de fidélisation de la clientèle

  • Exécution de scénarios de simulation et de scénarios de processus métier avancés

Pensez à ce qui se cache derrière chacune des missions de la liste précédente:

  • Une grande quantité de données

  • Une taille encore plus grande nombre de combinaisons de diverses données

  • Analyse intensive des ensembles de résultats, impliquant généralement des algorithmes complexes et des techniques statistiques avancées

Maintenant, réfléchissez à ce que vous auriez à faire si vous utilisiez un outil de reporting ou OLAP pour accomplir ces missions. Vous trouveriez quasiment impossible d'exécuter complètement l'une des missions précédentes si vous deviez poser une question et obtenir un résultat, poser une autre question et obtenir un autre résultat, puis répéter ces étapes.

Exploration de données et intelligence artificielle

Si vous êtes dans le domaine des technologies de l'information (TI) depuis au moins une décennie, certains des termes précédents peuvent sembler vaguement familiers.Débloquer des connaissances cachées? Fonctionnalité prédictive? Attendez une minute - c'est de l'intelligence artificielle!

Dès les premiers jours de l'informatique commerciale, il y a eu un énorme intérêt à développer des «machines à penser» capables de traiter de grandes quantités de données et de prendre des décisions basées sur cette analyse.

L'intérêt pour l'intelligence artificielle (IA) a atteint son apogée au milieu des années 1980. À cette époque, les fournisseurs de bases de données travaillaient à la production de systèmes de gestion de base de connaissances (SGB); d'autres fournisseurs ont sorti des shells de systèmes experts, ou des frameworks de développement d'applications basés sur l'intelligence artificielle qui utilisaient des techniques telles que le chaînage en aval et le chaînage en retour pour conseiller les utilisateurs sur les décisions; et les réseaux de neurones ont été positionnés comme le prochain grand développement de l'IA.

L'intérêt pour l'intelligence artificielle a diminué au début des années 1990, lorsque les attentes dépassaient les capacités disponibles et que d'autres frénésies, comme la migration client / serveur et (bien sûr) l'entreposage de données, occupaient une place centrale.

Maintenant, l'IA est de retour!

La technique AI la plus utilisée dans l'exploration de données est celle des réseaux de neurones. À l'origine, les réseaux neuronaux étaient envisagés comme un modèle de traitement qui imiterait la façon dont le cerveau humain résout les problèmes, en utilisant des neurones et un traitement hautement parallèle pour résoudre les problèmes.

L'application d'algorithmes de réseau de neurones aux domaines de l'informatique décisionnelle que gère le data mining (encore une fois, des missions prédictives et des missions «dites-moi quelque chose d'intéressant») semble être une solution naturelle.

Bien que le jeu de data mining / réseau de neurones mérite d'être vérifié, vous devriez le faire avec précaution. Vous pouvez trouver beaucoup de technologies intéressantes et passionnantes qui, entre les mains de ceux qui ne comprennent pas les algorithmes, échoueront probablement.

Toutefois, avec les connaissances et l'éducation appropriées, vous pouvez vous engager à intégrer ce type de traitement dans votre cadre de business intelligence en tant qu'appariement d'analyse technique pour l'analyse métier OLAP.

Exploration de données et statistiques

Le domaine le plus avancé de l'exploration de données est l'application de techniques statistiques avancées par rapport aux volumes importants de données de votre entrepôt de données. Différents outils utilisent différents types de techniques statistiques, adaptés aux domaines particuliers qu'ils essaient d'aborder.

Sans arrière-plan statistique, vous risquez d'être dérouté par une grande partie de l'exploration de données. Vous devez faire beaucoup de travail pour former les algorithmes et construire les règles pour assurer des résultats corrects avec des ensembles de données plus volumineux. Cependant, en supposant que vous soyez à l'aise avec ce concept, ou ayez un collègue qui peut vous aider, voici quelques-uns des algorithmes les plus répandus:

  • Algorithmes de classification: Prédire une ou plusieurs variables discrètes, basées sur l'autre attributs dans l'ensemble de données. En utilisant des algorithmes de classification, l'outil d'exploration de données peut examiner de grandes quantités de données et vous informer que, par exemple, «Les clients qui sont conservés pendant au moins deux générations d'achats de produits ont généralement ces caractéristiques: Ils ont un revenu de 75 000 $, et ils possèdent leur propre maison."

  • Algorithmes de régression: Prédit une ou plusieurs variables continues, telles que le profit ou la perte, basées sur d'autres attributs de l'ensemble de données. Les algorithmes de régression sont guidés par les informations historiques présentées à l'outil d'exploration de données «au fil du temps», mieux connues sous le nom d'informations séries temporelles .

  • Algorithmes de segmentation: Divisez les données en groupes ou en groupes d'éléments ayant des propriétés similaires.

  • Algorithmes d'association: Trouvez des corrélations entre différents attributs dans un ensemble de données. L'application la plus courante de ce type d'algorithme crée des règles d'association, que vous pouvez utiliser dans une analyse de panier de consommation. Notez que, par exemple, si un client achète un progiciel particulier, il a 65% de chances d'acheter au moins deux packs d'extension spécifiques au produit dans un délai de deux semaines.

  • Algorithmes d'analyse de séquence: Résumez des séquences ou des épisodes fréquents dans les données, tels qu'un flux de chemin Web.

Beaucoup d'autres méthodes existent. Dépoussiérer ce vieux livre de statistiques et commencer à lire.

Data Mining - nuls

Le choix des éditeurs

Pour les seniors: Comment travailler avec Windows dans Microsoft Windows - les nuls

Pour les seniors: Comment travailler avec Windows dans Microsoft Windows - les nuls

Windows, avec un W majuscule, tire son nom de sa caractéristique principale: Windows, avec un w minuscule. Se familiariser avec Windows signifie apprendre à ouvrir, fermer, redimensionner, déplacer et basculer entre les fenêtres, ce qui est la clé pour jongler avec succès avec plusieurs activités. Chaque programme que vous exécutez occupe sa propre fenêtre. Une fenêtre peut occuper une partie de ...

Comment accepter ou rejeter les cookies dans Safari - dummies

Comment accepter ou rejeter les cookies dans Safari - dummies

Un cookie est un petit fichier qu'un site Web enregistre automatiquement sur le disque dur de votre Mac. Il contient des informations, telles que vos préférences ou votre date de naissance, que le site utilisera lors de vos prochaines visites. Dans Mac OS X Snow Leopard, Safari vous permet de choisir d'accepter ou non tous les cookies ...

Le choix des éditeurs

Construire des boîtes et des lignes Bézier dans QuarkXPress - des nuls

Construire des boîtes et des lignes Bézier dans QuarkXPress - des nuls

Pour créer une boîte ou une ligne dans QuarkXPress plus complexe qu'un simple rectangle, ovale ou starburst, vous entrez dans le domaine du chemin de Bézier. Si vous avez utilisé l'outil Plume dans Adobe Illustrator ou Photoshop, vous comprenez déjà les chemins de Bézier. Il faut un peu de pratique et un esprit détendu ...

Création d'un rapport avec Crystal Reports 10 - témoins

Création d'un rapport avec Crystal Reports 10 - témoins

Lorsque vous démarrez Crystal Reports 10, généralement l'une des trois choses suivantes: créer un rapport, modifier un rapport ou exécuter un rapport sur les données de votre base de données. Les rapports prennent des données à partir d'une base de données, les traitent, les formatent et les affichent ensuite sur une imprimante, un écran d'ordinateur ou un site Web. Crystal Reports ...

Traitant des commentaires Javadoc dans Eclipse - mannequins

Traitant des commentaires Javadoc dans Eclipse - mannequins

Lorsque vous utilisez Eclipse pour écrire du code Java, n'oubliez pas de éditez les commentaires de Javadoc (les choses qui commencent par / **). Vous pouvez ajouter des informations utiles lorsque vous modifiez les commentaires Javadoc et lorsque vous les modifiez, l'aide au code d'Eclipse propose des suggestions. N'oubliez pas ces astuces lorsque vous modifiez vos commentaires Javadoc: Ajouter un commentaire Javadoc: ...

Le choix des éditeurs

Les connexions cachées sur le Nikon D5600 - les nuls

Les connexions cachées sur le Nikon D5600 - les nuls

Ouvrent les couvercles sur les côtés gauche et droit du Nikon D5600 caméra, et vous verrez plusieurs ports de connexions cachées. Les ports de connexion suivants sont indiqués sur cette image: Terminal d'accessoires: ce terminal accepte les accessoires suivants: câble déclencheur à distance Nikon MC-DC2; Télécommandes sans fil WR-1 et WR-R10; et les unités GPS GP-1 / GP-1A. I ...

Les connexions cachées sur votre Nikon D5200 - les nuls

Les connexions cachées sur votre Nikon D5200 - les nuls

ÉParpillés sur l'extérieur de votre appareil photo sont nombreuses commandes que vous utilisez pour changer d'image -prend des paramètres, revoir et modifier vos photos, et effectuer diverses autres opérations. Caché sous le couvercle sur le côté gauche de la caméra, vous trouverez les quatre ports de connexion suivants, étiquetés dans cette figure: Borne accessoire: Vous pouvez brancher le Nikon en option ...

Des boutons et autres commandes du Nikon D7500 - mannequins

Des boutons et autres commandes du Nikon D7500 - mannequins

C'est génial d'avoir une carte pour le boutons et commandes sur votre appareil photo, mais ce n'est pas beaucoup d'aide si vous ne pouvez pas vous rappeler quel bouton appuyer sur quand (et pourquoi). Alors, voici un aperçu des fonctions des contrôles les plus importants. (Certains contrôles ont des fonctions supplémentaires pendant certaines opérations, mais la table ...