Accueil Finances personnelles Phase 4 du modèle de processus CRISP-DM: Modélisation - nuls

Phase 4 du modèle de processus CRISP-DM: Modélisation - nuls

Table des matières:

Vidéo: Part 2 | Data Analytics for Beginners | Analytics Lifecycle 2024

Vidéo: Part 2 | Data Analytics for Beginners | Analytics Lifecycle 2024
Anonim

La modélisation est la partie du modèle de processus intersectoriel standard pour l'exploration de données (CRISP-DM) que la plupart des données les mineurs aiment le mieux. Vos données sont déjà en bon état et vous pouvez désormais rechercher des modèles utiles dans vos données.

La phase de modélisation comprend quatre tâches. Ce sont

  • Sélection des techniques de modélisation

  • Conception du (des) test (s)

  • Modèle (s) de construction

  • Évaluation du (des) modèle (s)

Tâche: sélectionner des techniques de modélisation

Le monde merveilleux de l'exploration de données offre des tas de techniques de modélisation, mais toutes ne répondent pas à vos besoins. Affinez la liste en fonction des types de variables impliquées, de la sélection des techniques disponibles dans vos outils et de toutes les considérations commerciales importantes pour vous.

Par exemple, de nombreuses organisations privilégient les méthodes dont les résultats sont faciles à interpréter, de sorte que les arbres de décision ou la régression logistique pourraient être acceptables, mais les réseaux de neurones ne seraient probablement pas acceptés.

Les livrables pour cette tâche comprennent deux rapports:

  • Technique de modélisation: Précisez la ou les techniques que vous utiliserez.

  • Hypothèses de modélisation: De nombreuses techniques de modélisation reposent sur certaines hypothèses. Par exemple, un type de modèle peut être destiné à être utilisé avec des données ayant un type de distribution spécifique. Documentez ces hypothèses dans ce rapport.

Les statisticiens sont bien informés, stricts et pointilleux sur les hypothèses. Ce n'est pas nécessairement vrai pour les mineurs de données, et ce n'est pas une obligation de devenir un mineur de données. Si vous avez une connaissance statistique approfondie et comprenez les hypothèses derrière les modèles que vous sélectionnez, vous pouvez être strict et difficile sur les hypothèses.

Mais beaucoup de mineurs de données, en particulier les mineurs de données novices, ne se soucient guère des hypothèses. L'alternative est de tester - beaucoup et beaucoup de tests - de vos modèles.

Tâche: Conception de tests

Le test de cette tâche est le test que vous utiliserez pour déterminer le fonctionnement de votre modèle. Cela peut être aussi simple que de diviser vos données en un groupe de cas pour la formation sur modèle et un autre groupe pour le test de modèle.

Les données d'apprentissage sont utilisées pour ajuster les formes mathématiques au modèle de données, et les données de test sont utilisées pendant le processus d'apprentissage pour éviter un surajustement: faire un modèle parfait pour un ensemble de données. Vous pouvez également utiliser des données holdout, données qui ne sont pas utilisées pendant le processus de formation de modèle, pour un test supplémentaire.

Le produit livrable pour cette tâche est votre conception de test. Cela n'a pas besoin d'être compliqué, mais vous devez au moins veiller à ce que vos données de formation et de test soient similaires et à ce que vous évitiez d'introduire des biais dans les données.

Tâche: Modèle (s) de construction

La modélisation est ce que beaucoup de gens imaginent être l'ensemble du travail du data miner, mais ce n'est qu'une tâche parmi des dizaines! Néanmoins, la modélisation pour répondre à des objectifs métier spécifiques est le cœur de la profession d'exploration de données.

Les éléments livrables pour cette tâche comprennent trois éléments:

  • Paramètres des paramètres: Lors de la création de modèles, la plupart des outils vous permettent d'ajuster différents paramètres et ces paramètres ont un impact sur la structure du modèle final. Documentez ces paramètres dans un rapport.

  • Descriptions de modèles: Décrivez vos modèles. Indiquez le type de modèle (tel que la régression linéaire ou le réseau de neurones) et les variables utilisées. Expliquer comment le modèle est interprété. Documenter les difficultés rencontrées dans le processus de modélisation.

  • Modèles: Ce livrable correspond aux modèles eux-mêmes. Certains types de modèles peuvent être facilement définis avec une équation simple; d'autres sont beaucoup trop complexes et doivent être transmis dans un format plus sophistiqué.

Tâche: évaluation du (des) modèle (s)

Vous allez maintenant passer en revue les modèles que vous avez créés, d'un point de vue technique et commercial (souvent avec des experts métier de votre équipe de projet).

Les livrables de cette tâche incluent deux rapports:

  • Évaluation du modèle: Résume les informations développées dans votre revue de modèle. Si vous avez créé plusieurs modèles, vous pouvez les classer en fonction de votre évaluation de leur valeur pour une application spécifique.

  • Paramètres modifiés: Vous pouvez choisir d'ajuster les paramètres qui ont servi à construire le modèle et d'effectuer un autre cycle de modélisation, et essayer d'améliorer vos résultats.

L'extraction de données, comme un oignon, un Dobos torte ou un rocher sédimentaire, a beaucoup de couches. Lorsque vous commencez tout juste à démarrer l'exploration de données, vous pouvez commencer en laissant les paramètres à leurs valeurs par défaut (en fait, vous ne remarquerez peut-être même pas les options à moins que vous ne cherchiez à les rechercher).

À mesure que vous vous sentez à l'aise dans votre nouvelle carrière d'exploration de données, il vous sera utile de connaître les paramètres du modèle et de savoir comment vous pouvez les utiliser. Vos options varient considérablement avec le type de modèle et l'outil spécifique que vous utilisez.

Phase 4 du modèle de processus CRISP-DM: Modélisation - nuls

Le choix des éditeurs

Utilisant le mode rafale: La photographie d'action des mannequins

Utilisant le mode rafale: La photographie d'action des mannequins

Canon EOS Rebel T1i / 500D nécessite un vitesse d'obturation rapide - et un doigt de déclenchement rapide. Heureusement, le Canon EOS Digital Rebel a un mode Drive (ou Burst), qui enregistre une série continue d'images tant que vous maintenez le bouton de l'obturateur enfoncé. Si vous voulez obtenir de superbes photos d'un sujet en mouvement rapide, le mode Drive ...

En utilisant le mode en direct (détection de visage) sur votre Canon EOS Rebel T6 / 1300

En utilisant le mode en direct (détection de visage) sur votre Canon EOS Rebel T6 / 1300

Lorsque vous activez ce mode, le Rebel T6 recherche les visages dans le cadre. Vous devrez peut-être appuyer brièvement sur le déclencheur pour réactiver l'appareil photo avant que la fonction de détection de visage ne s'enclenche. Si un visage est détecté, l'appareil photo affiche un cadre de mise au point sur le visage, comme indiqué sur ...

En utilisant les modes automatiques sur votre Canon EOS Rebel T3 / 1100D - mannequins

En utilisant les modes automatiques sur votre Canon EOS Rebel T3 / 1100D - mannequins

Pour le plus automatique de la photographie automatique, permettant aux personnes ayant une expérience minimale de capturer de belles images, réglez votre sélecteur de mode Canon EOS Rebel T3 / 1100D sur l'un des deux paramètres suivants: Auto complet: Le nom de ce mode, indiqué dans la figure suivante, indique que le l'appareil photo prend le contrôle total de toutes les expositions, luminosité, flash, ...

Le choix des éditeurs

5 Bons contrôles comptables qui minimisent le vol - les nuls

5 Bons contrôles comptables qui minimisent le vol - les nuls

Voici un résumé de cinq techniques puissantes pour minimiser les problèmes surgissez lorsque vous avez des personnes ayant des niveaux de compétence et de fiabilité différents qui travaillent avec vos données QuickBooks: Comparez régulièrement les inventaires physiques avec les enregistrements de comptabilité d'inventaire. Une des choses que vous pouvez faire, à la fois pour minimiser vos pertes d'inventaire et ...

6 Astuces pour utiliser la stratégie avec QuickBooks - les nuls

6 Astuces pour utiliser la stratégie avec QuickBooks - les nuls

Si vous utilisez QuickBooks pour vous aider à mettre en place une stratégie pratique, il y a quelques choses que vous pourriez vouloir considérer. Assurez-vous de bien comprendre ces points clés: Connaissez les trois stratégies. Habituellement, une entreprise ne peut avoir qu'une stratégie commerciale sur trois: Stratégie basée sur les coûts Stratégie basée sur la différenciation Stratégie axée sur les objectifs Choisissez une stratégie. ...

5 Astuces pour simplifier l'installation de QuickBooks 2014 - les nuls

5 Astuces pour simplifier l'installation de QuickBooks 2014 - les nuls

Si vous êtes une petite entreprise configurant QuickBooks Logiciel de comptabilité 2014, vous apprécierez ces cinq conseils utiles. Minimisez le processus d'installation de QuickBooks avec ces astuces et techniques, et vous obtiendrez une conclusion rapide et réussie. Astuce # 1 de QuickBooks: Convertir en QuickBooks à compter du 1er janvier Convertir en un nouveau système de comptabilité dès le début ...

Le choix des éditeurs

Logique Puzzles pour garder votre esprit net - les mannequins

Logique Puzzles pour garder votre esprit net - les mannequins

Mettent votre casse-tête pour résoudre ces énigmes logiques! Chacun a juste une réponse. Les niveaux sont faciles, délicats, durs et traîtres, «facile» étant (bien sûr) les puzzles les plus faciles, et «traître» étant les plus difficiles. Facile: Combien de fois un mathématicien peut-il soustraire dix de 100? Facile: Déchiffrez cet indice: YYYMEN Tricky: Une femme ...

Maintien de la stabilité de l'humeur dans les troubles bipolaires - mannequins

Maintien de la stabilité de l'humeur dans les troubles bipolaires - mannequins

Plan thérapeutique global qu'une personne atteinte de trouble bipolaire doit suivre et maintenir la stabilité de l'humeur est assez simple. Suivez ce plan de traitement: Prenez vos médicaments tels que prescrits, même lorsque vous vous sentez bien, et consultez votre médecin avant de faire des changements de médicaments. Établir des routines qui assurent un horaire régulier de veille-sommeil. Manque de qualité ...

Faire un pré-accord pour recevoir un traitement pour trouble bipolaire - les variables nominales

Faire un pré-accord pour recevoir un traitement pour trouble bipolaire - les variables nominales

En pleine Manie ou dépression, une personne peut ne pas penser assez clairement pour se faire soigner et peut même refuser le traitement nécessaire. Les êtres chers veulent faire ce qu'il y a de mieux, mais ils hésitent souvent, ne sachant pas quand intervenir et quoi faire. Devraient-ils appeler votre médecin ou votre thérapeute ou vous conduire?