Accueil Finances personnelles Phase 4 du modèle de processus CRISP-DM: Modélisation - nuls

Phase 4 du modèle de processus CRISP-DM: Modélisation - nuls

Table des matières:

Vidéo: Part 2 | Data Analytics for Beginners | Analytics Lifecycle 2025

Vidéo: Part 2 | Data Analytics for Beginners | Analytics Lifecycle 2025
Anonim

La modélisation est la partie du modèle de processus intersectoriel standard pour l'exploration de données (CRISP-DM) que la plupart des données les mineurs aiment le mieux. Vos données sont déjà en bon état et vous pouvez désormais rechercher des modèles utiles dans vos données.

La phase de modélisation comprend quatre tâches. Ce sont

  • Sélection des techniques de modélisation

  • Conception du (des) test (s)

  • Modèle (s) de construction

  • Évaluation du (des) modèle (s)

Tâche: sélectionner des techniques de modélisation

Le monde merveilleux de l'exploration de données offre des tas de techniques de modélisation, mais toutes ne répondent pas à vos besoins. Affinez la liste en fonction des types de variables impliquées, de la sélection des techniques disponibles dans vos outils et de toutes les considérations commerciales importantes pour vous.

Par exemple, de nombreuses organisations privilégient les méthodes dont les résultats sont faciles à interpréter, de sorte que les arbres de décision ou la régression logistique pourraient être acceptables, mais les réseaux de neurones ne seraient probablement pas acceptés.

Les livrables pour cette tâche comprennent deux rapports:

  • Technique de modélisation: Précisez la ou les techniques que vous utiliserez.

  • Hypothèses de modélisation: De nombreuses techniques de modélisation reposent sur certaines hypothèses. Par exemple, un type de modèle peut être destiné à être utilisé avec des données ayant un type de distribution spécifique. Documentez ces hypothèses dans ce rapport.

Les statisticiens sont bien informés, stricts et pointilleux sur les hypothèses. Ce n'est pas nécessairement vrai pour les mineurs de données, et ce n'est pas une obligation de devenir un mineur de données. Si vous avez une connaissance statistique approfondie et comprenez les hypothèses derrière les modèles que vous sélectionnez, vous pouvez être strict et difficile sur les hypothèses.

Mais beaucoup de mineurs de données, en particulier les mineurs de données novices, ne se soucient guère des hypothèses. L'alternative est de tester - beaucoup et beaucoup de tests - de vos modèles.

Tâche: Conception de tests

Le test de cette tâche est le test que vous utiliserez pour déterminer le fonctionnement de votre modèle. Cela peut être aussi simple que de diviser vos données en un groupe de cas pour la formation sur modèle et un autre groupe pour le test de modèle.

Les données d'apprentissage sont utilisées pour ajuster les formes mathématiques au modèle de données, et les données de test sont utilisées pendant le processus d'apprentissage pour éviter un surajustement: faire un modèle parfait pour un ensemble de données. Vous pouvez également utiliser des données holdout, données qui ne sont pas utilisées pendant le processus de formation de modèle, pour un test supplémentaire.

Le produit livrable pour cette tâche est votre conception de test. Cela n'a pas besoin d'être compliqué, mais vous devez au moins veiller à ce que vos données de formation et de test soient similaires et à ce que vous évitiez d'introduire des biais dans les données.

Tâche: Modèle (s) de construction

La modélisation est ce que beaucoup de gens imaginent être l'ensemble du travail du data miner, mais ce n'est qu'une tâche parmi des dizaines! Néanmoins, la modélisation pour répondre à des objectifs métier spécifiques est le cœur de la profession d'exploration de données.

Les éléments livrables pour cette tâche comprennent trois éléments:

  • Paramètres des paramètres: Lors de la création de modèles, la plupart des outils vous permettent d'ajuster différents paramètres et ces paramètres ont un impact sur la structure du modèle final. Documentez ces paramètres dans un rapport.

  • Descriptions de modèles: Décrivez vos modèles. Indiquez le type de modèle (tel que la régression linéaire ou le réseau de neurones) et les variables utilisées. Expliquer comment le modèle est interprété. Documenter les difficultés rencontrées dans le processus de modélisation.

  • Modèles: Ce livrable correspond aux modèles eux-mêmes. Certains types de modèles peuvent être facilement définis avec une équation simple; d'autres sont beaucoup trop complexes et doivent être transmis dans un format plus sophistiqué.

Tâche: évaluation du (des) modèle (s)

Vous allez maintenant passer en revue les modèles que vous avez créés, d'un point de vue technique et commercial (souvent avec des experts métier de votre équipe de projet).

Les livrables de cette tâche incluent deux rapports:

  • Évaluation du modèle: Résume les informations développées dans votre revue de modèle. Si vous avez créé plusieurs modèles, vous pouvez les classer en fonction de votre évaluation de leur valeur pour une application spécifique.

  • Paramètres modifiés: Vous pouvez choisir d'ajuster les paramètres qui ont servi à construire le modèle et d'effectuer un autre cycle de modélisation, et essayer d'améliorer vos résultats.

L'extraction de données, comme un oignon, un Dobos torte ou un rocher sédimentaire, a beaucoup de couches. Lorsque vous commencez tout juste à démarrer l'exploration de données, vous pouvez commencer en laissant les paramètres à leurs valeurs par défaut (en fait, vous ne remarquerez peut-être même pas les options à moins que vous ne cherchiez à les rechercher).

À mesure que vous vous sentez à l'aise dans votre nouvelle carrière d'exploration de données, il vous sera utile de connaître les paramètres du modèle et de savoir comment vous pouvez les utiliser. Vos options varient considérablement avec le type de modèle et l'outil spécifique que vous utilisez.

Phase 4 du modèle de processus CRISP-DM: Modélisation - nuls

Le choix des éditeurs

: Utilisation de l'équation du cercle standard - dummies

: Utilisation de l'équation du cercle standard - dummies

Si vous avez une question SAT Examen de mathématiques qui vous donne l'équation d'un cercle, vous aurez probablement besoin de convertir cette équation à l'équation du cercle standard. Les questions pratiques suivantes vous donnent l'équation d'un cercle et vous demandent de trouver son rayon et son centre. Questions d'entraînement Questions 1 et ...

SAT Pratique Mathématiques Questions: Séquences arithmétiques et géométriques - mannequins

SAT Pratique Mathématiques Questions: Séquences arithmétiques et géométriques - mannequins

Mathématiques implique parfois de reconnaître des schémas et de voir où ces modèles mènent. Le SAT vous demande parfois de jouer au mathématicien avec deux types de motifs: arithmétique et géométrique. Le mot mathématique pour le motif, en passant, est la séquence. Découvrez cette séquence arithmétique: 2, 5, 8, 11, 14 ... Notez que chaque nombre est ...

SAT Exercice de maths-FOIL Operations - mannequins

SAT Exercice de maths-FOIL Operations - mannequins

L'examen de mathématiques SAT vous posera quelques questions Vous devez savoir comment exécuter une opération FOIL, où vous multipliez un polynôme dans l'ordre: Premier, Extérieur, Intérieur et Dernier. Les questions de pratique suivantes vous demandent de trouver le produit de deux binômes et la valeur d'une variable en utilisant ...

Le choix des éditeurs

Prier le Rosaire et méditer sur les Mystères - mannequins

Prier le Rosaire et méditer sur les Mystères - mannequins

Selon la pieuse tradition catholique, au 13ème siècle Marie, la Mère de Dieu, est apparue à saint Dominique de Guzman, lui a donné un chapelet et a demandé qu'au lieu de prier les Psaumes sur des perles ou des noeuds, les fidèles prient l'Ave Maria, Notre Père et la Gloire soit. Quinze décennies ont constitué l'origine dominicaine ...

Dix choses à savoir sur le pape Benoît XVI - Paroisse

Dix choses à savoir sur le pape Benoît XVI - Paroisse

Le pape Benoît XVI a été élu en 2007 par le Collège des Cardinaux, et il a démissionné en 2012. Les controverses faisaient partie de son mandat. Il était le 265e pape de l'histoire de l'Église catholique romaine et le premier à démissionner en près de 600 ans.

La Réforme et l'Église Catholique - mannequins

La Réforme et l'Église Catholique - mannequins

Au Moyen Âge, la philosophie grecque (incarnée par Platon et Aristote ) a été utilisé pour aider à développer un chrétien, qui est devenu partenaire de la théologie sacrée. La langue latine était connue et utilisée - principalement dans des contextes religieux et juridiques. Les arts libéraux et les sciences religieuses ont été les principaux piliers de l'éducation universitaire et de la chrétienté ...

Le choix des éditeurs

Comment fonctionne BPaaS dans le monde réel du Cloud Computing - les nuls

Comment fonctionne BPaaS dans le monde réel du Cloud Computing - les nuls

Si vous avez décidé de utiliser BPaaS (Business Process as a Service) dans un modèle de cloud hybride en tant que plate-forme de prestation de services, vous devez comprendre comment combiner des services en fonction des processus que vous souhaitez exécuter. Comme le montre la figure suivante, un service de processus métier peut être lié à divers ...

Développer un environnement Cloud hybride sécurisé - des mannequins

Développer un environnement Cloud hybride sécurisé - des mannequins

Une approche réfléchie de la sécurité peut réussir à atténuer de nombreux risques de sécurité dans un environnement de cloud hybride. Pour développer un environnement hybride sécurisé, vous devez évaluer l'état actuel de votre stratégie de sécurité ainsi que la stratégie de sécurité proposée par votre fournisseur de cloud. Évaluer votre état actuel de sécurité Dans un environnement hybride, la sécurité ...

Gestion des charges de travail dans un modèle de cloud hybride - mannequins

Gestion des charges de travail dans un modèle de cloud hybride - mannequins

Modèle de nuage. La gestion, dans ce contexte, fait référence à la manière dont les ressources sont affectées pour traiter les charges de travail. Les affectations peuvent être basées sur la disponibilité des ressources, les priorités métier ou la planification d'événements. Dans l'ère de l'informatique mainframe unifiée, la gestion de la charge de travail était assez simple. Quand une tâche ...