Accueil Finances personnelles Comment utiliser le modèle de Markov dans Predictive Analytics - mannequins

Comment utiliser le modèle de Markov dans Predictive Analytics - mannequins

Vidéo: Chaînes de Markov pour la recherche de gènes 2025

Vidéo: Chaînes de Markov pour la recherche de gènes 2025
Anonim

Le modèle de Markov est un modèle statistique qui peut être utilisé dans l'analyse prédictive reposant fortement sur la théorie des probabilités. (Il tire son nom d'un mathématicien russe dont la recherche principale portait sur la théorie des probabilités.)

Voici un scénario pratique qui illustre comment cela fonctionne: Imaginez que vous voulez prédire si l'équipe X va gagner le match de demain. La première chose à faire est de recueillir des statistiques antérieures sur l'équipe X. La question qui pourrait se poser est de savoir jusqu'où vous devriez retourner dans l'histoire?

Supposons que vous ayez réussi à atteindre les 10 derniers résultats du jeu en séquence. Vous voulez connaître la probabilité que l'équipe X remporte le prochain match compte tenu des résultats des 10 derniers matchs.

Le problème est que plus on avance dans l'histoire, plus la collecte des données et le calcul des probabilités deviennent complexes.

Croyez-le ou non, le modèle de Markov vous simplifie la vie en vous fournissant l' Hypothèse de Markov, qui ressemble à ceci lorsque vous l'écrivez en mots:

La probabilité qu'un événement se produise, compte tenu des événements passés n , est approximativement égale à la probabilité qu'un tel événement se produise juste pour le dernier événement passé.

Écrit en formule, l'hypothèse de Markov ressemble à ceci:

Dans tous les cas, l'hypothèse de Markov signifie que vous n'avez pas besoin d'aller trop loin dans l'histoire pour prédire les résultats de demain. Vous pouvez simplement utiliser l'événement passé le plus récent. C'est ce qu'on appelle la prédiction de premier ordre de Markov parce que vous ne tenez compte que du dernier événement pour prédire l'événement futur.

A La prédiction de Markov du second ordre inclut uniquement les deux derniers événements qui se déroulent en séquence. À partir de l'équation qui vient d'être donnée, on peut également déduire l'équation suivante:

Cette équation vise à calculer la probabilité que certains événements se produisent dans l'ordre: événement 1 après événement 2 , et ainsi de suite. Cette probabilité peut être calculée en multipliant la probabilité de chaque événement t (compte tenu de l'événement précédent) par l'événement suivant dans la séquence. Par exemple, supposons que vous vouliez prédire la probabilité que l'équipe X gagne, puis perd, puis lie.

Voici comment un modèle prédictif typique basé sur un modèle de Markov fonctionnerait. Prenons le même exemple: Supposons que vous vouliez prédire les résultats d'un match de football devant être joué par l'équipe X. Les trois résultats possibles - appelés états - sont victoire, perte ou égalité.

Supposons que vous ayez recueilli des données statistiques sur les résultats des matchs de football de l'équipe X, et que l'équipe X ait perdu sa partie la plus récente. Vous voulez prédire le résultat du prochain match de football. Il s'agit de deviner si l'équipe X va gagner, perdre ou égaliser - en se basant uniquement sur les données des jeux précédents. Alors, voici comment vous utilisez un modèle de Markov pour faire cette prédiction.

  1. Calculez des probabilités basées sur des données antérieures.

    Par exemple, combien de fois l'équipe X a-t-elle perdu des parties? Combien de fois l'équipe X a-t-elle gagné des matchs? Par exemple, imaginez si l'équipe X a remporté 6 matchs sur 10 au total. Ensuite, l'équipe X a gagné 60% du temps. En d'autres termes, la probabilité de gagner pour l'équipe X est de 60%.

  2. Calculez la probabilité d'une perte, puis la probabilité d'une égalité, de la même manière.

  3. Utilisez l'équation de probabilité Naïve Bayes pour calculer les probabilités suivantes:

    • Probabilité que l'équipe X gagne, étant donné que l'équipe X a perdu le dernier match.

    • La probabilité que l'équipe X perde, étant donné que l'équipe X a remporté le dernier match.

  4. Calculez les probabilités pour chaque état (victoire, perte ou égalité).

  5. En supposant que l'équipe ne joue qu'une partie par jour, les probabilités sont les suivantes:

    • P (Win | Perte) est la probabilité que l'équipe X va gagner aujourd'hui, étant donné qu'elle a perdu hier.

    • P (Win | Tie) est la probabilité que l'équipe X va gagner aujourd'hui, étant donné qu'elle a fait match nul hier.

    • P (Win | Win) est la probabilité que l'équipe X gagne aujourd'hui, étant donné qu'elle a gagné hier.

  6. En utilisant les probabilités calculées, créez un graphique.

    Un cercle dans ce tableau représente un état possible que l'équipe X peut atteindre à tout moment (victoire, défaite, égalité); les chiffres sur les flèches représentent les probabilités que l'équipe X puisse passer d'un état à un autre.

Par exemple, si l'équipe X vient de gagner le match d'aujourd'hui (son état actuel = victoire), la probabilité que l'équipe gagne à nouveau est de 60%; la probabilité qu'ils perdent le prochain match est de 20% (auquel cas ils passeraient de l'état actuel = victoire à l'état futur = perte).

Supposons que vous vouliez connaître les chances que l'équipe X remporte deux matchs consécutifs et en perd le troisième. Comme vous pouvez l'imaginer, ce n'est pas une prédiction simple à faire.

Cependant, en utilisant le graphique que vous venez de créer et l'hypothèse de Markov, vous pouvez facilement prédire les chances qu'un tel événement se produise. Vous commencez avec l'état de victoire, marchez à travers l'état de victoire encore, et enregistrez 60 pour cent; alors vous passez à l'état de perte et enregistrez 20 pour cent.

Les chances que l'équipe X gagne deux fois et perdent le troisième jeu deviennent simples à calculer: 60% 60% fois 20%, soit 60% * 60% * 20%, ce qui équivaut à 72%.

Alors, quelles sont les chances que l'équipe X gagne, puis égalité, puis deux fois après? La réponse est de 20% (passage de l'état de victoire à l'état de cravate) multiplié par 20% (passant de l'égalité à la perte), multiplié par 35% (passant de la perte à la perte) par 35% (passant de la perte à la perte). Le résultat est de 49%.

Comment utiliser le modèle de Markov dans Predictive Analytics - mannequins

Le choix des éditeurs

Magasin de données ou entrepôt de données? - les mannequins

Magasin de données ou entrepôt de données? - les mannequins

L'idée d'un dépôt de données n'est guère révolutionnaire, malgré ce que vous pourriez lire sur les blogs et dans la presse spécialisée, et ce que vous pourriez entendre lors de conférences ou de séminaires. Un magasin de données est simplement un entrepôt de données réduit - c'est tout. Les vendeurs font de leur mieux pour définir des ...

Classer Votre Entrepôt de données - mannequins

Classer Votre Entrepôt de données - mannequins

Bien que vous devez vous assurer que votre entrepôt de données correspond à vos besoins uniques, certaines directives peuvent vous aider. vous déterminez la complexité probable de son environnement et de sa structure. Une bonne configuration consiste à utiliser une classification à trois niveaux pour la planification d'un entrepôt de données. En déterminant une catégorie probable pour une mise en œuvre, vous pouvez avoir ...

Business Intelligence Architecture et Data Warehousing - Mannequins

Business Intelligence Architecture et Data Warehousing - Mannequins

Les débuts du Business Intelligence (toute variété sauf data mining) avait une forte saveur client / serveur de première génération à deux niveaux. (Certains environnements d'intelligence d'affaires qui étaient hébergés sur un mainframe et qui effectuaient des requêtes et des rapports étaient construits avec une architecture centralisée.) Conceptuellement, les premières architectures d'intelligence d'affaires avaient du sens, compte tenu de l'état de l'art ...

Le choix des éditeurs

Câblage réseau pour l'examen de certification Cisco ICND1 - mannequins

Câblage réseau pour l'examen de certification Cisco ICND1 - mannequins

L'examen de certification ICND1 vous teste sur les différents types de câblage utilisé dans différents scénarios de réseau. Voici quelques points clés à retenir sur le câblage réseau. Rollover Cable: Un câble de survol est aussi connu comme un câble de console et obtient le nom rollover parce que l'ordre des fils d'un ...

Pour la certification compTIA A + - mannequins

Pour la certification compTIA A + - mannequins

Les examens A +, y compris le réseau local (LAN) et le réseau étendu (WAN): LAN: Un réseau local (LAN) est un réseau qui implique généralement un immeuble de bureaux ou peut-être même des systèmes en réseau sur un étage. Le principal point à retenir lors de l'identification ...

Outils de dépannage réseau - nuls

Outils de dépannage réseau - nuls

Voici une liste d'outils de dépannage courants que vous devriez connaître pour les examens A +. L'un des défis des réseaux de soutien aujourd'hui est de savoir comment les résoudre. Vous trouvez tellement d'aspects du réseau qu'il est difficile de savoir par où commencer votre dépannage. Crimper: A ...

Le choix des éditeurs

En sélectionnant Logiciel de blog hébergé - duos

En sélectionnant Logiciel de blog hébergé - duos

Lorsque vous choisissez de bloguer en utilisant un service de blog hébergé, vous n'avez pas besoin de s'inquiéter de la technologie du logiciel du tout. Vous pouvez vous concentrer sur le sujet de votre prochain article de blog plutôt que sur la manière de configurer un serveur Web. Pour utiliser un logiciel de blog hébergé, connectez-vous à l'outil d'édition, écrivez un ...

Sélectionnant l'hébergement Web pour votre blog WordPress - les nuls

Sélectionnant l'hébergement Web pour votre blog WordPress - les nuls

Après avoir choisi un domaine approprié pour votre blog, vous besoin d'un endroit pour votre installation de WordPress à vivre. N'oubliez pas que vous pouvez également demander à d'autres blogueurs quel hôte ils utilisent et quelle a été leur expérience. Les logiciels Web tels que WordPress ont certaines exigences techniques. Les exigences pour WordPress sont PHP 5. 6 ou plus ...

ÉVolutivité et Mom Blogging - mannequins

ÉVolutivité et Mom Blogging - mannequins

L'évolutivité est l'un de ces mots de jargon MBA-ish absolument ennuyeux que vous n'auriez probablement jamais pense que cela s'appliquerait à un blogueur maman. Mais ce que l'évolutivité signifie vraiment, c'est qu'une entreprise doit avoir une structure en place qui lui permet de croître. Bien sûr, vous voulez augmenter votre revenu - mais vous ...