Accueil Finances personnelles Comment utiliser le modèle de Markov dans Predictive Analytics - mannequins

Comment utiliser le modèle de Markov dans Predictive Analytics - mannequins

Vidéo: Chaînes de Markov pour la recherche de gènes 2024

Vidéo: Chaînes de Markov pour la recherche de gènes 2024
Anonim

Le modèle de Markov est un modèle statistique qui peut être utilisé dans l'analyse prédictive reposant fortement sur la théorie des probabilités. (Il tire son nom d'un mathématicien russe dont la recherche principale portait sur la théorie des probabilités.)

Voici un scénario pratique qui illustre comment cela fonctionne: Imaginez que vous voulez prédire si l'équipe X va gagner le match de demain. La première chose à faire est de recueillir des statistiques antérieures sur l'équipe X. La question qui pourrait se poser est de savoir jusqu'où vous devriez retourner dans l'histoire?

Supposons que vous ayez réussi à atteindre les 10 derniers résultats du jeu en séquence. Vous voulez connaître la probabilité que l'équipe X remporte le prochain match compte tenu des résultats des 10 derniers matchs.

Le problème est que plus on avance dans l'histoire, plus la collecte des données et le calcul des probabilités deviennent complexes.

Croyez-le ou non, le modèle de Markov vous simplifie la vie en vous fournissant l' Hypothèse de Markov, qui ressemble à ceci lorsque vous l'écrivez en mots:

La probabilité qu'un événement se produise, compte tenu des événements passés n , est approximativement égale à la probabilité qu'un tel événement se produise juste pour le dernier événement passé.

Écrit en formule, l'hypothèse de Markov ressemble à ceci:

Dans tous les cas, l'hypothèse de Markov signifie que vous n'avez pas besoin d'aller trop loin dans l'histoire pour prédire les résultats de demain. Vous pouvez simplement utiliser l'événement passé le plus récent. C'est ce qu'on appelle la prédiction de premier ordre de Markov parce que vous ne tenez compte que du dernier événement pour prédire l'événement futur.

A La prédiction de Markov du second ordre inclut uniquement les deux derniers événements qui se déroulent en séquence. À partir de l'équation qui vient d'être donnée, on peut également déduire l'équation suivante:

Cette équation vise à calculer la probabilité que certains événements se produisent dans l'ordre: événement 1 après événement 2 , et ainsi de suite. Cette probabilité peut être calculée en multipliant la probabilité de chaque événement t (compte tenu de l'événement précédent) par l'événement suivant dans la séquence. Par exemple, supposons que vous vouliez prédire la probabilité que l'équipe X gagne, puis perd, puis lie.

Voici comment un modèle prédictif typique basé sur un modèle de Markov fonctionnerait. Prenons le même exemple: Supposons que vous vouliez prédire les résultats d'un match de football devant être joué par l'équipe X. Les trois résultats possibles - appelés états - sont victoire, perte ou égalité.

Supposons que vous ayez recueilli des données statistiques sur les résultats des matchs de football de l'équipe X, et que l'équipe X ait perdu sa partie la plus récente. Vous voulez prédire le résultat du prochain match de football. Il s'agit de deviner si l'équipe X va gagner, perdre ou égaliser - en se basant uniquement sur les données des jeux précédents. Alors, voici comment vous utilisez un modèle de Markov pour faire cette prédiction.

  1. Calculez des probabilités basées sur des données antérieures.

    Par exemple, combien de fois l'équipe X a-t-elle perdu des parties? Combien de fois l'équipe X a-t-elle gagné des matchs? Par exemple, imaginez si l'équipe X a remporté 6 matchs sur 10 au total. Ensuite, l'équipe X a gagné 60% du temps. En d'autres termes, la probabilité de gagner pour l'équipe X est de 60%.

  2. Calculez la probabilité d'une perte, puis la probabilité d'une égalité, de la même manière.

  3. Utilisez l'équation de probabilité Naïve Bayes pour calculer les probabilités suivantes:

    • Probabilité que l'équipe X gagne, étant donné que l'équipe X a perdu le dernier match.

    • La probabilité que l'équipe X perde, étant donné que l'équipe X a remporté le dernier match.

  4. Calculez les probabilités pour chaque état (victoire, perte ou égalité).

  5. En supposant que l'équipe ne joue qu'une partie par jour, les probabilités sont les suivantes:

    • P (Win | Perte) est la probabilité que l'équipe X va gagner aujourd'hui, étant donné qu'elle a perdu hier.

    • P (Win | Tie) est la probabilité que l'équipe X va gagner aujourd'hui, étant donné qu'elle a fait match nul hier.

    • P (Win | Win) est la probabilité que l'équipe X gagne aujourd'hui, étant donné qu'elle a gagné hier.

  6. En utilisant les probabilités calculées, créez un graphique.

    Un cercle dans ce tableau représente un état possible que l'équipe X peut atteindre à tout moment (victoire, défaite, égalité); les chiffres sur les flèches représentent les probabilités que l'équipe X puisse passer d'un état à un autre.

Par exemple, si l'équipe X vient de gagner le match d'aujourd'hui (son état actuel = victoire), la probabilité que l'équipe gagne à nouveau est de 60%; la probabilité qu'ils perdent le prochain match est de 20% (auquel cas ils passeraient de l'état actuel = victoire à l'état futur = perte).

Supposons que vous vouliez connaître les chances que l'équipe X remporte deux matchs consécutifs et en perd le troisième. Comme vous pouvez l'imaginer, ce n'est pas une prédiction simple à faire.

Cependant, en utilisant le graphique que vous venez de créer et l'hypothèse de Markov, vous pouvez facilement prédire les chances qu'un tel événement se produise. Vous commencez avec l'état de victoire, marchez à travers l'état de victoire encore, et enregistrez 60 pour cent; alors vous passez à l'état de perte et enregistrez 20 pour cent.

Les chances que l'équipe X gagne deux fois et perdent le troisième jeu deviennent simples à calculer: 60% 60% fois 20%, soit 60% * 60% * 20%, ce qui équivaut à 72%.

Alors, quelles sont les chances que l'équipe X gagne, puis égalité, puis deux fois après? La réponse est de 20% (passage de l'état de victoire à l'état de cravate) multiplié par 20% (passant de l'égalité à la perte), multiplié par 35% (passant de la perte à la perte) par 35% (passant de la perte à la perte). Le résultat est de 49%.

Comment utiliser le modèle de Markov dans Predictive Analytics - mannequins

Le choix des éditeurs

Tableaux et pointeurs en C ++ - le nom du tableau des mannequins

Tableaux et pointeurs en C ++ - le nom du tableau des mannequins

Est un pointeur sur le tableau lui-même. Le tableau est une séquence de variables stockée en mémoire. Le nom du tableau pointe vers le premier élément. C'est une question intéressante sur les pointeurs: Pouvez-vous avoir un en-tête de fonction, comme la ligne suivante, et juste utiliser sizeof pour déterminer comment ...

Boost Bibliothèques et C ++ - mannequins

Boost Bibliothèques et C ++ - mannequins

De nombreux développeurs utilisent les bibliothèques Boost car elles fournissent un code de haute qualité une partie de Boost est en train d'être normalisée pour être incluse dans la bibliothèque standard. L'une des meilleures choses à propos de Boost est que la bibliothèque elle-même est gratuite. Le site Web de Boost tient à faire savoir aux développeurs qu'ils ne ...

Casser les programmes Mis à part C ++ - les mannequins

Casser les programmes Mis à part C ++ - les mannequins

Le programmeur peut casser un seul programme en fichiers sources distincts généralement appelés modules. Ces modules sont compilés séparément dans le code machine par le compilateur C ++, puis combinés au cours du processus de génération pour générer un seul programme. Ces modules sont également connus par les geeks du compilateur en tant qu'unités de traduction C ++. Le processus de combinaison ...

Le choix des éditeurs

Comment régler les paramètres via l'affichage d'informations sur votre Nikon D5200 - mannequins

Comment régler les paramètres via l'affichage d'informations sur votre Nikon D5200 - mannequins

L'information l'affichage ne sert pas uniquement à vérifier les paramètres de prise de vue actuels; Cela vous donne également un accès rapide à certains des paramètres les plus critiques. La touche de cette fonction est le bouton Information Edit, situé à l'arrière de l'appareil photo, à droite du viseur. Voici comment cela fonctionne: Afficher les informations ...

Met en surbrillance le mode d'affichage sur votre Nikon D7100 - mannequins

Met en surbrillance le mode d'affichage sur votre Nikon D7100 - mannequins

En mode d'affichage hautes lumières sur votre Nikon D7100 pense que l'appareil photo peut être surexposé clignoter dans le moniteur de l'appareil photo. L'un des problèmes de photo les plus difficiles à corriger dans un programme de retouche photo est connu sous le nom de surbrillance dans certains cercles et de surbrillance dans d'autres. Les deux termes signifient que les zones les plus claires de ...

Comment régler les paramètres via la bande de contrôle Nikon D3300 - les tétines

Comment régler les paramètres via la bande de contrôle Nikon D3300 - les tétines

Présentes en bas à gauche Au coin du Nikon D3300, le bouton i active une bande de contrôle qui vous donne un accès rapide à certains paramètres de prise de vue critiques. Voici comment utiliser la bande de contrôle pour la photographie dans le viseur: Affichez l'écran d'informations. Vous pouvez le faire en appuyant sur le bouton Info. Appuyez sur le bouton i. Le haut ...

Le choix des éditeurs

Comment imprimer vos diapositives et notes Keynote - Les tétines

Comment imprimer vos diapositives et notes Keynote - Les tétines

Lorsque vous créez une présentation dans Snow Leopard Application Keynote, vous ne pouvez pas toujours vouloir imprimer des documents. Cependant, si vous présentez un long diaporama avec beaucoup d'informations que vous aimeriez que votre public se souvienne, rien ne vaut les documents qui incluent des images réduites de vos diapositives (et, facultativement, les notes de votre présentateur). Vous pouvez ...

Comment réorganiser ou supprimer les signets - les mannequins

Comment réorganiser ou supprimer les signets - les mannequins

Safari enregistre vos signets et vos dossiers de signets dans l'ordre dans lequel vous les créez, en les ajoutant au bas d'une liste toujours croissante. Si vous continuez à ajouter des marque-pages au menu Signets sans les placer dans des dossiers, vous pouvez constater que vous avez un nombre de signets gazillion indiqué bon gré mal gré et que vous ne vous en souvenez plus ...

Pour ouvrir et utiliser l'iDisk de Snow Leopard - les mannequins

Pour ouvrir et utiliser l'iDisk de Snow Leopard - les mannequins

Avec un compte MobileMe actif, iDisk est disponible et vous fournit un espace de stockage supplémentaire. Pour connaître l'espace de stockage utilisé et pour configurer l'accès à votre dossier Public, ouvrez les Préférences Système, cliquez sur l'icône MobileMe, puis sur le bouton iDisk pour afficher les paramètres. Vos paramètres iDisk sont disponibles dans les Préférences Système. Le ...