Choisir un algorithme pour Predictive Analytics - des nuls

Vidéo: Machine Learning, Python et Open Data : démonstration d'un cas d'usage pour geek 2025

Différents algorithmes statistiques, d'exploration de données et d'apprentissage machine sont disponibles dans votre modèle d'analyse prédictive. Vous êtes dans une meilleure position pour sélectionner un algorithme après avoir défini les objectifs de votre modèle et sélectionné les données sur lesquelles vous allez travailler. Certains de ces algorithmes ont été développés pour résoudre des problèmes métier spécifiques, améliorer des algorithmes existants ou fournir de nouvelles fonctionnalités, ce qui peut rendre certaines d'entre elles plus adaptées à vos objectifs que d'autres. Vous pouvez choisir parmi une gamme d'algorithmes pour répondre aux préoccupations d'affaires telles que:

Pour la segmentation des clients et / ou la détection de la communauté dans le domaine social, par exemple, vous auriez besoin d'algorithmes de clustering.
Pour fidéliser la clientèle ou développer un système de recommandation, vous utiliseriez des algorithmes de classification.
Pour l'évaluation du crédit ou la prédiction du résultat suivant d'événements temporels, vous utiliseriez un algorithme de régression.

Comme le temps et les ressources le permettent, vous devriez exécuter autant d'algorithmes que vous le pouvez. La comparaison de différentes exécutions d'algorithmes différents peut apporter des résultats surprenants à propos des données ou de l'intelligence d'affaires intégrées dans les données. Cela vous permet de mieux comprendre le problème métier et vous aide à identifier les variables de vos données qui ont un pouvoir prédictif.

Certains projets d'analyse prédictive réussissent mieux en construisant un modèle d'ensemble, un groupe de modèles fonctionnant sur les mêmes données. Un modèle d'ensemble utilise un mécanisme prédéfini pour rassembler les résultats de tous ses modèles de composants et fournir un résultat final pour l'utilisateur.

Les modèles peuvent prendre différentes formes: une requête, une collection de scénarios, un arbre de décision ou une analyse mathématique avancée. En outre, certains modèles fonctionnent mieux pour certaines données et analyses. Vous pouvez (par exemple) utiliser des algorithmes de classification qui utilisent des règles de décision pour décider du résultat d'un scénario ou d'une transaction donnée, en répondant à des questions comme celles-ci:

Ce client est-il susceptible de répondre à notre campagne marketing?
Ce transfert d'argent est-il susceptible de faire partie d'un programme de blanchiment d'argent?
Ce prêteur est-il susceptible de faire défaut sur le prêt?

Vous pouvez utiliser des algorithmes de clustering non supervisés pour trouver les relations existant dans votre jeu de données. Vous pouvez utiliser ces algorithmes pour trouver différents groupes parmi vos clients, déterminer quels services peuvent être regroupés ou décider par exemple quels produits peuvent être revus.

Les algorithmes de régression peuvent être utilisés pour prévoir des données continues, comme la prévision de la tendance d'un mouvement de stock compte tenu de ses prix passés.

Les arbres de décision, les machines à vecteurs de support, les réseaux de neurones, les régressions logistiques et linéaires sont quelques-uns des algorithmes les plus courants. Bien que leurs implémentations mathématiques diffèrent, ces modèles prédictifs génèrent des résultats comparables. Les arbres de décision sont plus populaires, car ils sont faciles à comprendre; vous pouvez suivre le chemin d'une décision donnée.

Les algorithmes de classification sont parfaits pour le type d'analyse lorsque la cible est connue (comme l'identification des spams). D'un autre côté, lorsque la variable cible est inconnue, les algorithmes de clustering sont votre meilleur choix. Ils vous permettent de regrouper ou de regrouper vos données en groupes significatifs en fonction des similitudes entre les membres du groupe.

Ces algorithmes sont très populaires. Il existe de nombreux outils, à la fois commerciaux et open-source, qui les mettent en œuvre. Avec l'accumulation et l'accélération de l'accumulation de données (c'est-à-dire le big data) et le matériel et les plates-formes rentables (tels que le cloud computing et Hadoop), les outils d'analyse prédictive connaissent un boom.

Les données et les objectifs métier ne sont pas les seuls facteurs à prendre en compte lors de la sélection d'un algorithme. L'expertise de vos data scientists est d'une valeur inestimable à ce stade; choisir un algorithme qui fera le travail est souvent une combinaison délicate de la science et de l'art. La partie artistique provient de l'expérience et de la compétence dans le domaine des affaires, qui joue également un rôle essentiel dans l'identification d'un modèle qui peut servir les objectifs de l'entreprise avec précision.