Vidéo: Entre HPC et big data: un case study sur la simulation du risque de contrepartie 2024
La modélisation des risques est un autre cas d'utilisation majeur qui est dynamisé par Hadoop. Vous trouverez que cela correspond étroitement au cas d'utilisation de la détection de la fraude en ce qu'il s'agit d'une discipline basée sur un modèle. Plus vous avez de données et plus vous pouvez «relier les points», plus vos résultats donneront souvent de meilleurs modèles de prédiction des risques.
Le mot englobant risque peut prendre beaucoup de sens. Par exemple, la prédiction du taux de désabonnement est le risque qu'un client passe à un concurrent; le risque d'un portefeuille de prêts est lié au risque de défaut; Le risque dans les soins de santé couvre toute la gamme allant du confinement des éclosions à la salubrité des aliments jusqu'à la probabilité de réinfection et plus encore.
Le secteur des services financiers (FSS) investit désormais massivement dans la modélisation des risques basée sur Hadoop. Ce secteur vise à accroître l'automatisation et la précision de son évaluation des risques et de la modélisation de l'exposition.
Hadoop offre aux participants la possibilité d'étendre les ensembles de données utilisés dans leurs modèles de risque pour inclure des sources sous-utilisées (ou des sources jamais utilisées), telles que le courrier électronique, la messagerie instantanée, les médias sociaux et les interactions avec le service client représentants, parmi d'autres sources de données.
Les modèles de risque dans FSS apparaissent partout. Ils sont utilisés pour la prévention du désabonnement des clients, la modélisation des manipulations commerciales, les risques d'entreprise et l'analyse de l'exposition, et plus encore.
Lorsqu'une entreprise émet une police d'assurance contre les catastrophes naturelles à la maison, l'un des défis est de voir clairement combien d'argent est potentiellement menacé. Si l'assureur ne parvient pas à réserver de l'argent pour d'éventuels paiements, les régulateurs interviendront (l'assureur ne le souhaite pas); Si l'assureur met trop d'argent dans ses réserves pour payer des sinistres futurs, il ne peut alors investir votre argent et faire un profit (l'assureur ne le veut pas non plus).
Certaines entreprises sont «aveugles» au risque qu'elles affrontent parce qu'elles n'ont pas été en mesure d'effectuer un nombre suffisant de simulations catastrophiques relatives à la variabilité de la vitesse du vent ou des précipitations (entre autres variables). à leur exposition.
Tout simplement, ces entreprises éprouvent des difficultés à tester leurs modèles de risque. La possibilité de regrouper davantage de données - par exemple, les conditions météorologiques ou la répartition socioéconomique en constante évolution de leur clientèle - leur donne beaucoup plus de perspicacité et de capacité lorsqu'il s'agit de construire de meilleurs modèles de risque.
Les modèles de risques liés aux bâtiments et aux tests de résistance, comme celui qui vient d'être décrit, constituent une tâche idéale pour Hadoop. Ces opérations sont souvent coûteuses en termes de calcul et, lorsque vous construisez un modèle de risque, impossible à exécuter sur un entrepôt de données, pour les raisons suivantes:
-
L'entrepôt n'est probablement pas optimisé pour les types de requêtes.(Hadoop n'est pas lié par les modèles de données utilisés dans les entrepôts de données.)
-
Un travail batch volumineux et ad hoc, tel qu'un modèle de risque évolutif, ajouterait de la charge à l'entrepôt, influençant les applications analytiques existantes. (Hadoop peut assumer cette charge de travail, libérant l'entrepôt pour les rapports d'activité normaux.)
-
Les modèles de risque plus avancés peuvent avoir besoin de prendre en compte des données non structurées, telles que du texte brut. (Hadoop peut gérer cette tâche efficacement.)