Data Warehouse Modernisation avec Hadoop - les mannequins de données

Vidéo: Big Data santé : révéler le potentiel des données médicales 2025

Les entrepôts de données sont maintenant soumis à des contraintes. demandes accrues sur leurs ressources limitées. Hadoop peut apporter un soulagement significatif dans cette situation d'entrepôt de données.

L'augmentation rapide de la quantité de données générées dans le monde a également affecté les entrepôts de données car les volumes de données qu'ils gèrent augmentent en partie parce que plus de données structurées , le type de données fortement typé et inséré dans des lignes et des colonnes - est généré, mais aussi parce que vous devez souvent faire face à des exigences réglementaires conçues pour maintenir un accès interrogeable aux données historiques.

magasin de données enfant (un sous-ensemble distinct de l'entrepôt de données) pour une application d'analyse spécifique. De plus, les analystes ont de plus en plus besoin d'émettre de nouvelles requêtes sur les données structurées stockées dans les entrepôts, et ces requêtes ad hoc peuvent souvent utiliser des ressources de traitement de données importantes. Parfois, un rapport ponctuel peut suffire et, parfois, une analyse exploratoire est nécessaire pour trouver des questions qui n'ont pas encore été posées et qui pourraient avoir une valeur commerciale importante.

En fin de compte, les entrepôts de données sont souvent utilisés à des fins autres que leur conception d'origine.

La figure montre, à l'aide d'une architecture de haut niveau, comment Hadoop peut cohabiter avec des entrepôts de données et remplir certains des objectifs pour lesquels ils ne sont pas conçus.

Hadoop est un assistant d'entrepôt

, pas un remplacement d'entrepôt. Hadoop peut moderniser un écosystème d'entreposage de données de quatre façons; ils sont ici en résumé:

Fournir une zone d'atterrissage pour toutes les données.

Persistez les données pour fournir une archive interrogeable de données froides.
Tirez parti de l'efficacité du traitement par lots à grande échelle de Hadoop pour prétraiter et transformer les données de l'entrepôt.
Activer un environnement pour la découverte de données ad hoc.