Vidéo: Comment deplacer des appli sur sa carte sd plus simplement sous Android 7.0 2024
Les mises en œuvre de luxe dans les entrepôts de données sont importantes et ne cessent d'augmenter. Les implémentations qui utilisent des centaines de gigaoctets (un gigaoctet équivaut à 1 milliard d'octets) et même des téraoctets (1 000 milliards d'octets) sont de plus en plus courantes. Pour gérer ce volume de données et l'accès des utilisateurs, vous avez besoin d'un serveur et d'une base de données très robustes.
Préparez-vous au défi! Avec un entrepôt de données léger, vous pouvez généralement gérer les mouvements de données de source à entrepôt de manière simple et technique - mais avec l'entrepôt de données de luxe, vous entrez maintenant dans la Zone de Difficulté, où de nombreux projets d'entreposage de données répondent à leurs besoins. Waterloo.
Vous risquez d'éprouver des difficultés dans ce domaine pour plusieurs raisons:
-
Vous avez affaire à de nombreuses sources de données différentes, dont certaines peuvent contenir des données qui se chevauchent. Par exemple, les informations des fournisseurs peuvent provenir de deux systèmes d'achat différents, et certains de vos fournisseurs ont des entrées dans les deux systèmes.
Vous rencontrerez probablement différents ensembles d'identifiants que vous devrez converger (par exemple, six caractères alphanumériques identifiés comme SUPPLIER_ID dans l'un des systèmes et un entier unique connu sous le nom SUP_NUM dans l'autre).
-
Si votre entrepôt de données est volumineux (plus de 250 gigaoctets environ), vous risquez de rencontrer des difficultés pour extraire, déplacer et charger vos fenêtres de traitement par lots. Les fenêtres de traitement par lots , sont limitées par le nombre de sources de données que vous devez gérer.
-
Les chances d'avoir un processus d'extraction, de mouvement, de transformation et de chargement fautif sont exponentiellement liées au nombre d'éléments de données à charger dans l'entrepôt de données.
Si vous pouviez assigner un facteur de difficulté (un entier, par exemple) au processus d'obtention de données dans l'entrepôt, les mesures suivantes resteraient vraies: Vous avez n données éléments que vous souhaitez inclure dans l'entrepôt de données avec un facteur de difficulté x. Si vous avez maintenant 2 n éléments de données, votre facteur de difficulté n'est pas 2 x; c'est plutôt x au carré.
Pour faciliter la compréhension de ce facteur de difficulté, attribuez des nombres à n et x. Dites que votre entrepôt de données contient 100 éléments (n) et que le facteur de difficulté (x) est 5. Si vous doublez le nombre d'éléments ( n > = 200), votre facteur de difficulté est 25 (5 au carré), pas 10 (5 x 2). Le traitement de tant de sources de données, toutes dirigées vers un seul endroit (votre entrepôt de données de luxe), comporte tous les éléments d'un trop grand nombre de cuisiniers dans la cuisine, ou quoi que ce soit.
-
Pour que le processus d'extraction, de mouvement, de transformation et de chargement se déroule sans problème, vous devez probablement traiter avec de nombreux propriétaires d'applications, gardiens officiels de la base de données et autres personnes provenant de différentes organisations. coopérer comme s'ils faisaient partie d'un orchestre symphonique professionnel.
La réalité, cependant, est qu'ils se comportent davantage comme un groupe d'élèves de maternelle qui choisissent chacun un instrument de musique dans la poubelle et qui se font dire: «Maintenant, joue quelque chose! "Bien que le processus ne soit pas nécessairement voué à l'échec, attendez un certain nombre d'itérations jusqu'à ce que vous puissiez charger l'entrepôt de données de luxe juste.
Un entrepôt de données deluxe peut avoir trois niveaux (comme un entrepôt de données), sauf avec plus de sources de données et peut-être plus d'un type d'outil utilisateur accédant à l'entrepôt. Mais l'architecture d'un entrepôt de données de luxe ressemble probablement plus à ce qui est montré dans cette figure, avec de nombreux points de collecte différents pour les données.
Outre les autres «waypoints» nécessaires à votre environnement, votre environnement peut contenir les éléments suivants:
Data mart:
-
Reçoit des sous-ensembles d'informations de l'entrepôt de données deluxe et sert de point d'accès principal utilisateurs. Station de transformation provisoire:
-
Zone dans laquelle les ensembles de données extraits de certaines sources subissent un processus de transformation avant de se diriger vers la base de données de l'entrepôt. Station d'assurance qualité:
-
Zone dans laquelle des groupes de données sont soumis à des contrôles d'assurance qualité intensifs avant de les laisser entrer dans l'entrepôt de données.