Vidéo: Warehouse Builder - Concept 2024
Un entrepôt de données Lite est une approche sans fioriture, simple et basse technologie pour fournir des données qui peuvent aider avec certains de votre décision d'affaires. No-frills signifie que vous mettez en place, dans la mesure du possible, des capacités et des outils déjà éprouvés au sein de votre organisation pour construire votre système.
Domaines et contenu des données d'un entrepôt de données
Un entrepôt de données est axé sur le rapport ou l'analyse d'un seul ou éventuellement de deux domaines. Supposons que dans votre travail à une division sans fil d'une compagnie de téléphone, vous analysez les ventes de services tels que les minutes en réseau, les minutes hors réseau, la messagerie texte, l'accès Internet et autres usages mobiles aux ménages consommateurs.
Si vous créez une lite d'entrepôt de données exclusivement à cette fin, vous disposez de toutes les informations nécessaires pour soutenir votre analyse et votre reporting sur le marché grand public. Cependant, vous ne disposez d'aucune information sur les utilisateurs professionnels et l'historique des paiements, car ces informations font partie d'un domaine différent, comme le montre cette figure.
En fonction de la limite de domaine, un entrepôt de données a juste assez de contenu pour satisfaire l'objectif principal de l'environnement, mais pas assez pour de nombreux scénarios de simulation non structurés que ses utilisateurs pourraient créer.
Vous devez donc choisir avec soin parmi l'ensemble de tous les éléments de données possibles et sélectionner un sous-ensemble gérable - des éléments qui, sans aucun doute, sont importants à avoir. Ce processus est le même pour toute implémentation d'entrepôt de données, sauf que vous devez être extrêmement discipliné lorsque vous prenez des décisions sur le contenu à inclure.
Utilisez les rapports standard, en particulier ceux qui nécessitent actuellement beaucoup de préparation manuelle, comme l'un de vos principaux guides pour déterminer le contenu des données dans un entrepôt de données.
Sources de données
Un lite d'entrepôt de données possède un ensemble limité de sources de données, généralement une à une poignée. Dans le cadre d'un environnement global à application unique, par exemple, l'entrepôt de données lite agit en tant qu'agent de restructuration des données de l'application pour le rendre plus convivial pour les requêtes et les rapports.
Le moyen le plus courant de restructurer les données d'une seule application consiste à dénormaliser le contenu des tables de base de données relationnelles de l'application pour éliminer autant de opérations de jointure relationnelle (processus de regroupement des données de plusieurs tables de base de données) que possible lorsque les utilisateurs exécutent des rapports ou effectuent des requêtes simples.
La dénormalisation est le contraire du concept de normalisation de la base de données relationnelle, un ensemble de directives quelque peu complexe qui vous indique quels éléments de données devraient figurer dans les tables d'une base de données.
Lorsque vous dénormaliser une base de données, vous ne vous inquiétez pas des données en double; vous essayez de créer des lignes de données dans une seule table qui reflète très probablement les rapports et les requêtes que les utilisateurs exécutent. Cette figure montre un exemple de lite d'entrepôt de données à source unique basée sur la dénormalisation.
Bien que vous puissiez utiliser des données fournies de manière externe dans une implémentation lite d'entrepôt de données, les données que vous utilisez sont rarement nouvellement acquises. Vous êtes plus susceptible d'intégrer des données que vous utilisez déjà pour l'analyse (peut-être de manière autonome).
Outils d'aide à la décision
Les utilisateurs d'un lite d'entrepôt de données posent généralement des questions et créent des rapports reflétant la perspective «Dites-moi ce qui s'est passé». Parce que ces utilisateurs ne font pas beaucoup de traitement analytique robuste, les produits qu'ils utilisent pour accéder à l'entrepôt de données devraient être faciles à utiliser.
Extraction, déplacement et chargement de données
Simplicité est le nom du jeu dans un entrepôt de données. Par conséquent, rendre le processus d'extraction des données à partir de sources et d'effectuer toutes les fonctions nécessaires pour préparer ces données pour le chargement aussi simple que possible en utilisant ces deux éléments:
-
Extraits de fichiers simples des systèmes d'exploitation et des transferts de fichiers vous permet de déplacer des données de ses sources vers l'entrepôt de données lite
-
Code personnalisé simple (ou peut-être un outil facile à utiliser) qui peut extraire et déplacer les données
Si la source de données de votre entrepôt de données est lite Construit sur une base de données relationnelle et vous prévoyez d'utiliser le même produit de base de données pour votre entrepôt de données, utilisez SQL pour gérer facilement l'extraction et le mouvement des données. Ces étapes - comme le montre la figure - fournissent une procédure standard pour ce processus (vous devrez adapter ces étapes à votre environnement particulier, bien sûr):
-
Sur le système qui héberge votre entrepôt, utilisez le SQL CREATE TABLE instruction pour créer la définition pour chaque table dans votre entrepôt de données Lite.
-
Créez une base de données sauvegarde contenant des copies de toutes les tables de la source qui fournissent des données à l'entrepôt, puis rechargez ces tables dans une zone de transit sur le système où vous souhaitez localiser votre entrepôt de données.
Vous devez vous assurer que la bande passante réseau et la fenêtre temporelle sont adéquates pour copier toutes les tables sources sur le système en utilisant un programme de transfert de fichiers.
-
Utilisez l'instruction SQL INSERT avec une instruction SELECT imbriquée spécifiant les tables source et leurs colonnes respectives qui peupleront la table de l'entrepôt de données (et comment les tables seront jointes), pour charger les données dans votre entrepôt de données.
-
Exécutez une série de routines d'assurance qualité (AQ) pour vérifier que toutes les données ont été correctement chargées.
Vérifiez le nombre de lignes, les totaux numériques et tout ce que vous pouvez faire d'autre.
Architecture
L'architecture d'un entrepôt de données Lite est composée de la base de données utilisée pour stocker les données, des outils de business intelligence frontaux utilisés pour accéder aux données, de la façon dont les données sont déplacées et du nombre de sujets. zones.Le mot d'ordre de cet environnement est minimaliste: pas de cloches, pas de sifflets, rien de fantaisiste - juste assez de technologie appliquée à l'environnement pour donner aux utilisateurs l'accès aux données dont ils ont besoin.
L'architecture d'un entrepôt de données, telle qu'illustrée dans cette figure, contient les principaux types de composants suivants:
-
Une base de données unique contient les données de l'entrepôt.
-
Cette base de données est alimentée directement par chacune des sources fournissant des données à l'entrepôt.
-
Les utilisateurs accèdent directement aux données depuis l'entrepôt.