Table des matières:
- Qu'est-ce qu'un fichier d'extrait?
- Pourquoi les fichiers extraits ne sont-ils pas considérés comme des entrepôts de données?
Vidéo: Keynote 5G : Orange investit et s'investit dans la 5G avec ses clients et partenaires 2025
Votre organisation a des chances extrêmement favorables d'avoir au moins un type d'entrepôt de données - un système de rapport qui fournit des capacités d'information et, parfois, des capacités analytiques à un ou plusieurs groupes d'utilisateurs.
Qu'est-ce qu'un fichier d'extrait?
Vos utilisateurs utilisent probablement le terme extrait le fichier pour décrire ce type d'environnement car il est alimenté par des extraits de données des systèmes de production, plutôt que par des utilisateurs forcés d'exécuter leurs requêtes ou de recevoir leurs rapports. bases de données ou fichiers de production opérationnels. Toujours intéressé à jouer les chances? Voici quelques autres exemples de types d'environnements de données que l'on pourrait décrire comme des sortes d'entrepôts de données:
-
Bien que les données extraites soient presque toujours hébergées dans un seul fichier ou une seule base de données, un processus de fusion combine probablement des données extraites de plusieurs sources d'applications.
-
Seuls les éléments sélectionnés, pas tous les éléments de toutes les tables ou fichiers de chaque source de données sont généralement extraits et copiés dans le fichier d'extraction.
-
Une sorte de processus d'assurance de la qualité des données se déroule généralement à chaque étape, de l'extrait initial au chargement des données dans le fichier d'extraction.
-
Certains utilisateurs expérimentés peuvent probablement exécuter des requêtes ou créer des programmes statistiques (dans SAS ou SPSS, par exemple) par rapport aux données, mais de nombreux utilisateurs ne sont pas susceptibles de toucher directement les données. Au lieu de cela, ils reçoivent probablement régulièrement des rapports générés automatiquement ou en réponse à leurs demandes.
Bien sûr, ça ressemble à un entrepôt de données, n'est-ce pas? La réalité est que ces types d'entrepôts de données desservent généralement une très petite population et ne sont pas réalisés de manière standard pour répondre aux besoins plus larges de l'entreprise. Vous pouvez également les appeler wanna-be data warehouses.
Voici la dichotomie de la plupart des organisations accès aux données:
-
Analyse des données "n'ont pas": Organisations et individus qui ont peu (et plus probablement pas) de capacités pour faire le type d'analyse qui peut mener à une prise de décision axée sur l'information
-
Analyse des données «possédants»: Organismes et individus qui n'ont pas d'entrepôt de données opérationnel, mais qui font quelque chose avec les données qu'ils reçoivent quelque part. Dans de nombreux cas, cela répond parfaitement aux besoins de leur entreprise.
Pourquoi les fichiers extraits ne sont-ils pas considérés comme des entrepôts de données?
Ils sont, en quelque sorte. Les fichiers extraits, que ce soit dans les années 1970, 1980, 1990 ou encore utilisés aujourd'hui, existent pour les mêmes raisons qu'un entrepôt de données ou un datamart à part entière: fournir de l'information malgré une variété d'obstacles, tels que comprendre les structures de données, ne pas toucher aux règles du système de production et l'absence de références croisées multi-fichiers ou multi-bases de données.
Certains partisans de l'entreposage de données soutiennent que la combinaison et la reconfiguration de données simplement dans le but de générer des rapports ou d'effectuer des analyses statistiques ne constituent guère un entrepôt de données au sens moderne du terme. Les fichiers d'extraction ne sont pas équipés de fonctionnalités multidimensionnelles ou d'analyse métier, telles que l'exploration descendante et le pivotement de données.
Si vous séparez le côté entrepôt de données (ce qu'il faut pour rassembler, déplacer et reconfigurer les données d'une ou de plusieurs sources) du côté de l'intelligence d'affaires (ce que vous faites avec les données après l'avoir disponible), le l'image devient beaucoup plus claire.
Les fichiers d'extraction, ou peu importe comment vous les appelez, font partie intégrante de la philosophie d'un entrepôt de données. Beaucoup de ce que les utilisateurs appellent des «fichiers d'extraction» sont des systèmes basés sur des fichiers (plutôt que construits sur des bases de données), et ils ne sont probablement pas assez souples pour supporter l'interrogation ad hoc et l'analyse dimensionnelle. Dans un sens réel, cependant, ces environnements servent à l'entreposage des données pour une utilisation ultérieure.
Pour de nombreux utilisateurs, les fonctionnalités d'analyse métier, telles que l'analyse descendante et le pivotement de données, ont peu ou pas d'utilité - du moins pas dans le contexte de leurs définitions de travail actuelles. Les travaux des utilisateurs appellent des fonctionnalités que ces fichiers d'extraction peuvent fournir, ainsi que les rapports statiques et l'analyse statistique réalisée avec ces données.
La morale de l'histoire: Ne pas aller dans une organisation qui utilise efficacement les données à travers des fichiers d'extraction et d'exposer sur les merveilles de l'entreposage de données. Au lieu de cela, soyez prudent de proposer une solution d'entreposage de données qui peut être considérée comme un retour en arrière. Si vous faites ce genre de proposition, vous êtes dans une longue promenade cahoteuse.