Vidéo: Le serveur informatique expliqué en dessins 2024
Dans la plupart des cas, deux services middleware - sélection et extraction, et assurance qualité - se déroulent sur la même plate-forme (système) sur laquelle réside la source de données. Si votre entrepôt de données est hébergé sur une plate-forme différente de la source de données, vous devez utiliser un service de transfert de données pour effectuer le transfert système-système des données.
Vous pouvez probablement utiliser un service relativement simple (géré par un simple programme de transfert de fichiers, par exemple). Le service de mouvement, si vous en avez besoin à ce stade, déplace simplement les données QA dans l'environnement dans lequel vous prévoyez d'effectuer des transformations supplémentaires.
Si vous effectuez votre transformation et votre traitement de QA sur une plate-forme différente de la plate-forme sur laquelle vous exécutez votre entrepôt de données de production (sur un serveur de développement, par exemple, plutôt que sur le serveur opérationnel), vous devez exécuter un autre service de transfert de données pour obtenir les données à l'endroit où vous souhaitez qu'elles résident éventuellement. Ce processus implique généralement seulement un transfert de fichier relativement simple.
Le service de chargement de données charge les données extraites, QA, transformées et re-QA dans votre entrepôt. Vous pouvez charger des données via un programme personnalisé, SQL (une instruction INSERT, par exemple) ou un utilitaire.
Si vous devez charger un gros volume de données, essayez d'utiliser un utilitaire de chargement rapide, qui implique généralement beaucoup moins de temps qu'une approche programmatique ou SQL.
Si vous utilisez SQL pour charger vos données dans une base de données relationnelle, essayez de rendre le chargement aussi efficace que possible en désactivant la journalisation (si votre produit SGBD le permet). Si le travail de chargement est anormalement terminé, il suffit d'utiliser l'instruction DROP ou TRUNCATE pour supprimer la table partiellement chargée, résoudre le problème à l'origine de la terminaison et redémarrer le travail.
Ce processus est généralement beaucoup plus rapide que si vous activez les fonctionnalités requises pour les données de type OLTP et l'intégrité de la transaction (avec les frais généraux associés).