Accueil Finances personnelles Rôle de l'ETL traditionnel dans les mégadonnées - mannequins

Rôle de l'ETL traditionnel dans les mégadonnées - mannequins

Vidéo: Pourquoi privilégier un ELT à un ETL avec Snowflake ? 2025

Vidéo: Pourquoi privilégier un ELT à un ETL avec Snowflake ? 2025
Anonim

Les outils ETL combinent trois fonctions importantes (extraction, transformation, chargement) nécessaires pour obtenir des données à partir d'un gros environnement de données et le mettre dans un autre environnement de données. Traditionnellement, ETL a été utilisé avec le traitement par lots dans les environnements d'entrepôt de données. Les entrepôts de données offrent aux utilisateurs métier un moyen de consolider les informations pour analyser et générer des rapports sur les données pertinentes à leurs activités. Les outils ETL sont utilisés pour transformer les données dans le format requis par les entrepôts de données.

La transformation est en fait effectuée dans un emplacement intermédiaire avant le chargement des données dans l'entrepôt de données. De nombreux fournisseurs de logiciels, notamment IBM, Informatica, Pervasive, Talend et Pentaho, fournissent des outils logiciels ETL.

ETL fournit l'infrastructure sous-jacente pour l'intégration en effectuant trois fonctions importantes:

  • Extraire: Lire les données de la base de données source.

  • Transformation: Convertit le format des données extraites afin qu'elles soient conformes aux exigences de la base de données cible. La transformation est effectuée en utilisant des règles ou en fusionnant des données avec d'autres données.

  • Charger: Écrire des données dans la base de données cible.

Cependant, ETL évolue pour prendre en charge l'intégration beaucoup plus que les entrepôts de données traditionnels. ETL peut prendre en charge l'intégration à travers les systèmes transactionnels, les banques de données opérationnelles, les plates-formes BI, les hubs MDM, le cloud et les plates-formes Hadoop. Les éditeurs de logiciels ETL étendent leurs solutions pour fournir l'extraction, la transformation et le chargement de Big Data entre Hadoop et les plates-formes de gestion de données traditionnelles.

Les outils ETL et logiciels pour d'autres processus d'intégration de données tels que le nettoyage, le profilage et l'audit de données travaillent tous sur différents aspects des données afin de garantir leur fiabilité. Les outils ETL intègrent des outils de qualité des données, et beaucoup incorporent des outils pour le nettoyage des données, le mappage des données et l'identification du lignage des données. Avec ETL, vous extrayez uniquement les données dont vous aurez besoin pour l'intégration.

Des outils ETL sont nécessaires pour le chargement et la conversion de données structurées et non structurées dans Hadoop. Les outils ETL avancés peuvent lire et écrire plusieurs fichiers en parallèle depuis et vers Hadoop pour simplifier la fusion des données dans un processus de transformation commun. Certaines solutions intègrent des bibliothèques de transformations ETL prédéfinies pour les données de transaction et d'interaction qui s'exécutent sur Hadoop ou sur une infrastructure de grille traditionnelle.

La transformation de données consiste à modifier le format des données afin qu'elles puissent être utilisées par différentes applications.Cela peut signifier un changement du format dans lequel les données sont stockées dans le format requis par l'application qui utilisera les données. Ce processus comprend également des instructions de mappage afin que les applications sachent comment obtenir les données à traiter.

Le processus de transformation des données est beaucoup plus complexe en raison de la croissance vertigineuse de la quantité de données non structurées. Une application métier telle qu'une gestion de la relation client a des exigences spécifiques sur la manière dont les données doivent être stockées. Les données sont susceptibles d'être structurées dans les lignes et les colonnes organisées d'une base de données relationnelle. Les données sont semi-structurées ou non structurées si elles ne respectent pas les exigences de format rigides.

Les informations contenues dans un message électronique sont considérées comme non structurées, par exemple. Certaines des informations les plus importantes d'une entreprise se trouvent dans des formulaires non structurés et semi-structurés tels que des documents, des messages électroniques, des formats de messagerie complexes, des interactions client, des transactions et des informations provenant d'applications packagées telles que ERP et CRM.

Les outils de transformation de données ne sont pas conçus pour fonctionner correctement avec des données non structurées. En conséquence, les entreprises qui ont besoin d'incorporer des informations non structurées dans leur processus décisionnel ont été confrontées à une quantité importante de codage manuel pour réaliser l'intégration de données requise.

Compte tenu de la croissance et de l'importance des données non structurées pour la prise de décision, les solutions ETL des principaux fournisseurs commencent à proposer des approches standardisées pour transformer les données non structurées afin de les intégrer plus facilement aux données structurées opérationnelles.

Rôle de l'ETL traditionnel dans les mégadonnées - mannequins

Le choix des éditeurs

Pour les seniors: Comment travailler avec Windows dans Microsoft Windows - les nuls

Pour les seniors: Comment travailler avec Windows dans Microsoft Windows - les nuls

Windows, avec un W majuscule, tire son nom de sa caractéristique principale: Windows, avec un w minuscule. Se familiariser avec Windows signifie apprendre à ouvrir, fermer, redimensionner, déplacer et basculer entre les fenêtres, ce qui est la clé pour jongler avec succès avec plusieurs activités. Chaque programme que vous exécutez occupe sa propre fenêtre. Une fenêtre peut occuper une partie de ...

Comment accepter ou rejeter les cookies dans Safari - dummies

Comment accepter ou rejeter les cookies dans Safari - dummies

Un cookie est un petit fichier qu'un site Web enregistre automatiquement sur le disque dur de votre Mac. Il contient des informations, telles que vos préférences ou votre date de naissance, que le site utilisera lors de vos prochaines visites. Dans Mac OS X Snow Leopard, Safari vous permet de choisir d'accepter ou non tous les cookies ...

Le choix des éditeurs

Construire des boîtes et des lignes Bézier dans QuarkXPress - des nuls

Construire des boîtes et des lignes Bézier dans QuarkXPress - des nuls

Pour créer une boîte ou une ligne dans QuarkXPress plus complexe qu'un simple rectangle, ovale ou starburst, vous entrez dans le domaine du chemin de Bézier. Si vous avez utilisé l'outil Plume dans Adobe Illustrator ou Photoshop, vous comprenez déjà les chemins de Bézier. Il faut un peu de pratique et un esprit détendu ...

Création d'un rapport avec Crystal Reports 10 - témoins

Création d'un rapport avec Crystal Reports 10 - témoins

Lorsque vous démarrez Crystal Reports 10, généralement l'une des trois choses suivantes: créer un rapport, modifier un rapport ou exécuter un rapport sur les données de votre base de données. Les rapports prennent des données à partir d'une base de données, les traitent, les formatent et les affichent ensuite sur une imprimante, un écran d'ordinateur ou un site Web. Crystal Reports ...

Traitant des commentaires Javadoc dans Eclipse - mannequins

Traitant des commentaires Javadoc dans Eclipse - mannequins

Lorsque vous utilisez Eclipse pour écrire du code Java, n'oubliez pas de éditez les commentaires de Javadoc (les choses qui commencent par / **). Vous pouvez ajouter des informations utiles lorsque vous modifiez les commentaires Javadoc et lorsque vous les modifiez, l'aide au code d'Eclipse propose des suggestions. N'oubliez pas ces astuces lorsque vous modifiez vos commentaires Javadoc: Ajouter un commentaire Javadoc: ...

Le choix des éditeurs

Les connexions cachées sur le Nikon D5600 - les nuls

Les connexions cachées sur le Nikon D5600 - les nuls

Ouvrent les couvercles sur les côtés gauche et droit du Nikon D5600 caméra, et vous verrez plusieurs ports de connexions cachées. Les ports de connexion suivants sont indiqués sur cette image: Terminal d'accessoires: ce terminal accepte les accessoires suivants: câble déclencheur à distance Nikon MC-DC2; Télécommandes sans fil WR-1 et WR-R10; et les unités GPS GP-1 / GP-1A. I ...

Les connexions cachées sur votre Nikon D5200 - les nuls

Les connexions cachées sur votre Nikon D5200 - les nuls

ÉParpillés sur l'extérieur de votre appareil photo sont nombreuses commandes que vous utilisez pour changer d'image -prend des paramètres, revoir et modifier vos photos, et effectuer diverses autres opérations. Caché sous le couvercle sur le côté gauche de la caméra, vous trouverez les quatre ports de connexion suivants, étiquetés dans cette figure: Borne accessoire: Vous pouvez brancher le Nikon en option ...

Des boutons et autres commandes du Nikon D7500 - mannequins

Des boutons et autres commandes du Nikon D7500 - mannequins

C'est génial d'avoir une carte pour le boutons et commandes sur votre appareil photo, mais ce n'est pas beaucoup d'aide si vous ne pouvez pas vous rappeler quel bouton appuyer sur quand (et pourquoi). Alors, voici un aperçu des fonctions des contrôles les plus importants. (Certains contrôles ont des fonctions supplémentaires pendant certaines opérations, mais la table ...