Accueil Finances personnelles Rôle de l'ETL traditionnel dans les mégadonnées - mannequins

Rôle de l'ETL traditionnel dans les mégadonnées - mannequins

Vidéo: Pourquoi privilégier un ELT à un ETL avec Snowflake ? 2025

Vidéo: Pourquoi privilégier un ELT à un ETL avec Snowflake ? 2025
Anonim

Les outils ETL combinent trois fonctions importantes (extraction, transformation, chargement) nécessaires pour obtenir des données à partir d'un gros environnement de données et le mettre dans un autre environnement de données. Traditionnellement, ETL a été utilisé avec le traitement par lots dans les environnements d'entrepôt de données. Les entrepôts de données offrent aux utilisateurs métier un moyen de consolider les informations pour analyser et générer des rapports sur les données pertinentes à leurs activités. Les outils ETL sont utilisés pour transformer les données dans le format requis par les entrepôts de données.

La transformation est en fait effectuée dans un emplacement intermédiaire avant le chargement des données dans l'entrepôt de données. De nombreux fournisseurs de logiciels, notamment IBM, Informatica, Pervasive, Talend et Pentaho, fournissent des outils logiciels ETL.

ETL fournit l'infrastructure sous-jacente pour l'intégration en effectuant trois fonctions importantes:

  • Extraire: Lire les données de la base de données source.

  • Transformation: Convertit le format des données extraites afin qu'elles soient conformes aux exigences de la base de données cible. La transformation est effectuée en utilisant des règles ou en fusionnant des données avec d'autres données.

  • Charger: Écrire des données dans la base de données cible.

Cependant, ETL évolue pour prendre en charge l'intégration beaucoup plus que les entrepôts de données traditionnels. ETL peut prendre en charge l'intégration à travers les systèmes transactionnels, les banques de données opérationnelles, les plates-formes BI, les hubs MDM, le cloud et les plates-formes Hadoop. Les éditeurs de logiciels ETL étendent leurs solutions pour fournir l'extraction, la transformation et le chargement de Big Data entre Hadoop et les plates-formes de gestion de données traditionnelles.

Les outils ETL et logiciels pour d'autres processus d'intégration de données tels que le nettoyage, le profilage et l'audit de données travaillent tous sur différents aspects des données afin de garantir leur fiabilité. Les outils ETL intègrent des outils de qualité des données, et beaucoup incorporent des outils pour le nettoyage des données, le mappage des données et l'identification du lignage des données. Avec ETL, vous extrayez uniquement les données dont vous aurez besoin pour l'intégration.

Des outils ETL sont nécessaires pour le chargement et la conversion de données structurées et non structurées dans Hadoop. Les outils ETL avancés peuvent lire et écrire plusieurs fichiers en parallèle depuis et vers Hadoop pour simplifier la fusion des données dans un processus de transformation commun. Certaines solutions intègrent des bibliothèques de transformations ETL prédéfinies pour les données de transaction et d'interaction qui s'exécutent sur Hadoop ou sur une infrastructure de grille traditionnelle.

La transformation de données consiste à modifier le format des données afin qu'elles puissent être utilisées par différentes applications.Cela peut signifier un changement du format dans lequel les données sont stockées dans le format requis par l'application qui utilisera les données. Ce processus comprend également des instructions de mappage afin que les applications sachent comment obtenir les données à traiter.

Le processus de transformation des données est beaucoup plus complexe en raison de la croissance vertigineuse de la quantité de données non structurées. Une application métier telle qu'une gestion de la relation client a des exigences spécifiques sur la manière dont les données doivent être stockées. Les données sont susceptibles d'être structurées dans les lignes et les colonnes organisées d'une base de données relationnelle. Les données sont semi-structurées ou non structurées si elles ne respectent pas les exigences de format rigides.

Les informations contenues dans un message électronique sont considérées comme non structurées, par exemple. Certaines des informations les plus importantes d'une entreprise se trouvent dans des formulaires non structurés et semi-structurés tels que des documents, des messages électroniques, des formats de messagerie complexes, des interactions client, des transactions et des informations provenant d'applications packagées telles que ERP et CRM.

Les outils de transformation de données ne sont pas conçus pour fonctionner correctement avec des données non structurées. En conséquence, les entreprises qui ont besoin d'incorporer des informations non structurées dans leur processus décisionnel ont été confrontées à une quantité importante de codage manuel pour réaliser l'intégration de données requise.

Compte tenu de la croissance et de l'importance des données non structurées pour la prise de décision, les solutions ETL des principaux fournisseurs commencent à proposer des approches standardisées pour transformer les données non structurées afin de les intégrer plus facilement aux données structurées opérationnelles.

Rôle de l'ETL traditionnel dans les mégadonnées - mannequins

Le choix des éditeurs

Comment envoyer une demande de connexion LinkedIn à un membre existant - des nuls

Comment envoyer une demande de connexion LinkedIn à un membre existant - des nuls

Quand vous ' re sur une page LinkedIn et repérez le nom d'un membre que vous souhaitez inviter sur votre réseau, vous pouvez suivre ces étapes pour envoyer une demande de connexion à cette personne.

Comment rechercher LinkedIn par nom - mannequins

Comment rechercher LinkedIn par nom - mannequins

Lorsque vous souhaitez trouver une personne spécifique sur LinkedIn, vous pouvez recherche par nom. LinkedIn a développé des champs spéciaux de recherche de nom et de prénom pour vous aider à trouver cette personne. Lorsque vous effectuez une recherche par nom, vous devez entrer le nom de famille; entrer le prénom est facultatif. Lorsque vous êtes prêt à rechercher ...

Rechercher LinkedIn par mot-clé - dummies

Rechercher LinkedIn par mot-clé - dummies

Lorsque vous effectuez une recherche par mot-clé, LinkedIn analyse les profils de chacun pour trouver un mot correspondant. Vous pouvez mettre n'importe quel type de compétence, de mot à la mode, d'intérêt ou d'autre mot-clé qui serait présent dans le profil de quelqu'un pour voir qui est dans votre réseau. Pour effectuer une recherche par mot-clé, procédez comme suit:

Le choix des éditeurs

Encouragez votre blog visiteurs à Digg votre contenu - mannequins

Encouragez votre blog visiteurs à Digg votre contenu - mannequins

Digg est un service Web dédié à facilement utilisables contenu alimenté. Digg se spécialise dans l'évaluation de la communauté des utilisateurs et le vote, ce qui permet aux utilisateurs de soumettre et de voter sur le contenu, les commentaires, les vidéos ou les images qui sont importants et ceux qui ne le sont pas. Digg est un excellent outil pour garder un œil sur ce qui est populaire et intéressant en ligne, en particulier ...

Habiller votre podcast avec de la musique et des effets sonores - des mannequins

Habiller votre podcast avec de la musique et des effets sonores - des mannequins

Rien ne pimente un podcast petite intro ou musique de fond. Mais les podcasts - même s'ils sont produits et libérés sans frais pour l'auditeur - ne sont pas exemptés des restrictions de droits d'auteur. Vous devez rechercher de la musique ou des images appartenant au domaine public ou autorisées à être republiées. Soyons clairs: même si ...

Appliquer les règles de la communauté en ligne: quand interdire les membres - mannequins

Appliquer les règles de la communauté en ligne: quand interdire les membres - mannequins

Demandant aux membres de quitter une communauté en ligne Cela va à contre-courant quand il s'agit de construire une communauté. Les gestionnaires de communauté veulent ajouter de nouveaux membres, ne pas se débarrasser d'eux. Pourtant, à certaines occasions, vous devez révoquer les adhésions parce que les membres refusent simplement de respecter les règles: Quand vous les avez prévenus ...

Le choix des éditeurs

Comment créer un tableau croisé dynamique dans Excel 2010 - dummies

Comment créer un tableau croisé dynamique dans Excel 2010 - dummies

Un tableau croisé dynamique est un type spécial de tableau récapitulatif qui est unique à Excel. Les tableaux croisés dynamiques sont parfaits pour synthétiser des valeurs dans une table car ils font leur magie sans vous obliger à créer des formules pour effectuer les calculs. Les tableaux croisés dynamiques vous permettent également de jouer avec l'arrangement des données résumées. C'est cette capacité ...

Comment créer un diagramme de dispersion dans Excel - des nuls

Comment créer un diagramme de dispersion dans Excel - des nuls

L'une des formes de données les plus intéressantes et utiles analyse que vous pouvez effectuer dans Excel est l'analyse de régression. Dans l'analyse de régression, vous explorez la relation entre deux ensembles de valeurs, en recherchant l'association. Par exemple, vous pouvez utiliser l'analyse de régression pour déterminer si les dépenses publicitaires sont associées aux ventes, si le tabagisme est associé ...

Comment créer des graphiques via l'outil d'analyse rapide dans Excel 2013 - les nuls

Comment créer des graphiques via l'outil d'analyse rapide dans Excel 2013 - les nuls

Pour ceux Lorsque vous devez sélectionner un sous-ensemble d'une table de données comme plage à représenter dans Excel 2013 (par opposition à la sélection d'une seule cellule dans une table de données), vous pouvez utiliser le nouvel outil Analyse rapide pour créer votre graphique. Procédez comme suit: