Accueil Finances personnelles Big Data Analysis et Data Warehouse - les nuls

Big Data Analysis et Data Warehouse - les nuls

Table des matières:

Vidéo: Machine Learning Tutorial 5 - Big Data, Data Warehouse, Hadoop, Federation 2025

Vidéo: Machine Learning Tutorial 5 - Big Data, Data Warehouse, Hadoop, Federation 2025
Anonim

Vous trouverez utile de réunir les capacités de l'entrepôt de données et de l'environnement Big Data. Vous devez créer un environnement hybride où les données volumineuses peuvent fonctionner de pair avec l'entrepôt de données.

Tout d'abord, il est important de reconnaître que l'entrepôt de données tel qu'il est conçu aujourd'hui ne changera pas à court terme.

Par conséquent, il est plus pragmatique d'utiliser l'entrepôt de données pour ce pour quoi il a été conçu - fournir une version bien vérifiée de la vérité sur un sujet que l'entreprise veut analyser. L'entrepôt peut inclure des informations sur la gamme de produits d'une entreprise particulière, ses clients, ses fournisseurs et les détails des transactions d'une année.

Les informations gérées dans l'entrepôt de données ou dans un entrepôt de données départemental ont été soigneusement conçues pour que les métadonnées soient exactes. Avec la croissance de nouvelles informations sur le Web, il est pratique et souvent nécessaire d'analyser cette quantité massive de données dans le contexte des données historiques. C'est là qu'intervient le modèle hybride.

Certains aspects du mariage de l'entrepôt de données avec le Big Data peuvent être relativement faciles. Par exemple, de nombreuses sources de données volumineuses proviennent de sources qui incluent leurs propres métadonnées bien conçues. Les sites de commerce électronique complexes comprennent des éléments de données bien définis. Par conséquent, lors de l'analyse entre l'entrepôt et la grande source de données, l'organisation de gestion de l'information travaille avec deux ensembles de données avec des modèles de métadonnées soigneusement conçus qui doivent être rationalisés.

Bien sûr, dans certaines situations, les sources d'information manquent de métadonnées explicites. Avant qu'un analyste puisse combiner les données transactionnelles historiques avec les grandes données moins structurées, le travail doit être fait. Typiquement, l'analyse initiale de pétaoctets de données révélera des modèles intéressants qui peuvent aider à prédire des changements subtils dans les affaires ou des solutions potentielles au diagnostic d'un patient.

L'analyse initiale peut être complétée en utilisant des outils tels que MapReduce avec la structure de système de fichiers distribué Hadoop. À ce stade, vous pouvez commencer à comprendre si elle est en mesure d'aider à évaluer le problème à résoudre.

Dans le processus d'analyse, il est tout aussi important d'éliminer les données inutiles que d'identifier les données pertinentes au contexte commercial. Lorsque cette phase est terminée, les données restantes doivent être transformées pour que les définitions de métadonnées soient précises. De cette façon, lorsque les grandes données sont combinées avec les données historiques traditionnelles de l'entrepôt, les résultats seront précis et significatifs.

Le lynchpin d'intégration de Big Data

Ce processus nécessite une stratégie d'intégration de données bien définie. Bien que l'intégration des données soit un élément essentiel de la gestion des mégadonnées, elle est tout aussi importante lors de la création d'une analyse hybride avec l'entrepôt de données. En fait, le processus d'extraction de données et de transformation dans un environnement hybride est très similaire à la façon dont ce processus est exécuté dans un entrepôt de données traditionnel.

Dans l'entrepôt de données, les données sont extraites des systèmes source traditionnels tels que les systèmes CRM ou ERP. Il est essentiel que les éléments de ces différents systèmes soient correctement appariés.

Repenser l'extraction, la transformation et les charges pour les entrepôts de données

Dans l'entrepôt de données, vous trouvez souvent une combinaison de tables de bases de données relationnelles, de fichiers plats et de sources non relationnelles. Un entrepôt de données bien construit sera conçu de manière à ce que les données soient converties dans un format commun, ce qui permettra de traiter les requêtes de manière précise et cohérente. Les fichiers extraits doivent être transformés pour correspondre aux règles métier et aux processus du domaine que l'entrepôt de données doit analyser.

En d'autres termes, les données doivent être extraites des sources de données volumineuses afin que ces sources puissent travailler ensemble en toute sécurité et produire des résultats significatifs. En outre, les sources doivent être transformées pour qu'elles soient utiles dans l'analyse de la relation entre les données historiques et les données plus dynamiques et en temps réel provenant de sources de données volumineuses.

Le chargement des informations dans le modèle Big Data sera différent de ce que vous attendez dans un entrepôt de données traditionnel. Avec les entrepôts de données, une fois les données codifiées, elles ne changent jamais. Un entrepôt de données typique fournira à l'entreprise un instantané des données en fonction de la nécessité d'analyser un problème commercial particulier nécessitant une surveillance, tel que l'inventaire ou les ventes.

La structure distribuée des mégadonnées amènera souvent les organisations à charger d'abord des données dans une série de nœuds, puis à effectuer l'extraction et la transformation. Lors de la création d'un hybride entre l'entrepôt de données traditionnel et l'environnement Big Data, la nature distribuée de l'environnement Big Data peut considérablement modifier la capacité des organisations à analyser d'énormes volumes de données dans le contexte de l'entreprise.

Big Data Analysis et Data Warehouse - les nuls

Le choix des éditeurs

Android Aide au développement de jeu - dummies

Android Aide au développement de jeu - dummies

Développer un jeu Android est un processus complexe, mais il y a beaucoup d'expérience pour vous guider. Les ressources en ligne et personnelles peuvent faire du processus un voyage de découverte, pas des impasses: Vous êtes bloqué avec une question technique sur la façon d'accomplir une tâche particulière ou de gérer un bug? Essayez de poster la question sur StackOverflow. com ou ...

Un aperçu de GameMaker: Interface Studio - des mannequins

Un aperçu de GameMaker: Interface Studio - des mannequins

La zone de travail de base de GameMaker est composée de plusieurs sections. Ces sections sont disposées de manière organisée pour former l'interface à partir de laquelle vous travaillez. Vous voyez un menu principal en haut et un menu d'icônes directement en dessous; ces deux menus fournissent des moyens distincts, par exemple, de créer un Sprite, en chargeant un ...

Affecter une action à un objet dans GameMaker: Studio - des mannequins

Affecter une action à un objet dans GameMaker: Studio - des mannequins

Le verbe dans une phrase: Ils disent aux Objets quoi faire, quand le faire, et comment le faire. Les actions sont ce qui fait rebondir un clown sur le mur, ou un avion pour tirer une balle, ou un astéroïde pour se séparer en morceaux. En utilisant Actions, ...

Le choix des éditeurs

Page Décisions de mise en page à rendre dans SharePoint 2010 - mannequins

Page Décisions de mise en page à rendre dans SharePoint 2010 - mannequins

Selon la complexité du site, vous devrez peut-être créer un nouveau type de contenu et / ou des colonnes de site supplémentaires pour vos mises en page dans SharePoint 2010. Si vous souhaitez que vos pages contiennent des champs supplémentaires autres que ceux fournis dans les types de contenu Page d'article et Page d'accueil, tenez compte des éléments suivants: content ...

Accès hors connexion avec SharePoint Online Workspace - nuls

Accès hors connexion avec SharePoint Online Workspace - nuls

Microsoft SharePoint Workspace est l'anciennement Microsoft Office Groove, un application de bureau conçue pour les personnes qui veulent collaborer sur des documents en ligne et hors ligne. Il est fourni avec Office 2010 et fournit une interface utilisateur similaire à l'Explorateur Windows pour l'affichage et l'édition de fichiers et de listes à partir d'un site SharePoint. Espace de travail SharePoint ...

Mise en page Disponible sur le site de publication SharePoint 2010 - dummies

Mise en page Disponible sur le site de publication SharePoint 2010 - dummies

Le site de publication de sharePoint 2010 offre une riche expérience de montage permet à une personne non technique de créer facilement des pages Web. Ajouter votre contenu à la page est un jeu d'enfant. SharePoint fournit de nombreux types de conteneurs de contenu que vous pouvez utiliser lors de la création de votre page, y compris des zones de texte ...

Le choix des éditeurs

Comment envoyer un fichier via Outlook 2013 - des mannequins

Comment envoyer un fichier via Outlook 2013 - des mannequins

Vous pouvez créer des documents dans Microsoft Word ou créer des documents complexes feuilles de calcul avec Excel. Lorsque vous souhaitez envoyer un fichier par courrier électronique, Outlook 2013 est impliqué, même si cela fonctionne parfois en arrière-plan.

Comment envoyer un message avec Outlook. com - dummies

Comment envoyer un message avec Outlook. com - dummies

Lorsque vous ressentez le besoin de lancer un courriel rapide depuis votre cybercafé favori, vous pouvez le faire en un tournemain avec Outlook. com. Vous aurez probablement terminé votre message avant que votre barista ne finisse de mélanger ce suprémo moka latte à haut indice d'octane. Après la disparition de la caféine, procédez comme suit: Cliquez sur Boîte de réception dans les dossiers ...

Comment envoyer un message Outlook 2013 avec une signature numérique - des mannequins

Comment envoyer un message Outlook 2013 avec une signature numérique - des mannequins

Après avoir ID numérique pour Outlook 2013, la chose la plus simple que vous pouvez faire est d'envoyer à quelqu'un un message qui a votre signature numérique. Un message signé numériquement fait plus que simplement assurer à votre destinataire que vous êtes vraiment vous-même - qui d'autre voudriez-vous être, après tout? Supposons que vous vouliez ...