Accueil Finances personnelles Big Data Analysis et Data Warehouse - les nuls

Big Data Analysis et Data Warehouse - les nuls

Table des matières:

Vidéo: Machine Learning Tutorial 5 - Big Data, Data Warehouse, Hadoop, Federation 2025

Vidéo: Machine Learning Tutorial 5 - Big Data, Data Warehouse, Hadoop, Federation 2025
Anonim

Vous trouverez utile de réunir les capacités de l'entrepôt de données et de l'environnement Big Data. Vous devez créer un environnement hybride où les données volumineuses peuvent fonctionner de pair avec l'entrepôt de données.

Tout d'abord, il est important de reconnaître que l'entrepôt de données tel qu'il est conçu aujourd'hui ne changera pas à court terme.

Par conséquent, il est plus pragmatique d'utiliser l'entrepôt de données pour ce pour quoi il a été conçu - fournir une version bien vérifiée de la vérité sur un sujet que l'entreprise veut analyser. L'entrepôt peut inclure des informations sur la gamme de produits d'une entreprise particulière, ses clients, ses fournisseurs et les détails des transactions d'une année.

Les informations gérées dans l'entrepôt de données ou dans un entrepôt de données départemental ont été soigneusement conçues pour que les métadonnées soient exactes. Avec la croissance de nouvelles informations sur le Web, il est pratique et souvent nécessaire d'analyser cette quantité massive de données dans le contexte des données historiques. C'est là qu'intervient le modèle hybride.

Certains aspects du mariage de l'entrepôt de données avec le Big Data peuvent être relativement faciles. Par exemple, de nombreuses sources de données volumineuses proviennent de sources qui incluent leurs propres métadonnées bien conçues. Les sites de commerce électronique complexes comprennent des éléments de données bien définis. Par conséquent, lors de l'analyse entre l'entrepôt et la grande source de données, l'organisation de gestion de l'information travaille avec deux ensembles de données avec des modèles de métadonnées soigneusement conçus qui doivent être rationalisés.

Bien sûr, dans certaines situations, les sources d'information manquent de métadonnées explicites. Avant qu'un analyste puisse combiner les données transactionnelles historiques avec les grandes données moins structurées, le travail doit être fait. Typiquement, l'analyse initiale de pétaoctets de données révélera des modèles intéressants qui peuvent aider à prédire des changements subtils dans les affaires ou des solutions potentielles au diagnostic d'un patient.

L'analyse initiale peut être complétée en utilisant des outils tels que MapReduce avec la structure de système de fichiers distribué Hadoop. À ce stade, vous pouvez commencer à comprendre si elle est en mesure d'aider à évaluer le problème à résoudre.

Dans le processus d'analyse, il est tout aussi important d'éliminer les données inutiles que d'identifier les données pertinentes au contexte commercial. Lorsque cette phase est terminée, les données restantes doivent être transformées pour que les définitions de métadonnées soient précises. De cette façon, lorsque les grandes données sont combinées avec les données historiques traditionnelles de l'entrepôt, les résultats seront précis et significatifs.

Le lynchpin d'intégration de Big Data

Ce processus nécessite une stratégie d'intégration de données bien définie. Bien que l'intégration des données soit un élément essentiel de la gestion des mégadonnées, elle est tout aussi importante lors de la création d'une analyse hybride avec l'entrepôt de données. En fait, le processus d'extraction de données et de transformation dans un environnement hybride est très similaire à la façon dont ce processus est exécuté dans un entrepôt de données traditionnel.

Dans l'entrepôt de données, les données sont extraites des systèmes source traditionnels tels que les systèmes CRM ou ERP. Il est essentiel que les éléments de ces différents systèmes soient correctement appariés.

Repenser l'extraction, la transformation et les charges pour les entrepôts de données

Dans l'entrepôt de données, vous trouvez souvent une combinaison de tables de bases de données relationnelles, de fichiers plats et de sources non relationnelles. Un entrepôt de données bien construit sera conçu de manière à ce que les données soient converties dans un format commun, ce qui permettra de traiter les requêtes de manière précise et cohérente. Les fichiers extraits doivent être transformés pour correspondre aux règles métier et aux processus du domaine que l'entrepôt de données doit analyser.

En d'autres termes, les données doivent être extraites des sources de données volumineuses afin que ces sources puissent travailler ensemble en toute sécurité et produire des résultats significatifs. En outre, les sources doivent être transformées pour qu'elles soient utiles dans l'analyse de la relation entre les données historiques et les données plus dynamiques et en temps réel provenant de sources de données volumineuses.

Le chargement des informations dans le modèle Big Data sera différent de ce que vous attendez dans un entrepôt de données traditionnel. Avec les entrepôts de données, une fois les données codifiées, elles ne changent jamais. Un entrepôt de données typique fournira à l'entreprise un instantané des données en fonction de la nécessité d'analyser un problème commercial particulier nécessitant une surveillance, tel que l'inventaire ou les ventes.

La structure distribuée des mégadonnées amènera souvent les organisations à charger d'abord des données dans une série de nœuds, puis à effectuer l'extraction et la transformation. Lors de la création d'un hybride entre l'entrepôt de données traditionnel et l'environnement Big Data, la nature distribuée de l'environnement Big Data peut considérablement modifier la capacité des organisations à analyser d'énormes volumes de données dans le contexte de l'entreprise.

Big Data Analysis et Data Warehouse - les nuls

Le choix des éditeurs

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Pour approfondir votre conscience consciente, vous devez pratiquer une méditation de pleine conscience sur une base quotidienne. Familiarisez-vous avec certaines des médiations suivantes. Avec le temps, vous deviendrez plus conscient de votre vie quotidienne. Body Meditation Meditation - Cette méditation implique de passer environ une demi-heure, en prenant conscience de ...

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Les Templiers sont presque aussi fictifs dans Dan Brown Le code Da Vinci comme les chevaliers Jedi sont dans Star Wars. Bien que le héros Robert Langdon hésite d'abord à élever les Templiers dans ses cours, parce que la mention même d'eux fait ressortir les amants du complot, Brown n'a aucun problème à les faire participer ...

Démystification des mythes communs sur la franc-maçonnerie - mannequins

Démystification des mythes communs sur la franc-maçonnerie - mannequins

La franc-maçonnerie moderne existe depuis 1717. Les premières contre-vérités concoctées sur l'Ordre sont apparues en impression à peu près en même temps. Les États-Unis étaient consumés par l'hystérie anti-maçonnique à la fin des années 1820, et l'Europe a fait de Mason-bashing un sport populaire pendant deux siècles, le liant souvent à la propagande antisémite. Internet n'a que ...

Le choix des éditeurs

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

Dans la boîte de dialogue Configurer l'affichage dans PowerPoint, cliquez sur le bouton Configurer l'affichage dans l'onglet Diaporama du ruban Office 2011 pour Mac, ou choisissez Diaporama → Configurer l'affichage dans la barre de menus. Dans les deux cas, la boîte de dialogue Configurer l'affichage polyvalent apparaît. Choisir un type de spectacle dans PowerPoint 2011 pour Mac ...

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement d'un fichier sur lequel vous travaillez dans Office 2011 pour Mac est aussi simple que de cliquer sur le bouton Enregistrer dans la barre d'outils Standard, en appuyant sur Commande-S ou en choisissant Fichier → Enregistrer. Si votre fichier a été enregistré précédemment, l'enregistrement du fichier remplace la copie existante du fichier par votre version mise à jour. Si votre fichier n'a pas ...

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Dans Office 2011 pour Mac, l'ajout d'une nouvelle présentation de diapositive à une diapositive dans la vue Diapositive maître de PowerPoint 2011 est une tâche assez simple à effectuer. Suivez ces étapes pour commencer: Assurez-vous que vous êtes en mode Masque des diapositives. Choisissez Affichage → Maître → Masque de diapositives dans la barre de menus. Cliquez sur l'onglet Masque des diapositives du ruban, ...

Le choix des éditeurs

Sélectionnez PowerPoint 2007 Objects - dummies

Sélectionnez PowerPoint 2007 Objects - dummies

Avant de pouvoir modifier un objet PowerPoint 2007 sur une diapositive, vous devez le sélectionner. Dans les présentations PowerPoint, les objets peuvent être du texte, des graphiques, des images clipart, des formes, etc. Voici quelques instructions pour sélectionner les objets PowerPoint 2007: Objets texte: Pour sélectionner un objet texte PowerPoint 2007, déplacez le point d'insertion sur le texte qui ...

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Le contrôle shapePoint de powerPoint vous permet style des objets de ligne ou la bordure pour les objets de forme solide sur vos diapositives PowerPoint. Le contrôle Shape Outline se trouve dans le groupe Styles de formes de l'onglet Outils de dessin. Vous pouvez modifier les paramètres suivants pour le contour: Couleur: Définit la couleur utilisée pour ...

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 est le logiciel de présentation le plus puissant disponible pour créer et éditer la diapositive montrer des présentations pour le travail, la maison ou l'école. PowerPoint 2016 offre un certain nombre de raccourcis clavier utiles pour effectuer des tâches rapidement. Voici quelques raccourcis pour le formatage PowerPoint commun, l'édition et les tâches de fichiers et de documents. De plus, après avoir créé votre chef-d'œuvre, vous ...