Accueil Finances personnelles Les fondamentaux de l'intégration Big Data - Les nuls

Les fondamentaux de l'intégration Big Data - Les nuls

Vidéo: Big Data : Intégration et analyse de données 2025

Vidéo: Big Data : Intégration et analyse de données 2025
Anonim

Les éléments fondamentaux de la plate-forme Big Data gèrent les données différemment de la base de données relationnelle traditionnelle. Ceci est dû au besoin d'avoir l'évolutivité et la haute performance requises pour gérer des données structurées et non structurées.

Les composants de l'écosystème Big Data allant de Hadoop à NoSQL DB, MongoDB, Cassandra et HBase ont tous leur propre approche pour extraire et charger des données. Par conséquent, vos équipes devront peut-être développer de nouvelles compétences pour gérer le processus d'intégration sur ces plateformes. Cependant, bon nombre des meilleures pratiques en matière de gestion des données de votre entreprise deviendront encore plus importantes à mesure que vous évoluerez dans le monde du Big Data.

Alors que le big data introduit un nouveau niveau de complexité d'intégration, les principes fondamentaux de base s'appliquent toujours. Votre objectif d'entreprise doit être axé sur la fourniture de données fiables et de qualité à l'organisation au bon moment et dans le bon contexte.

Pour garantir cette confiance, vous devez établir des règles communes pour la qualité des données, en mettant l'accent sur l'exactitude et l'exhaustivité des données. En outre, vous avez besoin d'une approche globale pour développer des métadonnées d'entreprise, en gardant une trace de la lignée de données et de la gouvernance pour prendre en charge l'intégration de vos données.

Pour prendre de bonnes décisions commerciales basées sur l'analyse de grandes quantités de données, cette information doit être fiable et comprise à tous les niveaux de l'organisation. Même s'il ne sera probablement pas rentable de trop se préoccuper de la qualité des données à l'étape exploratoire d'une analyse de données volumineuses, la qualité et la confiance devront éventuellement jouer un rôle si les résultats doivent être intégrés dans le processus opérationnel.

Les informations doivent être fournies à l'entreprise de manière fiable, contrôlée, cohérente et flexible dans toute l'entreprise, quelles que soient les exigences propres à chaque système ou application. Pour atteindre cet objectif, trois principes de base s'appliquent:

Vous devez créer une compréhension commune des définitions de données.

  • Aux premières étapes de votre analyse de Big Data, il est peu probable que vous ayez le même niveau de contrôle sur les définitions de données que sur vos données opérationnelles.Cependant, une fois que vous avez identifié les modèles les plus pertinents pour votre entreprise, vous devez pouvoir mapper les éléments de données à une définition commune. Vous devez développer un ensemble de services de données pour qualifier les données et les rendre cohérentes et finalement fiables.

  • Lorsque vos sources de données non structurées et volumineuses sont intégrées à des données opérationnelles structurées, vous devez être sûr que les résultats seront significatifs. Vous avez besoin d'un moyen rationalisé pour intégrer vos sources de données volumineuses et vos systèmes d'enregistrement.

  • Pour prendre de bonnes décisions en fonction des résultats de votre analyse Big Data, vous devez fournir des informations au bon moment et dans le bon contexte. Votre processus d'intégration de Big Data devrait assurer la cohérence et la fiabilité. Pour intégrer des données dans des environnements d'application mixtes, obtenez des données d'un environnement de données (source) vers un autre environnement de données (cible). Des technologies d'extraction, de transformation et de chargement (ETL) ont été utilisées pour ce faire dans les environnements d'entrepôt de données traditionnels. Le rôle d'ETL évolue pour gérer de nouveaux environnements de gestion de données comme Hadoop.

Dans un environnement Big Data, vous devrez peut-être combiner des outils prenant en charge les processus d'intégration par lots (à l'aide d'ETL) avec l'intégration en temps réel et la fédération sur plusieurs sources. Par exemple, une entreprise pharmaceutique peut avoir besoin de mélanger les données stockées dans son système de gestion des données de base (MDM) avec de grandes sources de données sur les résultats médicaux de l'utilisation des médicaments par les clients.

Les entreprises utilisent MDM pour faciliter la collecte, l'agrégation, la consolidation et la fourniture de données cohérentes et fiables de manière contrôlée dans toute l'entreprise. En outre, de nouveaux outils tels que Sqoop et Scribe sont utilisés pour prendre en charge l'intégration d'environnements Big Data. Vous trouvez également un intérêt croissant pour l'utilisation des technologies d'extraction, de chargement et de transformation (ELT). Ces technologies sont décrites ci-dessous.

Les fondamentaux de l'intégration Big Data - Les nuls

Le choix des éditeurs

Comment créer et éditer des tableaux dans AutoCAD 2014 - mannequins

Comment créer et éditer des tableaux dans AutoCAD 2014 - mannequins

AutoCAD 2014 vous fournit avec bonheur la TABLE commande pour vos besoins de table. Après avoir créé un style de tableau approprié, l'ajout d'une table à un dessin est facile, avec la commande TABLE. Voici comment: Définir un courant de couche approprié. En supposant que vous laissez la couleur, le type de ligne et le poids de ligne définis sur ByLayer, le calque courant est ...

Comment créer et restaurer une vue nommée dans AutoCAD 2014 - les nuls

Comment créer et restaurer une vue nommée dans AutoCAD 2014 - les nuls

Si vous avez plusieurs fois Pour effectuer un zoom et effectuer un panoramique sur la même zone dans AutoCAD 2014, vous pouvez rapidement voir ce que vous voulez en utilisant une vue nommée. Après avoir nommé et enregistré une vue d'une zone particulière d'un dessin, vous pouvez revenir rapidement à cette zone en restaurant la vue. Vous utilisez ...

Comment créer un nouveau dessin à partir d'un dessin de modèle dans AutoCAD 2014 - les nuls

Comment créer un nouveau dessin à partir d'un dessin de modèle dans AutoCAD 2014 - les nuls

Lorsque vous démarrez dans l'espace de travail Drafting & Annotation ou dans l'ancien espace de travail AutoCAD Classic, AutoCAD 2014 crée un nouveau dessin vide configuré pour le dessin 2D. Selon l'endroit où vous vivez (votre pays, pas votre adresse postale!) Et le système de mesure dominant utilisé, AutoCAD basera ce nouveau dessin sur l'un des ...

Le choix des éditeurs

Automatiser les contrôles de sécurité du courrier électronique pour empêcher les piratages par courrier électronique - dummies

Automatiser les contrôles de sécurité du courrier électronique pour empêcher les piratages par courrier électronique - dummies

Le courrier électronique est un point d'entrée commun pour les attaques de piratage sur tous les types de systèmes - Windows, Linux, Unix - vous l'appelez. Vous pouvez implémenter les contre-mesures suivantes en tant que couche de sécurité supplémentaire pour vos systèmes de messagerie: Tarpitting: Tarpitting détecte les messages entrants destinés à des utilisateurs inconnus. Si votre serveur de messagerie prend en charge le tarpitting, il peut ...

ÉValue les vulnérabilités avec Hacks éthiques - mannequins

ÉValue les vulnérabilités avec Hacks éthiques - mannequins

Si vous trouvez des failles de sécurité potentielles, la prochaine étape consiste à confirmer vulnérabilités dans votre système ou votre réseau. Avant de tester, effectuez une recherche manuelle. Vous pouvez rechercher des babillards hackers, des sites Web et des bases de données de vulnérabilités, telles que: Common Vulnerabilities and Exposures Base de données de vulnérabilités US-CERT NIST National Vulnerability Database Ces sites répertorient les ...

Authentification des utilisateurs VPN Enterprise Mobile - Mannequins

Authentification des utilisateurs VPN Enterprise Mobile - Mannequins

Avant d'autoriser l'accès au réseau d'entreprise à partir de n'importe quel appareil mobile , vous devez d'abord identifier l'utilisateur. Un type de validation d'identité d'utilisateur est l'authentification. L'authentification de l'utilisateur est la validation qu'un utilisateur est vraiment ce qu'elle dit être. En d'autres termes, l'authentification de l'utilisateur prouve que la personne qui tente de se connecter à ...

Le choix des éditeurs

Pourquoi Word Knowledge est important pour ASVAB - mannequins

Pourquoi Word Knowledge est important pour ASVAB - mannequins

Mot La connaissance ne fait pas partie de l'ASVAB juste parce que l'armée aime utiliser de grands mots. C'est inclus parce que les mots représentent des idées, et plus vous comprenez de mots, plus vous pouvez comprendre d'idées (et mieux vous pouvez communiquer avec les autres). Un vocabulaire décent est essentiel dans l'armée si vous voulez ...

Comprendre le Big Four sur l'ASVAB: vos scores AFQT - les nuls

Comprendre le Big Four sur l'ASVAB: vos scores AFQT - les nuls

L'ASVAB pas de score global. Quand vous entendez quelqu'un dire: «J'ai un 80 sur mon ASVAB», cette personne parle du score du test de qualification des forces armées (AFQT), pas un score global ASVAB. Le score AFQT détermine si vous pouvez même vous enrôler dans l'armée, et seulement quatre des sous-tests ...