Accueil Finances personnelles Comment hiérarchiser la qualité du Big Data - les nuls

Comment hiérarchiser la qualité du Big Data - les nuls

Vidéo: LA GOUVERNANCE DE LA DONNEE, C'EST QUOI ? 2025

Vidéo: LA GOUVERNANCE DE LA DONNEE, C'EST QUOI ? 2025
Anonim

Trouver le bon point de vue sur la qualité des données peut être très difficile dans le monde des données volumineuses. Avec la majorité des grandes sources de données, vous devez supposer que vous travaillez avec des données qui ne sont pas propres. En fait, l'abondance de données apparemment aléatoires et déconnectées dans les flux de données de médias sociaux est l'une des choses qui les rendent si utiles aux entreprises.

Vous commencez par rechercher des pétaoctets de données sans savoir ce que vous pourriez trouver après avoir commencé à rechercher des modèles dans les données. Vous devez accepter le fait qu'il y a beaucoup de bruit dans les données. Ce n'est qu'en cherchant et en faisant correspondre les motifs que vous pourrez trouver des étincelles de vérité au milieu de données très sales.

Phase 1

: Rechercher des tendances dans les données volumineuses sans se soucier de la qualité des données.

Phase 2:

Après avoir localisé vos modèles et établi des résultats importants pour l'entreprise, appliquez les mêmes normes de qualité que celles que vous appliquez à vos sources de données traditionnelles. Vous voulez éviter de collecter et de gérer les mégadonnées qui ne sont pas importantes pour l'entreprise et qui peuvent potentiellement corrompre d'autres éléments de données dans Hadoop ou d'autres plates-formes de Big Data. Lorsque vous commencez à incorporer les résultats de votre analyse de données volumineuses dans votre processus métier, sachez que des données de haute qualité sont essentielles pour qu'une entreprise prenne de bonnes décisions. Ceci est vrai pour les big data ainsi que pour les données traditionnelles.

La qualité des données se réfère aux caractéristiques des données, y compris la cohérence, l'exactitude, la fiabilité, l'exhaustivité, la rapidité, le caractère raisonnable et la validité. Le logiciel de qualité des données s'assure que les éléments de données sont représentés de la même manière dans différents magasins de données ou systèmes afin d'améliorer la cohérence des données.

Par exemple, un magasin de données peut utiliser deux lignes pour l'adresse d'un client et un autre magasin de données peut utiliser une ligne. Cette différence dans la façon dont les données sont représentées peut aboutir à des informations inexactes sur les clients, par exemple un client identifié comme deux clients différents.

Une société peut utiliser des dizaines de variantes du nom de son entreprise lorsqu'elle achète des produits.Un logiciel de qualité des données peut être utilisé pour identifier toutes les variantes du nom de l'entreprise dans vos différents magasins de données et vous assurer que vous savez tout ce que ce client achète de votre entreprise.

Ce processus s'appelle

et fournit une vue unique du client ou du produit. Le logiciel de qualité des données fait correspondre les données entre différents systèmes et nettoie ou supprime les données redondantes. Le processus de qualité des données fournit à l'entreprise des informations plus faciles à utiliser, à interpréter et à comprendre. Les outils de profilage de données sont utilisés dans le processus de qualité des données pour vous aider à comprendre le contenu, la structure et l'état de vos données. Ils collectent des informations sur les caractéristiques des données dans une base de données ou dans un autre magasin de données pour commencer à transformer les données en une forme plus fiable. Les outils analysent les données pour identifier les erreurs et les incohérences.

Ils peuvent faire des ajustements pour ces problèmes et corriger les erreurs. Les outils vérifient les valeurs, les modèles et les plages acceptables et aident à identifier les données qui se chevauchent. Le processus de profilage des données, par exemple, vérifie si les données doivent être alpha ou numériques. Les outils vérifient également les dépendances ou voient comment les données se rapportent aux données d'autres bases de données.

Les outils de profilage de données pour les mégadonnées ont une fonction similaire à celle des outils de profilage de données pour les données traditionnelles. Les outils de profilage de données pour Hadoop vous fourniront des informations importantes sur les données des clusters Hadoop. Ces outils peuvent être utilisés pour rechercher des correspondances et supprimer les doublons. Par conséquent, vous pouvez vous assurer que vos données volumineuses sont cohérentes. Les outils Hadoop comme HiveQL et Pig Latin peuvent être utilisés pour le processus de transformation.

Comment hiérarchiser la qualité du Big Data - les nuls

Le choix des éditeurs

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Pour approfondir votre conscience consciente, vous devez pratiquer une méditation de pleine conscience sur une base quotidienne. Familiarisez-vous avec certaines des médiations suivantes. Avec le temps, vous deviendrez plus conscient de votre vie quotidienne. Body Meditation Meditation - Cette méditation implique de passer environ une demi-heure, en prenant conscience de ...

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Les Templiers sont presque aussi fictifs dans Dan Brown Le code Da Vinci comme les chevaliers Jedi sont dans Star Wars. Bien que le héros Robert Langdon hésite d'abord à élever les Templiers dans ses cours, parce que la mention même d'eux fait ressortir les amants du complot, Brown n'a aucun problème à les faire participer ...

Démystification des mythes communs sur la franc-maçonnerie - mannequins

Démystification des mythes communs sur la franc-maçonnerie - mannequins

La franc-maçonnerie moderne existe depuis 1717. Les premières contre-vérités concoctées sur l'Ordre sont apparues en impression à peu près en même temps. Les États-Unis étaient consumés par l'hystérie anti-maçonnique à la fin des années 1820, et l'Europe a fait de Mason-bashing un sport populaire pendant deux siècles, le liant souvent à la propagande antisémite. Internet n'a que ...

Le choix des éditeurs

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

Dans la boîte de dialogue Configurer l'affichage dans PowerPoint, cliquez sur le bouton Configurer l'affichage dans l'onglet Diaporama du ruban Office 2011 pour Mac, ou choisissez Diaporama → Configurer l'affichage dans la barre de menus. Dans les deux cas, la boîte de dialogue Configurer l'affichage polyvalent apparaît. Choisir un type de spectacle dans PowerPoint 2011 pour Mac ...

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement d'un fichier sur lequel vous travaillez dans Office 2011 pour Mac est aussi simple que de cliquer sur le bouton Enregistrer dans la barre d'outils Standard, en appuyant sur Commande-S ou en choisissant Fichier → Enregistrer. Si votre fichier a été enregistré précédemment, l'enregistrement du fichier remplace la copie existante du fichier par votre version mise à jour. Si votre fichier n'a pas ...

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Dans Office 2011 pour Mac, l'ajout d'une nouvelle présentation de diapositive à une diapositive dans la vue Diapositive maître de PowerPoint 2011 est une tâche assez simple à effectuer. Suivez ces étapes pour commencer: Assurez-vous que vous êtes en mode Masque des diapositives. Choisissez Affichage → Maître → Masque de diapositives dans la barre de menus. Cliquez sur l'onglet Masque des diapositives du ruban, ...

Le choix des éditeurs

Sélectionnez PowerPoint 2007 Objects - dummies

Sélectionnez PowerPoint 2007 Objects - dummies

Avant de pouvoir modifier un objet PowerPoint 2007 sur une diapositive, vous devez le sélectionner. Dans les présentations PowerPoint, les objets peuvent être du texte, des graphiques, des images clipart, des formes, etc. Voici quelques instructions pour sélectionner les objets PowerPoint 2007: Objets texte: Pour sélectionner un objet texte PowerPoint 2007, déplacez le point d'insertion sur le texte qui ...

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Le contrôle shapePoint de powerPoint vous permet style des objets de ligne ou la bordure pour les objets de forme solide sur vos diapositives PowerPoint. Le contrôle Shape Outline se trouve dans le groupe Styles de formes de l'onglet Outils de dessin. Vous pouvez modifier les paramètres suivants pour le contour: Couleur: Définit la couleur utilisée pour ...

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 est le logiciel de présentation le plus puissant disponible pour créer et éditer la diapositive montrer des présentations pour le travail, la maison ou l'école. PowerPoint 2016 offre un certain nombre de raccourcis clavier utiles pour effectuer des tâches rapidement. Voici quelques raccourcis pour le formatage PowerPoint commun, l'édition et les tâches de fichiers et de documents. De plus, après avoir créé votre chef-d'œuvre, vous ...