Table des matières:
- À l'aide des fonctions de préparation des données
- Ciblage des sources de données pour les corrections manuelles
Vidéo: 009 - Tableau [Data Preparation] - Preview Panel (Arabic بالعربي) 2024
Tableau peut fonctionner avec un certain nombre de sources de données différentes, selon l'édition de Tableau que vous avez autorisé. Heureusement, les vraies applications de base de données appliquent certaines règles pour s'assurer que chaque champ d'un enregistrement contient le type de données approprié. Par exemple, les utilisateurs ne peuvent pas entrer de texte arbitraire dans les champs numériques ou de date, car cela rendrait impossible le traitement correct des informations contenues dans la base de données.
Tableau fonctionne avec les données où il réside, que ce soit dans une base de données, des fichiers ou même dans le cloud. Ici, vous découvrez comment travailler avec des sources de données basées sur des fichiers telles que des feuilles de calcul Excel. En raison du manque de structure de données contrôlée, il y a des avantages et des inconvénients que vous devriez connaître.
À l'aide des fonctions de préparation des données
, les feuilles de calcul Excel peuvent inclure des informations superflues ou comporter des éléments tels que des colonnes vides au milieu des données. Voici un exemple de feuille de calcul avec ces deux problèmes.
Notez que Tableau n'affiche pas les noms de champs corrects. Ce qui semble être les noms de champs apparaissent pour la plupart en tant que données dans la première ligne (bien que plusieurs champs affichent null pour indiquer que le contenu n'est pas valide en fonction du type de données du champ). En outre, le champ intitulé F5 semble être complètement rempli de données non valides.
La raison pour laquelle Tableau rencontre des problèmes avec les champs devient plus claire lorsque vous consultez la feuille de calcul dans Excel. Vous pouvez voir des lignes supplémentaires au-dessus des données et une colonne vide dans les données. En outre, la feuille de calcul contient du texte dans la cellule A1 au-dessus de la table de données.
Regarder la feuille de travail révèle les problèmes.Tableau veut que votre feuille de calcul Excel ressemble à une table de base de données. Cela signifie qu'il s'attend à ce que la première ligne contienne des en-têtes de colonne et que chaque rangée suivante contienne des valeurs de données pour chaque colonne. Il s'attend à ce que le type de données dans chaque colonne reste cohérent et qu'il n'y ait aucun espace ou texte étranger inséré n'importe où dans la feuille de calcul.
Si l'une de ces conditions existe, vous devrez soit nettoyer manuellement votre feuille de calcul, soit utiliser Data Interpreter de Tableau.
Heureusement, Tableau peut très bien remarquer un problème et afficher une invite vous demandant si vous voulez que l'outil Interprétation de données tente de corriger les problèmes qui pourraient exister. Pour voir si l'interpréteur de données peut résoudre les problèmes, il suffit de cliquer sur le bouton Activer. Découvrez les résultats de l'utilisation de cet outil sur la feuille de travail exemple.
L'interpréteur de données peut être capable de résoudre les problèmes.Si vous comparez les différentes images ci-dessus, vous constatez que Tableau affiche désormais les noms de champs corrects, qu'il ne contient plus de valeurs nulles dans le premier enregistrement et qu'il a éliminé la colonne vide des résultats.
Vérifiez toujours la zone d'aperçu des données lors de la création de nouvelles connexions pour vous assurer que les données sont conformes à vos attentes.
Ciblage des sources de données pour les corrections manuelles
Bien que Tableau puisse corriger automatiquement de nombreux types de problèmes de mise en page et de formatage, certains problèmes peuvent uniquement être corrigés manuellement. Consultez ci-dessous un exemple de ce type de problème. Dans ce cas, les dates d'expédition dans les enregistrements 27 et 28 n'ont pas été entrées correctement, de sorte qu'elles indiquent des dates nulles plutôt que réelles. Si vous utilisez ces données dans Tableau, ces valeurs nulles peuvent vous donner des résultats incorrects.
Les valeurs NULL indiquées sont dues à des enregistrements vides dans les données source.Vous ne réalisez peut-être pas que vos données contiennent des valeurs NULL tant que vous n'avez pas commencé à effectuer votre analyse. Dans ce cas, Tableau signale que la table contient un total de 9994 enregistrements, ce qui vous évite d'être concerné par deux valeurs NULL.
Tableau vous aide à localiser les valeurs nulles, qui peuvent également être des erreurs qui doivent être corrigées dans les données source. Bien qu'il n'y ait que deux valeurs nulles montrées ci-dessus dans les rangées 27 et 28, il pourrait y en avoir beaucoup plus que vous ne pouvez pas voir sans défilement.
Les valeurs nulles signifient simplement qu'une ligne contient une cellule vide. Cela ne signifie pas toujours qu'il y a une erreur dans vos données. Tableau est bien conscient de ce fait, c'est pourquoi il vous donne des options pour traiter les valeurs nulles. Oui, vous pouvez utiliser les informations fournies par Tableau pour corriger les entrées dans les données sources, mais vous pouvez également demander à Tableau d'adresser les valeurs à l'aide de l'une de ses nombreuses fonctions ou de supprimer des valeurs à l'aide de filtres.