Table des matières:
- Les rapports de feuille de calcul rendent inefficaces les modèles de données
- Les fichiers de données plats se prêtent bien aux modèles de données
- Les jeux de données tabulaires sont parfaits pour les modèles de données pilotés par tables
Vidéo: Les fondamentaux des bases de données relationnelles - trailer | video2brain.com 2025
En tant que bloc de construction pour vos rapports Excel, les données de vos modèles de données doivent être structurées correctement. Tous les jeux de données ne sont pas créés égaux. Bien que certains jeux de données fonctionnent dans un environnement Excel standard, ils peuvent ne pas fonctionner à des fins de modélisation de données. Avant de créer votre modèle de données, assurez-vous que vos données sources sont structurées de manière appropriée à des fins de tableau de bord.
Au risque de simplifier à l'extrême, les ensembles de données généralement utilisés dans Excel se présentent sous trois formes fondamentales:
-
Le tableur
-
Le fichier de données plat
-
Le jeu de données tabulaire
La ligne de punch est que seuls les fichiers de données à plat et les ensembles de données tabulaires permettent des modèles de données efficaces.
Les rapports de feuille de calcul rendent inefficaces les modèles de données
Les rapports sur les feuilles de calcul affichent des données synthétiques très formatées et sont souvent conçus comme des outils de présentation pour les utilisateurs de gestion ou de direction. Un tableur type utilise judicieusement l'espace vide pour le formatage, répète les données à des fins esthétiques et présente uniquement des analyses de haut niveau. La figure suivante illustre un rapport de feuille de calcul.
Bien qu'un rapport de feuille de calcul puisse paraître joli, il ne constitue pas un modèle de données efficace. Pourquoi? La raison principale est que ces rapports ne vous offrent aucune séparation des données, de l'analyse et de la présentation. Vous êtes essentiellement enfermé dans une analyse.
Bien que vous puissiez créer des graphiques à partir du rapport affiché, il serait impossible d'appliquer une analyse en dehors de ce qui existe déjà. Par exemple, comment calculeriez-vous et présenteriez-vous la moyenne de toutes les ventes de vélos en utilisant ce rapport particulier? Comment calculeriez-vous la liste des dix meilleurs marchés les plus performants?
Avec cette configuration, vous êtes contraint à des processus très manuels difficiles à maintenir mois après mois. Toute analyse en dehors de celles de haut niveau déjà dans le rapport est au mieux basique - même avec des formules de fantaisie. En outre, que se passe-t-il lorsque vous devez afficher les ventes de vélos par mois? Lorsque votre modèle de données nécessite une analyse avec des données qui ne figurent pas dans le tableur, vous devez rechercher un autre ensemble de données.
Les fichiers de données plats se prêtent bien aux modèles de données
Un autre type de format de fichier est un fichier plat. Les fichiers plats sont des référentiels de données organisés par ligne et colonne. Chaque ligne correspond à un ensemble d'éléments de données, ou un enregistrement . Chaque colonne est un champ . Un champ correspond à un élément de données unique dans un enregistrement. La figure suivante contient les mêmes données que le rapport précédent mais exprimées dans un format de fichier de données plat.
Notez que chaque champ de données a une colonne et chaque colonne correspond à un élément de données. De plus, il n'y a pas d'espacement supplémentaire et chaque rangée (ou enregistrement) correspond à un ensemble unique d'informations. Mais l'attribut clé qui en fait un fichier plat est qu'aucun champ unique n'identifie de façon unique un enregistrement. En fait, vous devez spécifier quatre champs distincts (Région, Marché, Secteur d'activité et le montant des ventes d'un mois) avant de pouvoir identifier l'enregistrement de manière unique.
Les fichiers plats se prêtent très bien à la modélisation de données dans Excel car ils peuvent être suffisamment détaillés pour contenir les données dont vous avez besoin et être propices à un large éventail d'analyses avec des formules simples: SUM, AVERAGE, VLOOKUP et SUMIF. Nommez quelques-uns.
Les jeux de données tabulaires sont parfaits pour les modèles de données pilotés par tables
De nombreux modèles de données efficaces sont principalement pilotés par des tableaux croisés dynamiques. Les tableaux croisés dynamiques sont les meilleurs outils d'analyse d'Excel. Pour ceux d'entre vous qui ont utilisé des tableaux croisés dynamiques, vous savez qu'ils offrent un excellent moyen de résumer et de façonner les données à utiliser en rapportant des composants, tels que des graphiques et des tableaux.
Les ensembles de données tabulaires sont idéaux pour les modèles de données pilotés par des tables pivotantes. La figure suivante illustre un jeu de données tabulaire. Notez que la principale différence entre un ensemble de données tabulaire et un fichier de données plat est que dans les ensembles de données tabulaires, les étiquettes de colonne ne sont pas doublées en tant que données réelles. Par exemple, la colonne Période de vente contient l'identifiant du mois. Cette subtile différence de structure est ce qui fait que les ensembles de données tabulaires sont des sources de données optimales pour les tableaux croisés dynamiques. Cette structure garantit que les principales fonctions de la table pivot, telles que le tri et le groupement, fonctionnent comme elles le devraient.
Les attributs d'un ensemble de données tabulaires sont les suivants:
-
La première ligne de l'ensemble de données contient des étiquettes de zone décrivant les informations dans chaque colonne.
-
Les libellés de colonne ne génèrent pas le double devoir en tant qu'éléments de données pouvant être utilisés en tant que filtres ou critères de requête (mois, dates, années, régions ou marchés).
-
Il n'y a pas de lignes ou de colonnes vides - chaque colonne a un en-tête et une valeur dans chaque ligne.
-
Chaque colonne représente une catégorie unique de données.
-
Chaque ligne représente des éléments individuels dans chaque colonne.
