Vidéo: L'agrégation de données géodécisionnelles : questions pour mieux la définir (partie 1 de 2) 2024
Résumer des données, trouver des totaux et calculer des moyennes et d'autres mesures descriptives ne sont probablement pas nouvelles pour vous. Lorsque vous avez besoin de vos récapitulatifs sous forme de nouvelles données plutôt que de rapports, le processus est appelé agrégation. Les données agrégées peuvent devenir la base de calculs supplémentaires, fusionnés avec d'autres ensembles de données, utilisés de toute autre manière que d'autres données sont utilisées.
Voici un exemple de processus d'agrégation de données. Un jeu de données contient des informations générales sur plus de 160 000 parcelles de biens immobiliers. Ces données comprennent diverses utilisations des terres. Que se passe-t-il si vous souhaitez voir la valeur moyenne estimée du terrain dans chaque catégorie d'utilisation des terres? Voici comment tu le ferais.
Vous trouverez l'outil d'agrégation de données dans votre application d'exploration de données. Vous pourriez utiliser la recherche pour le trouver.
Vous ajouteriez l'outil à un processus et le connecteriez à un ensemble de données source.
Dans l'outil d'agrégation de données, vous choisissez une variable de regroupement. Dans ce cas, c'est la variable d'utilisation du sol, C_A_CLASS.
Ensuite, vous définissez les résumés que vous voulez. Pour obtenir la valeur évaluée moyenne du terrain, vous sélectionnez la variable avec les évaluations à résumer et choisissez la fonction moyenne.
Lorsque l'agrégation est exécutée, le résultat est un nouvel ensemble de données, avec une ligne pour chaque type d'utilisation des terres et une nouvelle variable pour les moyennes calculées.
Tôt ou tard, vous devrez agréger tout un ensemble de données. Mais lorsque vous voulez totaliser ou faire la moyenne de toutes les données d'un ensemble de données, vous pouvez rencontrer un problème: Quelle est votre variable de regroupement? L'astuce consiste à utiliser une variable avec une valeur constante pour tout le jeu de données. Créez donc une variable où chaque valeur est la même, puis utilisez-la comme variable de regroupement.