Vidéo: Tutoriel Excel 2013 : Éliminer les doublons d'une liste | video2brain.com 2024
Les données sont stockées de différentes manières dans différents systèmes. Il n'est donc pas surprenant que lors de la collecte et de la consolidation de données provenant de diverses sources, il est possible que des doublons apparaissent. En particulier, ce qui rend un enregistrement individuel unique est différent pour différents systèmes.
Un résumé du compte d'investissement est joint à un numéro de compte. Un résumé de portefeuille peut être stocké au niveau d'un individu ou d'un ménage. Et les historiques de négociation de tous ces comptes sont stockés au niveau de la transaction individuelle.
Il est important d'être clair sur ce qui est supposé différencier les enregistrements uniques dans votre fichier de données. Par exemple, s'il s'agit d'un fichier de niveau de transaction, les numéros de compte et les identifiants de ménages seront dupliqués. Tant que vous comprenez cela et que vous faites une analyse au niveau des transactions, tout ira bien.
Mais si vous souhaitez utiliser ces données pour analyser le nombre de comptes détenus par chaque ménage, vous rencontrerez des problèmes. Les ménages qui commercent plus fréquemment auront plus de dossiers que ceux qui ne commercent pas beaucoup. Vous devez avoir un fichier au niveau du compte.
La suppression d'enregistrements en double n'est pas particulièrement difficile. La plupart des progiciels statistiques et des systèmes de bases de données ont des commandes intégrées qui regroupent les enregistrements. (En fait, dans la base de données SQL, cette commande s'appelle Group By.)