Vidéo: FORMATER SON PC SANS PERDRE SES DONNEES (Windows 7,8,8.1,10) - MALNUX STARCK 2024
Les humains utilisent l'expérience lorsqu'ils interprètent les données qu'ils voient, mais pas les ordinateurs. Votre logiciel d'exploration de données fera de son mieux pour identifier le type de données dans chaque colonne, mais les types de données sont souvent ambigus.
Lorsque vous voyez une liste de codes postaux, vous n'essayez pas de les ajouter et de les soustraire. Vous savez qu'ils représentent des lieux. Vous comprenez cela parce que vous avez beaucoup d'expérience en voyant et en reconnaissant les codes postaux. Un ordinateur peut interpréter un code postal comme une mesure entière ou continue. En fin de compte, c'est à vous de définir le bon format.
Les fonctions de définition des formats et des rôles de données (telles que la dénomination de la variable dépendante pour la modélisation) peuvent être enterrées à divers endroits de votre application d'exploration de données. Vous pouvez définir les formats et le rôle des variables dans un fichier de données avant même d'ouvrir une application d'exploration de données (les formats de données natifs pour Orange et Weka le permettent), dans le cadre de l'importation ou plus tard dans le processus.
Vous pouvez avoir des outils construits à cette fin, comme les outils montrés dans les figures suivantes, ou vous pouvez définir ces propriétés dans d'autres procédures.
Chaque application d'exploration de données possède son propre ensemble de types de variables et ses propres limites sur la façon dont chaque type peut être utilisé. Certaines de ces limites sont basées en théorie. Par exemple, vous pouvez seulement ajouter et soustraire des nombres, pas des lettres. Mais d'autres peuvent être juste une question de la façon dont l'application a été conçue.
Par exemple, vous pouvez trouver qu'un outil de modélisation particulier dans une application vous permet de prédire à la fois des variables catégorielles et continues, mais un outil similaire dans une autre application peut permettre de modéliser seulement l'un ou l'autre.