Vidéo: Data Preprocessing Tutorial 2024
Un data miner est un homme d'affaires qui a le sens des chiffres, pas un programmeur, un gestionnaire de base de données ou un statisticien. L'exploration de données permet aux professionnels de découvrir rapidement des modèles utiles dans les données, de créer des modèles et de les mettre en œuvre dans les activités quotidiennes. Pour faire du data mining, vous avez besoin d'outils adaptés au travail, d'outils conçus pour des utilisateurs comme vous.
Cela ne veut pas dire que les mineurs de données qui connaissent aussi la programmation ou les statistiques ne devraient pas profiter de ces compétences. Mais les outils d'exploration de données devraient être conçus principalement pour les utilisateurs professionnels.
Lorsque vous réalisez de vrais projets sur votre lieu de travail, vous avez vos propres besoins et priorités. Le support technique sera une nécessité. Des capacités spécifiques pour l'importation de données ou les méthodes d'analyse peuvent être importantes pour vous. Votre employeur peut avoir des exigences pour l'achat de logiciels qui affectent vos choix.
Même si vous n'avez aucun besoin immédiat et que vous n'avez pas d'argent à dépenser, c'est une bonne idée de commencer à vous familiariser avec ce qui est disponible, parce que vous n'avez pas beaucoup de temps pour réfléchir lorsque votre situation change.
Les outils les mieux adaptés à l'exploration de données offriront ce qui suit:
-
Une interface utilisateur graphique qui ne nécessite pas de programmation
-
Une capacité de programmation visuelle pour la vitesse et la clarté
-
graphes et méthodes de modélisation
Les interfaces de programmation visuelles sont essentielles pour transformer les gens d'affaires en mineurs de données, ce qui rend le processus d'exploration de données compréhensible et rapide. Parce qu'ils sont disponibles dans seulement quelques produits, assurez-vous d'explorer ces produits en premier.
Seule une poignée de produits répondant aux trois critères recommandés est disponible: une interface utilisateur graphique, une programmation visuelle et une sélection généreuse de graphiques et de méthodes de modélisation. Même ceux-ci peuvent ne pas convenir à toutes les applications réelles que vous rencontrez.
Vous ne trouverez peut-être pas un seul outil idéal en fonction de vos besoins. Ou vous pouvez avoir un outil favori qui vous convient bien, mais ce même outil peut ne pas être satisfaisant pour les autres membres de votre équipe qui ont des priorités et des compétences différentes. Vous pouvez aimer un outil particulier, mais trouvez que le coût est trop élevé ou que le support ne répond pas à vos besoins. Il est donc utile d'être au courant de divers outils et fournisseurs.
Les fournisseurs de logiciels n'utilisent pas le terme data mining de manière aussi stricte. Vous pouvez donc rencontrer une grande variété de fournisseurs qui mentionnent l'exploration de données dans leur matériel promotionnel. Des centaines de produits offrent maintenant un certain type de capacité d'analyse de données, et de nombreux nouveaux entrent sur le marché chaque année.La plupart d'entre eux sont des outils très utiles dans certains cas, mais rares sont ceux qui correspondent à l'extraction de données.
Bien que tous les fournisseurs de logiciels n'offrent pas de produits gratuits, presque tous vous permettront d'essayer des produits gratuitement pendant une période limitée (généralement 30 jours). Utilisez ces essais pour élargir vos connaissances et pour vous faire une idée de la valeur des produits payés que vous dépenseriez.