Vidéo: Ep 07 : SPSS [Exploration des Données Et Les Tableaux Croisés] En Darija 2024
Les chercheurs de données travaillent rapidement. Pour obtenir de la vitesse, vous devrez utiliser les outils appropriés et découvrir les astuces du métier. Votre meilleur outil d'exploration de données est votre cerveau, avec un peu de savoir-faire. Le deuxième meilleur outil est une application d'exploration de données avec une interface de programmation visuelle.
Avec la programmation visuelle, les étapes de votre processus de travail sont représentées par de petites images que vous organisez à l'écran pour créer une image du flux et de la logique de votre travail. La programmation visuelle permet de voir plus facilement ce que vous faites à travers plusieurs étapes qu'avec des commandes (programmation) ou des menus conventionnels.
Dans cet exemple, vous pouvez voir le processus de travail dans la zone principale de l'application d'exploration de données. Autour d'elle sont des menus de projets récents, des outils pour les fonctions d'exploration de données, un visualiseur pour vous aider à naviguer dans des processus complexes, et un journal. Ces détails varient un peu d'un produit à l'autre.
Regardez de plus près le processus. Bien que vous commenciez juste dans votre quête pour être un mineur de données, vous pouvez probablement comprendre beaucoup de ce qui se passe juste en regardant ce diagramme, y compris ce qui suit:
-
Vous pouvez voir le lecteur CSV. Si vous êtes au courant du. format de données CSV (valeurs séparées par des virgules), vous savez probablement déjà que c'est l'importation de données. (Et c'est la première étape, vous avez besoin de données pour faire autre chose.)
-
Ensuite, vous voyez les outils clairement étiquetés par des fonctions comme Renommer la colonne et Manipulation de la chaîne. Ce sont des étapes de préparation des données.
-
Tree Learner peut être mystérieux si vous débutez en modélisation, mais cet outil crée un modèle arbre de décision à partir d'un sous-ensemble de données.
-
Les étapes finales appliquent le modèle aux données qui ont été conservées séparément pour les tests et effectuent certaines techniques d'évaluation.