Vidéo: Excel graphique Nuage de points 2024
La première étape vers la modélisation prédictive consiste à relier les variables les unes aux autres. Un outil simple et remarquable est le scatterplot. Il est utilisé pour relier une mesure continue à une autre. Les chercheurs de données étirent parfois les règles et les utilisent également avec des variables catégorielles.
L'axe horizontal ( x ) de la courbe représente les valeurs d'une variable; l'axe vertical ( y ) représente une seconde variable. Vous ne pouvez pas avoir une idée de la variable qui est indépendante et qui dépend de chaque paire de variables.
Si vous le faites, la variable indépendante doit être sur l'axe horizontal. Chaque point de la courbe représente les coordonnées, la paire de valeurs pour les deux variables dans un seul cas. (Ces paires sont parfois appelées xy paires ).
Trouvez votre outil scatterplot et configurez un outil de nuage de points de base en sélectionnant deux variables à utiliser. La figure suivante montre cet outil sur le menu d'Orange; l'emplacement de l'outil varie en fonction du produit.
L'exemple de l'image suivante montre un affichage interactif; le nuage de points apparaît immédiatement. Dans un autre outil, vous pouvez avoir besoin d'étapes supplémentaires pour exécuter et créer le graphique.
L'exemple du diagramme de dispersion relie le kilométrage automatique à la puissance du moteur. Une faible puissance est associée à un kilométrage élevé, et plus la puissance est élevée, plus le kilométrage est faible. Vous pouvez facilement voir ce modèle dans les données. Vous remarquerez peut-être une forme, non linéaire mais légèrement incurvée. Cela pourrait fournir des indications sur les types de modèles à essayer plus tard.
Les applications d'exploration de données ont souvent des fonctions interactives dans les affichages graphiques. Par exemple, la figure suivante montre que le survol de votre souris sur un point révèle les valeurs exactes des deux variables pour ce point. C'est plus facile que d'essayer de lire les valeurs des axes!