Vidéo: SCIPY PYTHON Tutoriel - Optimize, Fourier, NdImage (16/30) 2024
Les données de l'analyse prédictive peuvent être identifiées comme étant en flux, statiques ou un mélange des deux. Les données diffusées changent continuellement; des exemples incluent le flux constant de mises à jour Facebook, tweets sur Twitter, et les prix des actions en constante évolution alors que le marché est toujours ouvert.
Les données diffusées changent continuellement; Les données statiques sont autonomes et incluses. Les problèmes associés aux données statiques incluent des lacunes, des valeurs aberrantes ou des données incorrectes, qui peuvent tous nécessiter un nettoyage, une préparation et un prétraitement avant de pouvoir utiliser des données statiques pour une analyse.
Comme pour les données diffusées, d'autres problèmes peuvent survenir. Le volume peut être un problème; la quantité de données non-stop arrivant constamment peut être écrasante. Et plus les données sont diffusées rapidement, plus il est difficile de rattraper l'analyse.
Les deux principaux modèles d'analyse des données diffusées sont les suivants:
-
Examinez uniquement les points de données les plus récents et prenez une décision concernant l'état du modèle et son prochain déplacement. Cette approche est incrémentielle - elle consiste essentiellement à construire une image des données à mesure qu'elles arrivent.
-
Évaluer l'ensemble de données entier, ou un sous-ensemble de celui-ci, pour prendre une décision chaque fois que de nouveaux points de données arrivent. Cette approche inclut plus de points de données dans l'analyse - ce qui constitue l'ensemble de données «entier» change chaque fois que de nouvelles données sont ajoutées.
Selon la nature de votre entreprise et l'impact attendu de la décision, un modèle est préférable à l'autre.
Certains domaines d'activité, tels que l'analyse de données environnementales, de marché ou de renseignement, attribuent des prix aux nouvelles données qui arrivent en temps réel. Toutes ces données doivent être analysées au fur et à mesure qu'elles sont diffusées - et interprétées non seulement correctement, mais tout de suite.
Basé sur les informations nouvellement disponibles, le modèle redessine toute la représentation interne du monde extérieur. Cela vous permet de prendre les décisions les plus récentes et d'agir rapidement.
Par exemple, un modèle analytique prédictif peut traiter un cours boursier comme un flux de données, même si les données évoluent rapidement, analyser les données dans le contexte de conditions de marché immédiates existant en temps réel, puis décider d'échanger un stock particulier.
Clairement, l'analyse des données diffusées diffère de l'analyse des données statiques. L'analyse d'un mélange des deux types de données peut être encore plus difficile.