Accueil Finances personnelles Comment utiliser le lissage des données dans Predictive Analytics - les nuls

Comment utiliser le lissage des données dans Predictive Analytics - les nuls

Table des matières:

Vidéo: Série Chronologique - Décomposition classique(Modèle additif) avec Excel- Partie3 2024

Vidéo: Série Chronologique - Décomposition classique(Modèle additif) avec Excel- Partie3 2024
Anonim

Lissage des données dans l'analyse prédictive essaie essentiellement de trouver le "signal" dans le "bruit" par rejeter les points de données considérés comme "bruyants". L'idée est d'affiner les modèles dans les données et de mettre en évidence les tendances vers lesquelles les données pointent.

L'implication derrière le lissage des données est que les données se composent de deux parties: une partie (composée des points de données de base ) qui indique les tendances globales ou réelles, et une autre partie constituée principalement d'écarts ( bruit ) - certains points fluctuants résultant d'une certaine volatilité des données. Le lissage des données vise à éliminer cette deuxième partie.

Comment réduire le bruit

Le lissage des données repose sur plusieurs hypothèses:

  • Cette fluctuation des données est la plus susceptible d'être du bruit.

  • Que la partie bruyante des données est de courte durée.

  • La fluctuation des données, quelle que soit leur variabilité, n'affectera pas les tendances sous-jacentes représentées par les points de données de base.

Le bruit dans les données tend à être aléatoire; ses fluctuations ne devraient pas affecter les tendances globales tirées de l'examen du reste des données. Ainsi, la réduction ou l'élimination des points de données bruyants peut clarifier les tendances et les modèles réels dans les données - en effet, améliorer le rapport signal / bruit des données. "

Si vous avez correctement identifié le bruit et l'avez ensuite réduit, le lissage des données peut vous aider à prédire le prochain point de données observé simplement en suivant les grandes tendances que vous avez détectées dans les données.

Le lissage des données concerne la majorité des points de données, leurs positions dans un graphique et ce que les modèles résultants prédisent sur la tendance générale (disons) d'un cours boursier, que sa direction générale soit ascendante, descendante ou latérale.

Cette technique ne permettra pas de prédire avec précision le prix exact du prochain trade pour un titre donné - mais prédire qu'une tendance générale peut donner des indications plus puissantes que de connaître le prix réel ou ses fluctuations.

Une prévision basée sur une tendance générale déduite des données lissées suppose que la direction suivie jusqu'à présent par les données se poursuivra dans le futur d'une manière cohérente avec la tendance. Sur le marché boursier, par exemple, les performances passées ne sont pas une indication précise des performances futures, mais elles peuvent certainement constituer un guide général des mouvements futurs du cours de l'action.

Méthodes, avantages et inconvénients du lissage des données

Le lissage des données ne doit pas être confondu avec l'ajustement d'un modèle qui fait partie de l'analyse des données en deux étapes:

  1. Trouver un modèle qui représente les données.

  2. Assurez-vous que le modèle correspond bien aux données.

Le lissage des données se concentre sur l'établissement d'une direction fondamentale pour les points de données principaux en (1) ignorant les points de données bruyants et (2) dessinant une courbe plus lisse à travers les points de données qui ignorent les tendances. les données, peu importe la lenteur de leur émergence. Par conséquent, dans une série temporelle numérique, le lissage des données sert de forme de filtrage.

Le lissage des données peut utiliser l'une des méthodes suivantes:

  • Random walk est basé sur l'idée que le résultat suivant, ou futur point de données, est un écart aléatoire du dernier point de données connu ou présent.

  • La moyenne mobile est une moyenne mobile de périodes consécutives, équidistantes. Un exemple serait le calcul d'une moyenne mobile de 200 jours d'un cours de bourse.

  • Le lissage exponentiel attribue de façon exponentielle plus de poids ou d'importance aux points de données récents qu'aux points de données plus anciens.

    • Simple: Cette méthode doit être utilisée lorsque les données de la série chronologique n'ont aucune tendance et aucune saisonnalité.

    • Linéaire: Cette méthode doit être utilisée lorsque les données de série chronologique ont une ligne de tendance.

    • Saisonnier: Cette méthode doit être utilisée lorsque les données de la série chronologique ne présentent aucune tendance mais une saisonnalité.

Ce que ces méthodes de lissage ont en commun, c'est qu'elles effectuent une sorte de calcul de la moyenne sur plusieurs points de données. Une telle moyenne des points de données adjacents est la façon essentielle de se concentrer sur les tendances ou les modèles sous-jacents.

Les avantages du lissage des données sont

  • Facile à mettre en œuvre.

  • Il aide à identifier les tendances.

  • Cela permet d'exposer les motifs dans les données.

  • Il élimine les points de données que vous avez jugés sans intérêt.

  • Il aide à prédire la direction générale des points de données observés suivants.

  • Il génère de beaux graphiques lisses.

Mais tout a un inconvénient. Les inconvénients du lissage des données sont

  • . Il peut éliminer les points de données valides résultant d'événements extrêmes.

  • Cela peut conduire à des prédictions inexactes si les données de test sont uniquement saisonnières et ne sont pas totalement représentatives de la réalité qui a généré les points de données.

  • Cela peut modifier ou fausser les données, en particulier les pics, ce qui donne une image déformée de ce qui se passe.

  • Il peut être vulnérable à une perturbation significative des valeurs aberrantes dans les données.

  • Cela peut entraîner un écart important par rapport aux données d'origine.

Si le lissage des données ne fait que donner aux données un simple lifting, il peut être fondamentalement erroné de la façon suivante:

  • Il peut introduire des erreurs par distorsions qui traitent les données lissées comme si elles étaient identiques à l'original Les données.

  • Il peut fausser l'interprétation en ignorant - et en cachant - les risques intégrés dans les données.

  • Cela peut entraîner une perte de détails dans vos données, ce qui est une façon pour une courbe lissée de dévier considérablement de celle des données d'origine.

L'importance du lissage des données pour vos données dépend de la nature des données disponibles et de la technique de lissage qui a été implémentée sur ces données.Par exemple, si les données d'origine ont plus de pics, le lissage des données entraînera un décalage majeur des pics dans les graphiques lissés - probablement une distorsion.

Voici quelques points de mise en garde à garder à l'esprit lorsque vous approchez du lissage des données:

  • Il est judicieux de comparer des graphiques lissés à des graphiques intacts qui représentent les données d'origine.

  • Les points de données supprimés lors du lissage des données peuvent ne pas être des parasites. ils pourraient être valides, de vrais points de données résultant d'événements rares mais réels.

  • Le lissage des données peut être utile avec modération, mais sa surutilisation peut conduire à une fausse représentation de vos données.

En appliquant votre jugement professionnel et votre expertise en matière de connaissances métier, vous pouvez utiliser efficacement le lissage des données. Supprimer le bruit de vos données - sans affecter négativement la précision et l'utilité des données originales - est au moins autant un art qu'une science.

Comment utiliser le lissage des données dans Predictive Analytics - les nuls

Le choix des éditeurs

Tableaux et pointeurs en C ++ - le nom du tableau des mannequins

Tableaux et pointeurs en C ++ - le nom du tableau des mannequins

Est un pointeur sur le tableau lui-même. Le tableau est une séquence de variables stockée en mémoire. Le nom du tableau pointe vers le premier élément. C'est une question intéressante sur les pointeurs: Pouvez-vous avoir un en-tête de fonction, comme la ligne suivante, et juste utiliser sizeof pour déterminer comment ...

Boost Bibliothèques et C ++ - mannequins

Boost Bibliothèques et C ++ - mannequins

De nombreux développeurs utilisent les bibliothèques Boost car elles fournissent un code de haute qualité une partie de Boost est en train d'être normalisée pour être incluse dans la bibliothèque standard. L'une des meilleures choses à propos de Boost est que la bibliothèque elle-même est gratuite. Le site Web de Boost tient à faire savoir aux développeurs qu'ils ne ...

Casser les programmes Mis à part C ++ - les mannequins

Casser les programmes Mis à part C ++ - les mannequins

Le programmeur peut casser un seul programme en fichiers sources distincts généralement appelés modules. Ces modules sont compilés séparément dans le code machine par le compilateur C ++, puis combinés au cours du processus de génération pour générer un seul programme. Ces modules sont également connus par les geeks du compilateur en tant qu'unités de traduction C ++. Le processus de combinaison ...

Le choix des éditeurs

Comment régler les paramètres via l'affichage d'informations sur votre Nikon D5200 - mannequins

Comment régler les paramètres via l'affichage d'informations sur votre Nikon D5200 - mannequins

L'information l'affichage ne sert pas uniquement à vérifier les paramètres de prise de vue actuels; Cela vous donne également un accès rapide à certains des paramètres les plus critiques. La touche de cette fonction est le bouton Information Edit, situé à l'arrière de l'appareil photo, à droite du viseur. Voici comment cela fonctionne: Afficher les informations ...

Met en surbrillance le mode d'affichage sur votre Nikon D7100 - mannequins

Met en surbrillance le mode d'affichage sur votre Nikon D7100 - mannequins

En mode d'affichage hautes lumières sur votre Nikon D7100 pense que l'appareil photo peut être surexposé clignoter dans le moniteur de l'appareil photo. L'un des problèmes de photo les plus difficiles à corriger dans un programme de retouche photo est connu sous le nom de surbrillance dans certains cercles et de surbrillance dans d'autres. Les deux termes signifient que les zones les plus claires de ...

Comment régler les paramètres via la bande de contrôle Nikon D3300 - les tétines

Comment régler les paramètres via la bande de contrôle Nikon D3300 - les tétines

Présentes en bas à gauche Au coin du Nikon D3300, le bouton i active une bande de contrôle qui vous donne un accès rapide à certains paramètres de prise de vue critiques. Voici comment utiliser la bande de contrôle pour la photographie dans le viseur: Affichez l'écran d'informations. Vous pouvez le faire en appuyant sur le bouton Info. Appuyez sur le bouton i. Le haut ...

Le choix des éditeurs

Comment imprimer vos diapositives et notes Keynote - Les tétines

Comment imprimer vos diapositives et notes Keynote - Les tétines

Lorsque vous créez une présentation dans Snow Leopard Application Keynote, vous ne pouvez pas toujours vouloir imprimer des documents. Cependant, si vous présentez un long diaporama avec beaucoup d'informations que vous aimeriez que votre public se souvienne, rien ne vaut les documents qui incluent des images réduites de vos diapositives (et, facultativement, les notes de votre présentateur). Vous pouvez ...

Comment réorganiser ou supprimer les signets - les mannequins

Comment réorganiser ou supprimer les signets - les mannequins

Safari enregistre vos signets et vos dossiers de signets dans l'ordre dans lequel vous les créez, en les ajoutant au bas d'une liste toujours croissante. Si vous continuez à ajouter des marque-pages au menu Signets sans les placer dans des dossiers, vous pouvez constater que vous avez un nombre de signets gazillion indiqué bon gré mal gré et que vous ne vous en souvenez plus ...

Pour ouvrir et utiliser l'iDisk de Snow Leopard - les mannequins

Pour ouvrir et utiliser l'iDisk de Snow Leopard - les mannequins

Avec un compte MobileMe actif, iDisk est disponible et vous fournit un espace de stockage supplémentaire. Pour connaître l'espace de stockage utilisé et pour configurer l'accès à votre dossier Public, ouvrez les Préférences Système, cliquez sur l'icône MobileMe, puis sur le bouton iDisk pour afficher les paramètres. Vos paramètres iDisk sont disponibles dans les Préférences Système. Le ...