Accueil Finances personnelles Comment utiliser le lissage des données dans Predictive Analytics - les nuls

Comment utiliser le lissage des données dans Predictive Analytics - les nuls

Table des matières:

Vidéo: Série Chronologique - Décomposition classique(Modèle additif) avec Excel- Partie3 2025

Vidéo: Série Chronologique - Décomposition classique(Modèle additif) avec Excel- Partie3 2025
Anonim

Lissage des données dans l'analyse prédictive essaie essentiellement de trouver le "signal" dans le "bruit" par rejeter les points de données considérés comme "bruyants". L'idée est d'affiner les modèles dans les données et de mettre en évidence les tendances vers lesquelles les données pointent.

L'implication derrière le lissage des données est que les données se composent de deux parties: une partie (composée des points de données de base ) qui indique les tendances globales ou réelles, et une autre partie constituée principalement d'écarts ( bruit ) - certains points fluctuants résultant d'une certaine volatilité des données. Le lissage des données vise à éliminer cette deuxième partie.

Comment réduire le bruit

Le lissage des données repose sur plusieurs hypothèses:

  • Cette fluctuation des données est la plus susceptible d'être du bruit.

  • Que la partie bruyante des données est de courte durée.

  • La fluctuation des données, quelle que soit leur variabilité, n'affectera pas les tendances sous-jacentes représentées par les points de données de base.

Le bruit dans les données tend à être aléatoire; ses fluctuations ne devraient pas affecter les tendances globales tirées de l'examen du reste des données. Ainsi, la réduction ou l'élimination des points de données bruyants peut clarifier les tendances et les modèles réels dans les données - en effet, améliorer le rapport signal / bruit des données. "

Si vous avez correctement identifié le bruit et l'avez ensuite réduit, le lissage des données peut vous aider à prédire le prochain point de données observé simplement en suivant les grandes tendances que vous avez détectées dans les données.

Le lissage des données concerne la majorité des points de données, leurs positions dans un graphique et ce que les modèles résultants prédisent sur la tendance générale (disons) d'un cours boursier, que sa direction générale soit ascendante, descendante ou latérale.

Cette technique ne permettra pas de prédire avec précision le prix exact du prochain trade pour un titre donné - mais prédire qu'une tendance générale peut donner des indications plus puissantes que de connaître le prix réel ou ses fluctuations.

Une prévision basée sur une tendance générale déduite des données lissées suppose que la direction suivie jusqu'à présent par les données se poursuivra dans le futur d'une manière cohérente avec la tendance. Sur le marché boursier, par exemple, les performances passées ne sont pas une indication précise des performances futures, mais elles peuvent certainement constituer un guide général des mouvements futurs du cours de l'action.

Méthodes, avantages et inconvénients du lissage des données

Le lissage des données ne doit pas être confondu avec l'ajustement d'un modèle qui fait partie de l'analyse des données en deux étapes:

  1. Trouver un modèle qui représente les données.

  2. Assurez-vous que le modèle correspond bien aux données.

Le lissage des données se concentre sur l'établissement d'une direction fondamentale pour les points de données principaux en (1) ignorant les points de données bruyants et (2) dessinant une courbe plus lisse à travers les points de données qui ignorent les tendances. les données, peu importe la lenteur de leur émergence. Par conséquent, dans une série temporelle numérique, le lissage des données sert de forme de filtrage.

Le lissage des données peut utiliser l'une des méthodes suivantes:

  • Random walk est basé sur l'idée que le résultat suivant, ou futur point de données, est un écart aléatoire du dernier point de données connu ou présent.

  • La moyenne mobile est une moyenne mobile de périodes consécutives, équidistantes. Un exemple serait le calcul d'une moyenne mobile de 200 jours d'un cours de bourse.

  • Le lissage exponentiel attribue de façon exponentielle plus de poids ou d'importance aux points de données récents qu'aux points de données plus anciens.

    • Simple: Cette méthode doit être utilisée lorsque les données de la série chronologique n'ont aucune tendance et aucune saisonnalité.

    • Linéaire: Cette méthode doit être utilisée lorsque les données de série chronologique ont une ligne de tendance.

    • Saisonnier: Cette méthode doit être utilisée lorsque les données de la série chronologique ne présentent aucune tendance mais une saisonnalité.

Ce que ces méthodes de lissage ont en commun, c'est qu'elles effectuent une sorte de calcul de la moyenne sur plusieurs points de données. Une telle moyenne des points de données adjacents est la façon essentielle de se concentrer sur les tendances ou les modèles sous-jacents.

Les avantages du lissage des données sont

  • Facile à mettre en œuvre.

  • Il aide à identifier les tendances.

  • Cela permet d'exposer les motifs dans les données.

  • Il élimine les points de données que vous avez jugés sans intérêt.

  • Il aide à prédire la direction générale des points de données observés suivants.

  • Il génère de beaux graphiques lisses.

Mais tout a un inconvénient. Les inconvénients du lissage des données sont

  • . Il peut éliminer les points de données valides résultant d'événements extrêmes.

  • Cela peut conduire à des prédictions inexactes si les données de test sont uniquement saisonnières et ne sont pas totalement représentatives de la réalité qui a généré les points de données.

  • Cela peut modifier ou fausser les données, en particulier les pics, ce qui donne une image déformée de ce qui se passe.

  • Il peut être vulnérable à une perturbation significative des valeurs aberrantes dans les données.

  • Cela peut entraîner un écart important par rapport aux données d'origine.

Si le lissage des données ne fait que donner aux données un simple lifting, il peut être fondamentalement erroné de la façon suivante:

  • Il peut introduire des erreurs par distorsions qui traitent les données lissées comme si elles étaient identiques à l'original Les données.

  • Il peut fausser l'interprétation en ignorant - et en cachant - les risques intégrés dans les données.

  • Cela peut entraîner une perte de détails dans vos données, ce qui est une façon pour une courbe lissée de dévier considérablement de celle des données d'origine.

L'importance du lissage des données pour vos données dépend de la nature des données disponibles et de la technique de lissage qui a été implémentée sur ces données.Par exemple, si les données d'origine ont plus de pics, le lissage des données entraînera un décalage majeur des pics dans les graphiques lissés - probablement une distorsion.

Voici quelques points de mise en garde à garder à l'esprit lorsque vous approchez du lissage des données:

  • Il est judicieux de comparer des graphiques lissés à des graphiques intacts qui représentent les données d'origine.

  • Les points de données supprimés lors du lissage des données peuvent ne pas être des parasites. ils pourraient être valides, de vrais points de données résultant d'événements rares mais réels.

  • Le lissage des données peut être utile avec modération, mais sa surutilisation peut conduire à une fausse représentation de vos données.

En appliquant votre jugement professionnel et votre expertise en matière de connaissances métier, vous pouvez utiliser efficacement le lissage des données. Supprimer le bruit de vos données - sans affecter négativement la précision et l'utilité des données originales - est au moins autant un art qu'une science.

Comment utiliser le lissage des données dans Predictive Analytics - les nuls

Le choix des éditeurs

Passez les examens en améliorant votre mentalité de performance - les nuls

Passez les examens en améliorant votre mentalité de performance - les nuls

Quels que soient les sujets que vous étudiez, êtes à l'école secondaire, au collège, à l'université, ou face à des examens professionnels ou d'entrée, pour passer vos examens, vous devez développer votre esprit de performance d'examen. Faire cela vous aidera à: Développer une attitude d'excellence - toujours viser à atteindre votre meilleur rendement personnel. Décidez exactement de ce que ...

Réussir les examens commence le premier jour de classe - les tirs

Réussir les examens commence le premier jour de classe - les tirs

Sont faciles à supposer aller à des cours, des conférences, des tutoriels ou autres, votre préparation aux examens sera dans quelques mois. Cette hypothèse, cependant, n'est pas utile. Si vous pensez que la préparation aux examens fait partie de chaque cours tous les jours - pas seulement les dernières semaines avant les examens - vous ...

Pour mémoriser l'ordre des opérations du PSAT / NMSQT - mannequins

Pour mémoriser l'ordre des opérations du PSAT / NMSQT - mannequins

L'ordre mathématique des opérations est très important sur les sections mathématiques du PSAT / NMSQT. S'il vous plaît excusez ma chère tante Sally (PEMDAS) est un moyen mnémotechnique (aide-mémoire) qui vous aide à vous rappeler quelle opération vient en premier, qui vient en second lieu, et ainsi de suite. L'ordre compte parce que si vous ignorez tante Sally, vous vous retrouvez avec la mauvaise réponse. ...

Le choix des éditeurs

10 Bonnes façons d'utiliser Bitcoin - les nuls

10 Bonnes façons d'utiliser Bitcoin - les nuls

Si vous voulez utiliser le bitcoin comme une forme d'éducation monétaire virtuelle, Utilisez-le comme un revenu supplémentaire, ou regardez-le dans une perspective d'investissement, bitcoin vous permet de faire à peu près tout ce que vous pouvez imaginer. Voici dix des meilleures façons d'utiliser Bitcoin, même s'il y en a beaucoup, beaucoup ...

Bitcoin Clés publiques et privées - nuls

Bitcoin Clés publiques et privées - nuls

Il y a plus qu'un portefeuille bitcoin que juste l'adresse elle-même. Il contient également la clé publique et privée pour chacune de vos adresses bitcoin. Votre clé privée bitcoin est une chaîne générée aléatoirement (chiffres et lettres), permettant de dépenser des bitcoins. Une clé privée est toujours liée mathématiquement à l'adresse du porte-monnaie bitcoin, ...

Bitcoin Paper Wallets - mannequins

Bitcoin Paper Wallets - mannequins

Possédant un portefeuille papier bitcoin, l'adresse contenant les bitcoins n'a pas encore été connectée au live blockchain, et n'est donc pas "active". "Jusqu'à ce que le portefeuille soit connecté à la blockchain, il est considéré comme étant en stockage à froid (jargon bitcoin pour un compte hors ligne). Vous pouvez toujours vérifier le solde ...

Le choix des éditeurs

Comment lire les données d'Excel en R - dummies

Comment lire les données d'Excel en R - dummies

Si vous demandez aux utilisateurs de R quelle est la meilleure façon est d'importer des données directement à partir de Microsoft Excel, la plupart d'entre eux répondront probablement que votre meilleure option est d'exporter d'abord Excel vers un fichier CSV, puis utiliser lire. csv () pour importer vos données à R. En fait, c'est toujours le conseil ...

Comment lire les erreurs et les avertissements dans R - dummies

Comment lire les erreurs et les avertissements dans R - dummies

Si quelque chose ne va pas avec votre code, toi. Nous devons l'admettre: Ces messages d'erreur peuvent aller de légèrement confus à complètement incompréhensible si vous n'y êtes pas habitué. Mais ça ne doit pas rester comme ça. Lorsque vous vous serez familiarisé avec les messages d'erreur et d'avertissement de R, vous pourrez rapidement ...

Comment lire la sortie de str () pour les listes dans R - dummies

Comment lire la sortie de str () pour les listes dans R - dummies

Beaucoup de gens qui commencent par R sont déroutés par les listes au début. Il n'y a vraiment pas besoin de cela - une liste n'a que deux parties importantes: les composants et les noms. Et dans le cas des listes sans nom, vous n'avez même pas à vous soucier de ce dernier. Mais si vous regardez la structure ...