Accueil Finances personnelles 10 Erreurs communes d'exploration de données (que vous ne ferez pas) - dummies

10 Erreurs communes d'exploration de données (que vous ne ferez pas) - dummies

Vidéo: Billes de Sciences #5 : Jérôme Rosinski - Esprit scientifique, Esprit critique 2024

Vidéo: Billes de Sciences #5 : Jérôme Rosinski - Esprit scientifique, Esprit critique 2024
Anonim

L'exploration de données se fait par essais et erreurs, et donc, pour les mineurs de données, il est naturel de faire des erreurs. Les erreurs peuvent être utiles, en d'autres termes, au moins dans certaines conditions. Cependant, toutes les erreurs ne sont pas égales. Certains sont juste mieux évités. La liste suivante propose dix telles erreurs. Si vous les lisez attentivement et que vous les mémorisez, vous éviterez peut-être quelques difficultés dans la courbe d'apprentissage:

  • Ignorer les contrôles de qualité des données: La plupart des mineurs de données pensent que le développement de modèles prédictifs est plus amusant que l'examen des données pour des problèmes de qualité. Mais si vous ne parvenez pas à détecter et à corriger les problèmes de qualité des données, vous pourriez vous retrouver avec des prédictions sans valeur.

  • Manquer le point: Vous avez découvert quelque chose de fascinant! C'est bien, mais si ce n'est pas aussi pertinent pour le problème commercial que vous essayez de résoudre, eh bien, ce n'est pas du tout pertinent. Revenez sur la bonne voie.

  • Croire qu'un modèle dans les données prouve une relation de cause à effet: Vous explorez un ensemble de données et remarquez que lorsque la variable A augmente, la variable B augmente également. Cela peut se produire parce que la variable A influence la variable B, ou parce que la variable B influence la variable A. D'un autre côté, il se peut que les deux soient influencés par une autre variable que vous n'avez pas prise en compte. Ou ce pourrait être une coïncidence unique. Qui peut dire?

  • Étirer les conclusions trop loin: Ne présumez pas que les relations que vous observez dans les données se reproduiront dans des circonstances différentes. Si vos données ont été collectées dans un environnement frais, ne supposez pas que les choses fonctionneront de la même manière dans un environnement d'usine chaud.

  • Parier sur des résultats qui n'ont pas de sens: Les méthodes d'exploration de données sont informelles et ne sont généralement pas soutenues par des méthodes et des théories scientifiques. Vos résultats ont donc au moins un sens commercial. S'il n'y a pas d'explication de bon sens pour les résultats que vous présentez, votre direction ne le prendra probablement pas au sérieux, et ils ne devraient pas le prendre au sérieux.

  • Tomber amoureux d'une méthode de modélisation particulière: Il n'existe pas un seul type de modèle de data mining adapté à chaque situation.

  • Mise en production d'un modèle sans tests adéquats: Ne pariez pas votre entreprise sur un modèle prédictif tant que vous ne l'avez pas testé avec des données de rétention et à petite échelle sur le terrain.

  • Ignorer les résultats que vous n'aimez pas: Si vous ignorez vos données maintenant, elles reviendront un jour et diront: «Je vous l'avais dit. "

  • Utiliser l'exploration de données pour répondre à tous les besoins d'analyse de données: L'exploration de données a une valeur considérable, mais certaines applications nécessitent encore des méthodes de collecte de données rigoureuses, une analyse statistique formelle et une méthode scientifique.

  • En supposant que les techniques traditionnelles d'analyse de données n'ont plus d'importance: Reportez-vous à la puce précédente.

10 Erreurs communes d'exploration de données (que vous ne ferez pas) - dummies

Le choix des éditeurs

Comment créer une bordure autour d'une image dans CSS3 - mannequins

Comment créer une bordure autour d'une image dans CSS3 - mannequins

L'un des Les modifications les plus courantes que vous pouvez apporter à une image dans CSS3 consistent à ajouter une bordure. Cela déclenche l'image de l'autre contenu sur la page. Bien sûr, CSS3 offre une large gamme de types de frontières. L'astuce est d'obtenir la bordure à afficher autour de l'image dans un tel ...

Comment collecter des contacts pour votre liste de marketing par e-mail - les nuls

Comment collecter des contacts pour votre liste de marketing par e-mail - les nuls

La qualité de votre liste de marketing par e-mail dépend grandement de l'endroit et de la manière dont vous collectez les informations. Le meilleur moyen de s'assurer que vous collectez des informations de qualité est d'obtenir des informations et des autorisations directement auprès de la personne qui détient les informations en premier lieu - vos prospects et vos clients. Votre défi est de fournir ...

Comment collecter vos adresses e-mail légalement - Mannequins

Comment collecter vos adresses e-mail légalement - Mannequins

SPAM Act inclut des règles sur la façon dont les spécialistes du marketing par e-mail, tels que vous, peuvent collecter des adresses e-mail. La loi exige également que vous receviez l'autorisation de vos abonnés à la liste de diffusion avant d'envoyer certains types de contenu, tels que les e-mails commerciaux que vous souhaitez envoyer. Collecter des adresses e-mail avec le consentement affirmatif à l'esprit Potentiellement illégal ...

Le choix des éditeurs

Données de consommateurs disponibles pour Data Miners - mannequins

Données de consommateurs disponibles pour Data Miners - mannequins

Pour vous présenter les types d'informations disponibles auprès des fournisseurs commerciaux, Regardez un exemple détaillé. Le tableau comprend toutes les données collectées sur un consommateur par Axciom, un important fournisseur de données marketing grand public. Ce fournisseur fournit des données marketing sur les consommateurs individuels et les ménages dans lesquels ces consommateurs vivent, comme suit: ...

Gestion des données pour le Big Data - les nuls

Gestion des données pour le Big Data - les nuls

Sont-ils vraiment nouveaux ou s'agit-il d'une évolution dans la gestion des données? C'est en fait les deux. Comme pour les autres vagues de gestion des données, les mégadonnées reposent sur l'évolution des pratiques de gestion des données au cours des cinq dernières décennies. Ce qui est nouveau, c'est que, pour la première fois, le coût ...

10 Erreurs communes d'exploration de données (que vous ne ferez pas) - dummies

10 Erreurs communes d'exploration de données (que vous ne ferez pas) - dummies

L'exploration de données est faite par essais et erreurs, et donc, pour les mineurs de données, faire des erreurs est seulement naturel. Les erreurs peuvent être utiles, en d'autres termes, au moins dans certaines conditions. Cependant, toutes les erreurs ne sont pas égales. Certains sont juste mieux évités. La liste suivante propose dix telles erreurs. Si vous les lisez attentivement, ...

Le choix des éditeurs

Conseils pour une journée d'essai sans stress - les mannequins

Conseils pour une journée d'essai sans stress - les mannequins

Réussissent sur le PSAT / NMSQT - ou tout test - il est essentiel d'être préparé. Cela signifie étudier le sujet et faire des problèmes de pratique, bien sûr, mais cela signifie également arriver le jour du test prêt à partir, mentalement et physiquement, avec tout ce dont vous avez besoin. L'examen est assez stressant; ne composez pas ...

Stratégies de test pour la partie Mathématiques de l'ACT - Mannequins

Stratégies de test pour la partie Mathématiques de l'ACT - Mannequins

La partie mathématique de l'ACT contient 60 questions, et vous avez 60 minutes pour compléter cette partie du test. Vous avez donc environ 1 minute par question. Chaque question que vous répondez correctement vaut 1 point vers votre score brut sur le test. Utiliser des stratégies de prise de test peut vous aider à répondre ...

Conseils pour maîtriser la section de rédaction analytique du GRE - les nuls

Conseils pour maîtriser la section de rédaction analytique du GRE - les nuls

Lorsque vous vous asseyez commencer la section de rédaction analytique du GRE (Graduate Record Examination), vous devez argumenter votre point de vue sur une question présentée dans le test et d'analyser un argument ainsi. Gardez ces conseils à l'esprit lorsque vous rédigez votre texte analytique: Répondez précisément à la question, faites connaître votre opinion à ...