Utilisation du traitement des événements complexes pour les Big Data - Les nuls
Traitement des événements complexes (CEP) sont utiles pour le big data car il est destiné à gérer les données en mouvement. Le traitement des événements complexes est une technique de suivi, d'analyse et de traitement des données lorsqu'un événement se produit. Ces informations sont ensuite traitées et communiquées en fonction des règles et processus métier. L'idée de CEP est de pouvoir ...
Comment utiliser Apache Hadoop pour Predictive Analytics - dummies
Apache Hadoop est un logiciel libre et open-source plate-forme pour écrire et exécuter des applications qui traitent une grande quantité de données pour l'analyse prédictive. Il permet un traitement parallèle distribué de grands ensembles de données générés à partir de différentes sources. Essentiellement, c'est un outil puissant pour stocker et traiter des données volumineuses. Hadoop stocke tout type de données, ...
Utilisation de l'ajustement de courbe dans Predictive Analytics - L'ajustement de courbe
Est un processus utilisé dans l'analyse prédictive dont l'objectif est de créer une courbe qui représente la fonction mathématique qui correspond le mieux aux points de données réels (originaux) d'une série de données. La courbe peut traverser chaque point de données ou rester dans la masse des données, en ignorant certaines données ...
Comment utiliser le streaming de données pour le Big Data - les mannequins
Parfois confrontés au big data avec d'énormes quantités de données et une petite idée de l'endroit où aller. Entrez le flux de données. Lorsqu'une quantité importante de données doit être traitée rapidement en temps quasi réel pour obtenir des informations, les données en mouvement sous la forme de données en continu constituent la meilleure réponse. ...
Comment utiliser les arbres de décision d'analyse prédictive pour prédire l'avenir - les nuls
Une approche de l'analyse prédictive qui peut vous aider à prendre des décisions. Supposons, par exemple, que vous deviez décider d'investir un certain montant dans l'un des trois projets d'entreprise suivants: une entreprise de camions-restaurants, un restaurant ou une librairie. Un analyste commercial a calculé le taux d'échec ...
Comment utiliser les filtres collaboratifs basés sur les éléments dans l'analyse prédictive - mannequins
Les systèmes d'analyse prédictive utilisent un filtrage collaboratif basé sur les articles - distribuant un énorme inventaire de produits à partir de la base de données de l'entreprise lorsqu'un utilisateur visualise un seul article sur le site Web. Vous savez que vous recherchez un système de filtrage collaboratif basé sur des éléments (ou, souvent, un système basé sur le contenu) s'il affiche des recommandations à ...
Comment utiliser le lissage des données dans Predictive Analytics - les nuls
Lissage des données dans l'analyse prédictive essaient essentiellement pour trouver le "signal" dans le "bruit" en écartant les points de données qui sont considérés comme "bruyants". L'idée est d'affiner les modèles dans les données et de mettre en évidence les tendances vers lesquelles les données pointent. L'implication derrière le lissage des données est que les données sont composées de deux parties: une ...
Comment utiliser l'analyse supervisée pour former des modèles prédictifs - mannequins
En analyse supervisée, saisie et préférée la sortie fait partie des données d'apprentissage. Le modèle d'analyse prédictive est présenté avec les résultats corrects dans le cadre de son processus d'apprentissage. Un tel apprentissage supervisé suppose des exemples pré-classifiés: Le but est d'apprendre le modèle à partir de la classification précédemment connue afin qu'il puisse correctement ...
Comment utiliser Apache Mahout pour Predictive Analytics - dummies
Un outil open-source qui est particulièrement utile dans l'analyse prédictive est Apache Mahout. Cette bibliothèque d'apprentissage automatique comprend des versions à grande échelle de la classification, de la classification, du filtrage collaboratif et d'autres algorithmes d'exploration de données pouvant prendre en charge un modèle d'analyse prédictive à grande échelle. Un moyen hautement recommandé de traiter les données nécessaires pour un tel modèle est d'exécuter Mahout dans ...
Comment utiliser les régressions linéaires dans Predictive Analytics - les nuls
Régression linéaire est une méthode statistique qui analyse et trouve les relations entre deux variables. En analyse prédictive, il peut être utilisé pour prédire une valeur numérique future d'une variable. Considérons un exemple de données qui contient deux variables: les données passées consistant en les heures d'arrivée d'un train et son temps de retard correspondant. Supposons ...
Comment utiliser l'analyse prédictive pour satisfaire les clients - dummies
La concurrence mondiale pousse les entreprises à baisser leurs prix pour attirer de nouveaux les clients. Heureusement, l'analyse prédictive peut aider ici. Les entreprises s'efforcent de satisfaire leurs clients et d'en acquérir de nouvelles; les clients exigent de plus en plus des produits de haute qualité à des prix moins élevés. En réponse à ces pressions, les entreprises s'efforcent d'offrir le juste équilibre entre qualité et prix, au bon moment, ...
Comment utiliser les algorithmes de cluster K-means dans l'analyse prédictive - les nuls
K est une entrée à l'algorithme pour l'analyse prédictive; il représente le nombre de groupements que l'algorithme doit extraire d'un ensemble de données, exprimé algébriquement en k. Un algorithme K-means divise un ensemble de données donné en k clusters. L'algorithme effectue les opérations suivantes: Sélectionnez k éléments aléatoires de l'ensemble de données et étiquetez-les ...
Comment utiliser Python pour développer des graphiques pour la science des données - les nuls
Graphiques sont utiles . Un graphique est une représentation de données montrant les connexions entre des points de données utilisant des lignes dans Pythopn. Le but est de montrer que certains points de données se rapportent à d'autres points de données, mais pas à tous les points de données qui apparaissent sur le graphique. Pensez à une carte d'un métro ...
Comment utiliser le modèle de Markov dans Predictive Analytics - mannequins
Le modèle de Markov est un modèle statistique qui peut être utilisé dans l'analyse prédictive qui repose fortement sur la théorie des probabilités. (Il tire son nom d'un mathématicien russe dont la recherche principale portait sur la théorie des probabilités.) Voici un scénario pratique qui illustre comment cela fonctionne: Imaginez que vous voulez prédire si l'équipe X va gagner la partie de demain. Le ...
Comment utiliser Python pour sélectionner les bonnes variables pour la science des données - les nuls
Sélectionnant les bonnes variables en Python peuvent améliorer le processus d'apprentissage en science des données en réduisant la quantité de bruit (information inutile) qui peut influencer les estimations de l'apprenant. La sélection de variables peut donc réduire efficacement la variance des prédictions. Afin d'impliquer seulement les variables utiles dans la formation et omettre les redondantes, vous ...
Visualisation des résultats analytiques de votre modèle: regroupements masqués, classifications de données et valeurs aberrantes - Para Dummies
La visualisation des résultats de votre analyse prédictive aide vraiment les parties prenantes à comprendre les prochaines étapes. Voici quelques façons d'utiliser des techniques de visualisation pour rapporter les résultats de vos modèles aux parties prenantes. Comment visualiser les groupes cachés dans vos données Le clustering des données est le processus de découverte de groupes cachés d'éléments ...
Visualisation de l'analyse prédictive' Données brutes - mannequins
Une image vaut mille mots - surtout quand vous essayez de maîtriser vos données d'analyse prédictive. Lors de l'étape de prétraitement, pendant que vous préparez vos données, il est courant de visualiser ce que vous avez en main avant de passer à l'étape suivante. Vous commencez par utiliser une feuille de calcul telle que ...
Identifiant des données manquantes pour l'apprentissage automatique - mannequins
Même si vous avez suffisamment d'exemples pour une formation simple et complexe algorithmes d'apprentissage automatique, ils doivent présenter des valeurs complètes dans les entités, sans aucune donnée manquante. Avoir un exemple incomplet rend impossible la connexion de tous les signaux à l'intérieur et entre les caractéristiques.
Sur les bases de la statistique, l'apprentissage automatique et les méthodes mathématiques en sciences des données - Para Dummies
Si les statistiques ont été décrites comme la science de l'analyse des données, quelle est la différence entre un statisticien et un spécialiste des données? Bonne question! Tandis que de nombreuses tâches en science des données exigent un peu de savoir-faire statistique, la portée et l'étendue des connaissances et des compétences d'un data scientist sont différentes de celles ...
Pour comprendre les données sur la croissance du commerce électronique - les nuls
Science des données dans le commerce électronique même but que dans n'importe quelle autre discipline - pour obtenir des informations précieuses à partir de données brutes. Dans le commerce électronique, vous recherchez des informations sur les données que vous pouvez utiliser pour optimiser le retour sur investissement marketing (ROI) d'une marque et pour stimuler la croissance dans toutes les couches de l'entonnoir des ventes. Comment ...
Apprentissage: Création de vos propres fonctionnalités dans les données - nuls
Parfois les données brutes obtenues les sources n'auront pas les fonctionnalités nécessaires pour effectuer des tâches d'apprentissage automatique. Lorsque cela se produit, vous devez créer vos propres fonctionnalités afin d'obtenir le résultat souhaité. Créer une fonctionnalité ne signifie pas créer des données à partir de rien. Vous créez de nouvelles fonctionnalités à partir de données existantes. Comprendre le besoin ...
Faire des impacts positifs avec l'intelligence environnementale - les nuls
Elva est un brillant exemple de la façon dont les technologies d'intelligence environnementale peuvent être utilisées avoir un impact positif. Cette plate-forme libre et gratuite facilite la cartographie des causes et la visualisation des données pour le suivi des élections, les violations des droits de l'homme, la dégradation de l'environnement et les risques de catastrophe dans les pays en développement. Dans l'un de ses projets les plus récents, Elva travaille avec ...
Modélisation de la demande de déplacement dans l'activité criminelle - les nuls
Modélisent la demande de déplacement d'une activité criminelle les habitudes de déplacement des criminels afin que les forces de l'ordre puissent utiliser cette information dans la planification de la réponse tactique. Si vous voulez prédire les itinéraires les plus probables que les criminels emprunteront entre leur lieu de départ et les endroits où ...
Modélisation mathématique avec chaînes de Markov et méthodes stochastiques - modèles
Un modèle stochastique est un outil que vous pouvez utiliser estimer les résultats probables lorsqu'une ou plusieurs variables du modèle sont modifiées de façon aléatoire. Une chaîne de Markov - aussi appelée chaîne de Markov à temps discret - est un processus stochastique qui agit comme une méthode mathématique pour enchaîner une série de variables générées aléatoirement représentant ...
Exploration de vos données à l'aide de Data Science - mannequins
À L'ère des mégadonnées et les tailles sont sur une quête d'embauche. Ils veulent embaucher des spécialistes des données pour qu'ils puissent utiliser des données et des décisions éclairées par les données pour ajouter de la valeur à leur organisation et rester compétitifs. Malheureusement, la plupart des organisations et leurs gestionnaires d'embauche ne comprennent pas vraiment ...
Valeurs manquantes dans vos données - mannequins
L'un des problèmes de données les plus fréquents et les plus désordonnés concerne les données manquantes. Les fichiers peuvent être incomplets car les enregistrements ont été supprimés ou un périphérique de stockage a été rempli. Ou certains champs de données peuvent ne contenir aucune donnée pour certains enregistrements. Le premier de ces problèmes peut être diagnostiqué en vérifiant simplement le nombre d'enregistrements pour les fichiers. ...
Nouvelles opportunités de travail avec apprentissage automatique - mannequins
Vous trouverez plus d'articles sur la perte d'emplois que l'apprentissage automatique et ses technologies associées provoqueront. Les robots effectuent déjà un certain nombre de tâches qui employaient des humains, et cette utilisation augmentera avec le temps. Vous devez également avoir réfléchi à la façon dont ces nouvelles utilisations pourraient vous coûter ...
Phases du processus d'exploration de données - mannequins
Le processus standard interprofessionnel d'exploration de données (CRISP-DM) est le cadre dominant du processus d'exploration de données. C'est une norme ouverte; n'importe qui peut l'utiliser. La liste suivante décrit les différentes phases du processus. Compréhension des affaires: Comprenez clairement le problème que vous devez résoudre, comment cela influe sur votre organisation et vos objectifs ...
Optimisation des choix de validation croisée dans l'apprentissage automatique - des mannequins
Permettant de valider efficacement une hypothèse d'apprentissage automatique optimisation supplémentaire de votre algorithme choisi. L'algorithme fournit la plupart des performances prédictives sur vos données, étant donné sa capacité à détecter des signaux à partir de données et à s'adapter à la forme fonctionnelle réelle de la fonction prédictive sans surapprentissage et générant beaucoup de variance des estimations. Non ...
Nouvelle visualisation dans Predictive Analytics - mannequins
Une visualisation peut représenter une simulation (représentation graphique d'un scénario de simulation) ) en analyse prédictive. Vous pouvez suivre une visualisation d'une prédiction avec une simulation qui chevauche et prend en charge la prédiction. Par exemple, que se passe-t-il si l'entreprise arrête de fabriquer le produit D? Que se passe-t-il si une catastrophe naturelle frappe le bureau à domicile? ...
Prédictive Analytics: savoir quand mettre à jour votre modèle - nuls
Autant que vous ne l'aimiez pas , votre travail d'analyse prédictive n'est pas terminé lorsque votre modèle est mis en ligne. Le déploiement réussi du modèle en production n'est pas le moment de se détendre. Vous devrez suivre de près sa précision et ses performances au fil du temps. Un modèle a tendance à se dégrader au fil du temps (certains plus rapidement que d'autres); et ...
Modèles spatiaux prédictifs pour l'analyse de la criminalité - mannequins
Vous pouvez incorporer des modèles statistiques prédictifs dans les méthodes d'analyse de la criminalité. décrire et prédire où et quelles sortes d'activités criminelles sont susceptibles de se produire. Les modèles spatiaux prédictifs peuvent vous aider à prédire le comportement, l'emplacement ou les activités criminelles des récidivistes. Vous pouvez également appliquer des méthodes statistiques à des données spatio-temporelles pour vérifier ...
Prédictive Analytics For Dummies Cheat Sheet - mannequins
Un projet d'analyse prédictive combine l'exécution de détails avec la pensée big-picture. Ces conseils et listes de vérification pratiques vous aideront à garder votre projet sur les rails et à l'extérieur du bois.
Préparation de vos données pour Predictive Analytics - mannequins
Lorsque vous avez défini les objectifs du modèle, la prochaine étape Dans l'analyse prédictive, vous devez identifier et préparer les données que vous utiliserez pour créer votre modèle. Les informations suivantes concernent les activités les plus importantes. La séquence générale des étapes ressemble à ceci: Identifiez vos sources de données. Les données peuvent être dans différents formats ou ...
La probabilité des distributions dans l'analyse statistique des données volumineuses - les nuls
Distributions de probabilité est l'une des nombreuses techniques statistiques être utilisé pour analyser les données afin de trouver des modèles utiles. Vous utilisez une distribution de probabilités pour calculer les probabilités associées aux éléments d'un ensemble de données: Distribution binomiale: vous utiliseriez la distribution binomiale pour analyser des variables qui peuvent n'assumer qu'une seule des deux valeurs. Pour ...
Quandl Données ouvertes - nuls
Quandl est un site Web basé à Toronto qui vise à être un moteur de recherche de données numériques. Cependant, contrairement à la plupart des moteurs de recherche, sa base de données n'est pas générée automatiquement par les robots qui explorent le Web. Au contraire, il se concentre sur les données liées qui sont mises à jour via crowdsourcing - mises à jour manuellement via des conservateurs humains, en d'autres termes. Parce que la plupart des données financières sont ...
Empêchant Data Privacy Disasters - les nuls
La confidentialité des données est un gros problème pour les mineurs de données. Les rapports de nouvelles soulignant le niveau de données personnelles entre les mains de la National Security Agency du gouvernement des États-Unis et les violations des sources de données commerciales ont soulevé la sensibilisation et la préoccupation du public. Un concept central dans la confidentialité des données est l'information personnelle identifiable (PII), ou toute donnée qui peut ...
L'essor des données ouvertes et son rôle dans l'analyse prédictive - mannequins
Un outil très utile pour l'analyse prédictive. Bob Lytle, le PDG de rel8ed. et, plus récemment, l'ancien DPI de TransUnion Canada, dirige les efforts sur l'utilisation de l'information publique comme source de données de rechange et stratégique pour la modélisation prédictive dans les secteurs des services financiers et de l'assurance. Open ...
Techniques d'analyse exploratoire des données (EDA) quantitatives - nuls
Bien que l'EDA soit principalement basée sur des techniques graphiques, comprend également quelques techniques quantitatives. Cet article traite de deux d'entre elles: l'estimation d'intervalle et le test d'hypothèse. Estimation d'intervalle L'estimation d'intervalle est une technique utilisée pour construire une gamme de valeurs dans lesquelles une variable est susceptible de tomber. Un exemple important de ceci ...
Le rôle des statistiques dans l'apprentissage automatique - mannequins
Certains sites en ligne voudraient vous faire croire que les statistiques et l'apprentissage automatique sont deux technologies complètement différentes. Par exemple, lorsque vous lisez Statistiques vs Machine Learning, combattez! , vous avez l'idée que les deux technologies ne sont pas seulement différentes, mais carrément hostiles les unes envers les autres. Le fait est que les statistiques et l'apprentissage automatique ont un ...