Comment cataloguer des fichiers d'extraction existants - des nuls
Lorsque vous commencez à réfléchir à ce qu'il faut faire des fichiers d'extraction et autres Types d'environnements d'entrepôt de données qui existent dans votre organisation, vous devez les trouver, ce qui peut s'avérer difficile compte tenu de la nature locale de ces environnements. Voici un indice: Suivez les rapports. Par le biais de sessions de travail en groupe et de réunions individuelles, ...
Comment être un Smart Shopper lors de conférences sur l'entreposage de données - les tasses
Ne s'y trompent pas: Vous pouvez gagner énormément de valeur en assistant à tout type de conférence ou de salon professionnel, y compris ceux axés sur l'entreposage de données. Les vendeurs vantent et démontrent leurs derniers produits, vous pouvez entendre des études de cas et des histoires sur des implémentations réussies d'entreposage de données, et vous pouvez obtenir un aperçu unique des problèmes à venir ...
Comment intégrer le Big Data - les mannequins
N'ont pas assez accès aux sources de données volumineuses. Vous devrez intégrer ces sources. Bientôt, il y aura des pétaoctets de données et des centaines de mécanismes d'accès parmi lesquels vous pourrez choisir. Mais quels flux et quels types de données avez-vous besoin? Comprendre le problème que vous essayez de résoudre Identifiez le ...
Comment garantir la validité, la véracité et la volatilité des mégadonnées - mannequins
Un volume élevé, une grande variété et une vitesse élevée sont les caractéristiques essentielles du big data. Mais d'autres caractéristiques des mégadonnées sont également importantes, en particulier lorsque vous appliquez des données volumineuses à des processus opérationnels. Validité: Les données sont-elles correctes et exactes pour le ...
Comment utiliser le Cloud pour le Big Data - les nuls
, La nature même de le cloud en fait un environnement informatique idéal pour le big data. Alors, comment pourriez-vous utiliser les grandes données avec le cloud? Voici quelques exemples: IaaS dans un cloud public: Dans ce scénario, vous utiliseriez l'infrastructure d'un fournisseur de cloud public pour vos services Big Data car vous ...
Comment créer une feuille de route de mise en œuvre de Big Data -
, Sera différent en fonction de vos objectifs commerciaux, de la maturité de votre environnement de gestion des données et de la quantité de risques que votre organisation peut absorber. Commencez donc votre planification en tenant compte de tous les problèmes qui vous permettront de déterminer une feuille de route de mise en œuvre. L'urgence commerciale et ...
Implémenter un Data Mart - Rapidement - des nuls
Peu importe comment vous décidez de diviser l'univers des contenus possibles en Sous-ensemble pour votre magasin de données, n'oubliez pas que pour obtenir une valeur commerciale maximale de votre magasin de données, vous devez l'implémenter rapidement. Voici les trois clés pour une mise en œuvre rapide: Suivez une méthodologie itérative et progressive. Vous passez la majorité de ...
Comment définir la base architecturale pour le Big Data - les nuls
Il est important de mettre en place une architecture solide fondation si vous voulez réussir avec des données volumineuses. En plus de soutenir les exigences fonctionnelles, il est important de soutenir la performance requise. Vos besoins dépendront de la nature de l'analyse que vous soutenez. Vous aurez besoin de la bonne puissance de calcul ...
Comment optimiser les tâches MapReduce - les nuls
Outre l'optimisation du code d'application réel avec MapReduce pour les projets Big Data, vous pouvez utiliser des techniques d'optimisation pour améliorer la fiabilité et la performance. Ils appartiennent à trois catégories: topologie matérielle / réseau, synchronisation et système de fichiers. Topologie matérielle / réseau Big Data Indépendamment de l'application, le matériel et les réseaux les plus rapides généreront probablement les temps d'exécution les plus rapides ...
Identifiez les données dont vous avez besoin pour vos mégadonnées - les mannequins
Font le point sur le type de données sont confrontés à votre projet Big Data. De nombreuses organisations reconnaissent que beaucoup de données générées en interne n'ont pas été exploitées à leur plein potentiel par le passé. En exploitant de nouveaux outils, les organisations acquièrent de nouvelles connaissances à partir de sources inexploitées de données non ...
Comment utiliser MapReduce pour le Big Data - dummies
MapReduce est un framework logiciel idéal pour le big data car Il permet aux développeurs d'écrire des programmes capables de traiter des quantités massives de données non structurées en parallèle à travers un groupe distribué de processeurs. La fonction de carte pour les données volumineuses La fonction cartographique a fait partie de nombreux langages de programmation fonctionnels depuis des années. Map ...
Couche 0 de la pile de données volumineuses: infrastructure physique redondante - mannequins
Au niveau le plus bas de la grande pile de données est l'infrastructure physique. Il se peut que votre entreprise dispose déjà d'un centre de données ou investisse dans des infrastructures physiques. Vous devez donc trouver un moyen d'utiliser les ressources existantes. Les implémentations Big Data ont des exigences très spécifiques sur tous les éléments de l'architecture de référence, ...
Couche 2 de la pile Big Data: bases de données opérationnelles - les nuls
Au cœur de tout grand L'environnement de données et la couche 2 de la grande pile de données sont les moteurs de base de données contenant les collections d'éléments de données pertinentes pour votre entreprise. Ces moteurs doivent être rapides, évolutifs et solides. Ils ne sont pas tous créés égaux, et certains grands environnements de données s'en sortent mieux avec ...
Couche 3 de la pile Big Data: organisation des services de données et outils - dummies
L'organisation de services et d'outils de données, la couche 3 de la pile de données volumineuses, capture, valide et assemble différents éléments de Big Data dans des collections contextuelles pertinentes. Parce que les données volumineuses sont massives, les techniques ont évolué pour traiter les données de manière efficace et transparente. MapReduce est une technique très utilisée. Il suffit de dire que beaucoup de ces organisations organisent ...
Bases de données paires de valeurs clés dans un environnement Big Data - Mannequins
De loin, le plus simple les bases de données NoSQL (non seulement SQL) dans un environnement Big Data sont celles qui utilisent le modèle KVP (paire clé-valeur). Les bases de données KVP ne nécessitent pas de schéma (comme les SGBDR) et offrent une grande flexibilité et évolutivité. Les bases de données KVP n'offrent pas la capacité ACID (Atomicity, Consistency, Isolation, Durability), et obligent les implémenteurs à penser aux données ...
Rencontrez des représentants d'entreposage de données - des mannequins
Pour magasiner pour des produits d'entreposage de données peuvent inclure des rencontres avec des représentants. Avant qu'un représentant commercial vende à pied dans votre bureau ou initie une conférence Web avec vous, indiquez clairement ce que vous prévoyez de couvrir pendant cette réunion initiale d'une ou deux heures. Vous devriez au moins faire ce qui suit: Écoutez une présentation de ...
Couche 1 de la pile Big Data: Infrastructure de sécurité - mannequins
Sécurité et confidentialité, couche 1 de la grande pile de données, sont similaires aux exigences pour les environnements de données conventionnels. Les exigences de sécurité doivent être étroitement alignées sur les besoins spécifiques de l'entreprise. Des défis uniques surviennent lorsque le big data fait partie de la stratégie: Accès aux données: l'accès des utilisateurs aux Big Data ...
Couche 4 de la pile Big Data: entrepôts de données analytiques - mannequins
La couche 4 de la grande pile de données, et son compagnon le magasin de données, ont longtemps été les principales techniques utilisées par les organisations pour optimiser les données afin d'aider les décideurs. Généralement, les entrepôts de données et les magasins contiennent des données normalisées provenant de diverses sources et assemblées pour faciliter l'analyse de l'entreprise. Data ...
Gérer la virtualisation pour le Big Data - les nuls La virtualisation
Sépare les ressources et les services de l'environnement de distribution physique sous-jacent. de nombreux systèmes virtuels dans un seul système physique. L'une des principales raisons pour lesquelles les entreprises ont implémenté la virtualisation est d'améliorer les performances et l'efficacité du traitement d'une variété de charges de travail. L'hyperviseur de données volumineuses ...
Middleware pour Data Warehousing - dummies
Middleware est un logiciel qui connecte des composants logiciels. Dans un environnement d'entreposage de données, les services middleware sont l'ensemble des programmes et des routines qui effectuent les opérations suivantes: Extraire les données de la source (ou des sources). Assurez-vous que les données sont correctes. Déplacez les données autour de l'environnement d'une plateforme à l'autre, selon les besoins. Gérez tout ce qui est nécessaire ...
Gestion des données maîtres (MDM) - mannequins
Ces dernières années, systèmes de retour ODS définis dans un but précis - données de référence - ont émergé. Tous les systèmes sont emballés avec des données de référence. Ces données peuvent inclure l'ensemble des données que vous utilisez pour décrire l'étape d'une opportunité de vente (par exemple, une avance, une avance qualifiée, une opportunité, une opportunité prévue, et ...
Middleware Services: mappage et transformation de données - nuls
Cette figure montre un environnement dans lequel les données sont extraites trois sources de données différentes à inclure dans un entrepôt de données, et chacune des trois sources est sur une plate-forme différente. À un moment donné dans le processus du middleware, ces extraits QA doivent être rassemblés pour un processus combiné de cartographie et de transformation. Le ...
Middleware Services: Déplacement de données et chargement de données - nuls
Dans la plupart des situations, les deux services middleware - sélection et l'extraction, et l'assurance qualité - se déroulent sur la même plate-forme (système) sur laquelle réside la source de données. Si votre entrepôt de données est hébergé sur une plate-forme différente de la source de données, vous devez utiliser un service de transfert de données pour effectuer le système-à-système ...
Middleware Services: Sélection de données et extractions - dummies
L'objectif principal du service de sélection et d'extraction de données consiste à sélectionner (trouver dans) une source de données les données que vous souhaitez déplacer dans l'entrepôt de données, puis extraire (extraire) ces données dans un formulaire qui peut être préparé pour les services d'assurance qualité. Vous pouvez utiliser l'un des deux types différents ...
Mine Big Data avec Hive - les nuls
Hive est une couche de stockage de données orientée par lots et construite sur les éléments centraux de Hadoop (HDFS et MapReduce) et est très utile dans le Big Data. Il fournit aux utilisateurs qui connaissent SQL une implémentation SQL-Lite simple appelée HiveQL sans sacrifier l'accès via des mappeurs et des réducteurs. Avec Hive, vous pouvez obtenir le meilleur des deux mondes: accès de type SQL ...
Bases de données multidimensionnelles - nuls
Ce n'est pas la première fois dans l'histoire que de nouveaux types de produits de base de données émergent et surmontent les inefficacités RDBMS . Dans les années 1980, une classe d'applications a été identifiée dans laquelle les produits SGBDR mal géré les besoins de gestion des données (en particulier la génération de SGBDR disponibles à ce moment-là).
Middleware Services: assurance qualité des données - nuls
Vous devez établir deux services d'assurance qualité différents dans le flux des services middleware. Vous devez effectuer les premières tâches de contrôle qualité sur l'extrait de la source de données avant d'effectuer d'autres services de middleware. Assurance qualité des données: partie I Essayez de détecter (et corriger) les erreurs et les problèmes dès le début du processus ...
Bases de données non relationnelles dans un environnement Big Data - Les bases de données non relationnelles
Ne reposent pas sur le modèle table / clé endémique aux SGBDR (systèmes de gestion de bases de données relationnelles). En résumé, les données spécialisées dans le monde des données volumineuses nécessitent des techniques de persistance et de manipulation des données. Bien que ces nouveaux styles de bases de données offrent des réponses à vos défis de big data, ils ne sont pas un ticket exprès ...
Pour utiliser Big Data to Use - les statistiques
Peuvent être utilisées pour vous aider à mieux comprendre les données. Alors, que faire si les données sont de grandes données? Cela signifierait que les données non structurées analysées sont à volume élevé, à grande vitesse ou les deux. Les données massives et la voix du client Optimiser l'expérience client et améliorer la rétention des clients sont les ...
Neuf signes d'un projet réussi d'entreposage de données - mannequins
Parce que tout le monde se rassemble dans la cafétéria et plâtrer les murs avec des bannières de félicitations ne signifie pas que votre projet d'entreposage de données a été un succès. Ce chapitre vous donne quelques façons de dire que vous avez vraiment réussi. Le parrain exécutif dit: «Cette chose fonctionne - ça marche vraiment! "Supposons qu'un senior ...
Modification des produits de Business Intelligence pour gérer les Big Data - les nuls
Traditionnels n'étaient pas vraiment conçus gérer de grandes données, ils peuvent donc nécessiter quelques modifications. Ils ont été conçus pour fonctionner avec des données très bien structurées et bien comprises, souvent stockées dans un référentiel de données relationnelles et affichées sur votre ordinateur de bureau ou portable. Cette analyse d'intelligence d'entreprise traditionnelle est généralement appliquée aux instantanés de données plutôt ...
Autres types de Business Intelligence - nuls
Hélas, le modèle ordonné et ordonné qui a quatre types différents de business intelligence (l'interrogation et la création de rapports, l'analyse métier [OLAP], l'exploration de données, les tableaux de bord et les tableaux de bord) peuvent être étendues à des applications plus complexes. Par exemple, un outil OLAP ou un tableau de bord peut avoir des fonctionnalités de système d'information géographique (SIG) - ou peut-être pas. Comme le montre ...
Produits relationnels et entreposage de données - mannequins
Voici quelques produits de base de données relationnels que vous pourriez utiliser pour vos données entrepôt. Au cours des dernières années, presque tous ces fournisseurs ont acquis des produits supplémentaires, notamment des technologies OLAP ou multidimensionnelles et d'autres SGBDR pour prendre en charge des plates-formes très diversifiées et les intégrer dans leurs gammes de produits et leurs architectures. Vous voudrez peut-être ...
Préparer la sémantique dans Data Warehousing - les nuls
Si vous évaluez le fonctionnement des technologies associées à l'entreposage de données, des métadonnées est géré de façon propriétaire dans l'outil. Certains ont déjà tenté par le passé de résoudre le problème de l'intégration en créant une autre technologie, connue sous le nom de référentiels techniques de métadonnées, pour intégrer toutes ces métadonnées à partir des différents outils. Such ...
Devriez-vous utiliser des outils ou du code personnalisé? - mannequins
Dans les premiers jours de l'entreposage de données, la plupart des organisations traitaient les services middleware par codage personnalisé, plutôt qu'avec les quelques outils disponibles à la fois, comme indiqué dans cet exemple: Une organisation écrit un programme dans une programmation langage tel que COBOL, ou peut-être dans un environnement tel que SAS, pour gérer les extraits de données ...
Outils d'interrogation et de reporting pour l'entreposage de données - mannequins
Un outil d'interrogation et de création de rapports listes organisées, et effectuer des rapports et des requêtes inter-tabulaires. Voici quelques outils d'interrogation et de reporting pour vous familiariser avec. Le rôle de SQL SQL est le langage d'interrogation officiel de la base de données utilisé pour accéder et mettre à jour les données contenues dans un système de gestion ...
Services de réplication pour Data Warehousing - dukes
Combinent sélection et extraction, déplacement et chargement d'une base de données à un ou plusieurs autres, généralement gérés par un seul produit SGBD. (La base de données source et toutes les cibles sont toutes Oracle, Sybase ou Microsoft SQL Server, par exemple.) Bien que les fonctionnalités du service de réplication varient d'un produit de SGBD à l'autre, elles ont toujours été ...
RDBMS dans un environnement Big Data - les nuls
Sont devenus un élément important dans la façon dont les organisations exploitent -volume données à la bonne vitesse pour résoudre des problèmes de données spécifiques. Les systèmes de gestion de base de données relationnelle sont importants pour ce volume élevé. Les données volumineuses ne vivent pas isolément. Pour être efficaces, les entreprises doivent souvent combiner les résultats de ...