Accueil Finances personnelles Document Bases de données dans un environnement Big Data - mannequins

Document Bases de données dans un environnement Big Data - mannequins

Table des matières:

Vidéo: Big data : données, données, donnez-moi ! - #DATAGUEULE 15 2025

Vidéo: Big data : données, données, donnez-moi ! - #DATAGUEULE 15 2025
Anonim

Vous trouverez deux types de bases de données de documents pour les projets Big Data. L'un est souvent décrit comme un référentiel pour un contenu de style document complet. L'autre est une base de données pour stocker des composants de document pour le stockage permanent en tant qu'entité statique ou pour l'assemblage dynamique des parties d'un document. La structure des documents et de leurs parties est fournie par JavaScript Object Notation (JSON) et / ou JSON binaire (BSON).

Les bases de documents sont plus utiles lorsque vous devez produire beaucoup de rapports et qu'ils doivent être assemblés dynamiquement à partir d'éléments qui changent fréquemment.

À la base, JSON est un format d'échange de données basé sur un sous-ensemble du langage de programmation JavaScript. Bien que faisant partie d'un langage de programmation, il est de nature textuelle et très facile à lire et à écrire. Il a également l'avantage d'être facile à gérer pour les ordinateurs. Deux structures de base existent dans JSON, et elles sont supportées par de nombreux langages de programmation modernes, sinon tous.

La première structure de base est une collection de paires nom / valeur, et elles sont représentées par programme en tant qu'objets, enregistrements, listes à clés, etc. La deuxième structure de base est une liste ordonnée de valeurs, et elles sont représentées par programme sous forme de tableaux, de listes ou de séquences. BSON est une sérialisation binaire de structures JSON conçues pour augmenter les performances et l'évolutivité.

MongoDB pour le Big Data

MongoDB est le nom du projet "hu (mongo) us database". Il est géré par une société appelée 10gen comme open source et est disponible gratuitement sous GNU AGPL v3. 0 licence. Les licences commerciales avec un support complet sont disponibles auprès de 10gen.

MongoDB est composé de bases de données contenant "collections. "Une collection est composée de" documents "et chaque document est composé de champs. Tout comme dans les bases de données relationnelles, vous pouvez indexer une collection.

Cela augmente les performances de la recherche de données. Contrairement à d'autres bases de données, cependant, MongoDB renvoie quelque chose appelé "curseur", qui sert de pointeur vers les données. C'est une fonctionnalité très utile car elle offre la possibilité de compter ou de classer les données sans les extraire. Nativement, MongoDB supporte BSON, l'implémentation binaire des documents JSON.

MongoDB est également un écosystème composé des éléments suivants:

  • Services de haute disponibilité et de réplication pour la mise à l'échelle des réseaux locaux et étendus.

  • Système de fichiers basé sur une grille, permettant de stocker des objets volumineux en les divisant en plusieurs documents.

  • MapReduce pour prendre en charge l'analyse et l'agrégation de différentes collections / documents.

  • Un service de fragmentation qui distribue une base de données unique sur un cluster de serveurs dans un seul ou plusieurs centres de données. Le service est piloté par une clé de partition. La clé shard est utilisée pour distribuer les documents intelligemment sur plusieurs instances.

  • Service d'interrogation prenant en charge les requêtes ad hoc, les requêtes distribuées et la recherche en texte intégral.

Les implémentations efficaces de MongoDB incluent

  • Gestion de contenu à volume élevé

  • Réseaux sociaux

  • Archivage

  • Analyse en temps réel

CouchDB pour les données volumineuses

Une autre base de données non relationnelle très populaire est CouchDB. Comme MongoDB, CouchDB est open source. Il est maintenu par Apache Software Foundation et est disponible sous la licence Apache v2. 0. Contrairement à MongoDB, CouchDB a été conçu pour imiter le web à tous égards.

Par exemple, CouchDB est résilient aux interruptions de réseau et continuera à fonctionner magnifiquement dans les zones où la connectivité réseau est inégale. Il est également à la maison sur un smartphone ou dans un centre de données. Tout cela vient avec quelques compromis. En raison du mimétisme Web sous-jacent, CouchDB est à latence élevée, ce qui entraîne une préférence pour le stockage de données local.

CouchDB n'est pas bien adapté aux petites implémentations. Vous devez déterminer si ces compromis peuvent être ignorés lorsque vous commencez votre implémentation de Big Data.

Les bases de données CouchDB sont composées de documents constitués de champs et de pièces jointes, ainsi que d'une "description" du document sous la forme de métadonnées automatiquement gérées par le système. La technologie sous-jacente comporte toutes les capacités ACID. L'avantage de CouchDB par rapport à la relationnel est que les données sont empaquetées et prêtes à être manipulées ou stockées plutôt que réparties entre les lignes et les tables.

CouchDB est également un écosystème avec les capacités suivantes:

  • Compaction: Les bases de données sont compressées pour éliminer l'espace perdu lorsqu'un certain niveau de vide est atteint. Cela aide les performances et l'efficacité pour la persistance.

  • Voir le modèle: Mécanisme de filtrage, d'organisation et de rapport sur les données utilisant un ensemble de définitions stockées en tant que documents dans la base de données. Vous trouvez une relation un-à-plusieurs de bases de données à des vues, de sorte que vous pouvez créer de nombreuses façons différentes de représenter les données que vous avez «découpées et coupées». "

  • Services de réplication et distribués: Le stockage de documents est conçu pour fournir une réplication bidirectionnelle. Les répliques partielles peuvent être conservées pour prendre en charge la distribution basée sur des critères ou la migration vers des périphériques avec une connectivité limitée. La réplication native est basée sur les homologues, mais vous pouvez implémenter des méthodes maître / esclave, maître / maître et d'autres types de réplication.

Les implémentations efficaces de CouchDB incluent

  • Gestion de contenu à haut volume

  • Passage du smartphone au centre de données

  • Applications avec connectivité réseau limitée ou lente

Document Bases de données dans un environnement Big Data - mannequins

Le choix des éditeurs

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Pour approfondir votre conscience consciente, vous devez pratiquer une méditation de pleine conscience sur une base quotidienne. Familiarisez-vous avec certaines des médiations suivantes. Avec le temps, vous deviendrez plus conscient de votre vie quotidienne. Body Meditation Meditation - Cette méditation implique de passer environ une demi-heure, en prenant conscience de ...

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Les Templiers sont presque aussi fictifs dans Dan Brown Le code Da Vinci comme les chevaliers Jedi sont dans Star Wars. Bien que le héros Robert Langdon hésite d'abord à élever les Templiers dans ses cours, parce que la mention même d'eux fait ressortir les amants du complot, Brown n'a aucun problème à les faire participer ...

Démystification des mythes communs sur la franc-maçonnerie - mannequins

Démystification des mythes communs sur la franc-maçonnerie - mannequins

La franc-maçonnerie moderne existe depuis 1717. Les premières contre-vérités concoctées sur l'Ordre sont apparues en impression à peu près en même temps. Les États-Unis étaient consumés par l'hystérie anti-maçonnique à la fin des années 1820, et l'Europe a fait de Mason-bashing un sport populaire pendant deux siècles, le liant souvent à la propagande antisémite. Internet n'a que ...

Le choix des éditeurs

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

Dans la boîte de dialogue Configurer l'affichage dans PowerPoint, cliquez sur le bouton Configurer l'affichage dans l'onglet Diaporama du ruban Office 2011 pour Mac, ou choisissez Diaporama → Configurer l'affichage dans la barre de menus. Dans les deux cas, la boîte de dialogue Configurer l'affichage polyvalent apparaît. Choisir un type de spectacle dans PowerPoint 2011 pour Mac ...

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement d'un fichier sur lequel vous travaillez dans Office 2011 pour Mac est aussi simple que de cliquer sur le bouton Enregistrer dans la barre d'outils Standard, en appuyant sur Commande-S ou en choisissant Fichier → Enregistrer. Si votre fichier a été enregistré précédemment, l'enregistrement du fichier remplace la copie existante du fichier par votre version mise à jour. Si votre fichier n'a pas ...

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Dans Office 2011 pour Mac, l'ajout d'une nouvelle présentation de diapositive à une diapositive dans la vue Diapositive maître de PowerPoint 2011 est une tâche assez simple à effectuer. Suivez ces étapes pour commencer: Assurez-vous que vous êtes en mode Masque des diapositives. Choisissez Affichage → Maître → Masque de diapositives dans la barre de menus. Cliquez sur l'onglet Masque des diapositives du ruban, ...

Le choix des éditeurs

Sélectionnez PowerPoint 2007 Objects - dummies

Sélectionnez PowerPoint 2007 Objects - dummies

Avant de pouvoir modifier un objet PowerPoint 2007 sur une diapositive, vous devez le sélectionner. Dans les présentations PowerPoint, les objets peuvent être du texte, des graphiques, des images clipart, des formes, etc. Voici quelques instructions pour sélectionner les objets PowerPoint 2007: Objets texte: Pour sélectionner un objet texte PowerPoint 2007, déplacez le point d'insertion sur le texte qui ...

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Le contrôle shapePoint de powerPoint vous permet style des objets de ligne ou la bordure pour les objets de forme solide sur vos diapositives PowerPoint. Le contrôle Shape Outline se trouve dans le groupe Styles de formes de l'onglet Outils de dessin. Vous pouvez modifier les paramètres suivants pour le contour: Couleur: Définit la couleur utilisée pour ...

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 est le logiciel de présentation le plus puissant disponible pour créer et éditer la diapositive montrer des présentations pour le travail, la maison ou l'école. PowerPoint 2016 offre un certain nombre de raccourcis clavier utiles pour effectuer des tâches rapidement. Voici quelques raccourcis pour le formatage PowerPoint commun, l'édition et les tâches de fichiers et de documents. De plus, après avoir créé votre chef-d'œuvre, vous ...