Accueil Finances personnelles Stockages de données noSQL par rapport à Hadoop - dummies

Stockages de données noSQL par rapport à Hadoop - dummies

Vidéo: Introduction aux bases de données NoSQL 2025

Vidéo: Introduction aux bases de données NoSQL 2025
Anonim

Les banques de données NoSQL souscrites à la notion "Just Say No to SQL" (pour paraphraser campagne de publicité anti-drogue dans les années 1980), et ils étaient une réaction aux limitations perçues des bases de données relationnelles (basées sur SQL). Ce n'est pas que ces gens détestaient SQL, mais ils étaient fatigués de forcer des chevilles carrées dans des trous ronds en résolvant des problèmes pour lesquels les bases de données relationnelles n'étaient pas conçues.

Une base de données relationnelle est un outil puissant, mais pour certains types de données (comme les paires clé-valeur ou graphiques) et certains modèles d'utilisation (comme le stockage à très grande échelle), une base de données relationnelle n'est pas disponible. t pratique. Et quand il s'agit de stockage à haut volume, la base de données relationnelle peut être coûteuse, à la fois en termes de coûts de licence de base de données et de coûts matériels. (Les bases de données relationnelles sont conçues pour fonctionner avec du matériel de niveau entreprise.)

Ainsi, avec le mouvement NoSQL, les programmeurs créatifs ont développé des dizaines de solutions pour différents types de problèmes de stockage et de traitement des données épineuses. Ces bases de données NoSQL fournissent généralement une évolutivité massive au moyen de la mise en cluster et sont souvent conçues pour permettre un haut débit et une faible latence.

Le nom NoSQL est quelque peu trompeur car beaucoup de bases de données qui correspondent à la catégorie ont le support SQL (plutôt que le support "NoSQL"). Pensez à son nom à la place "Non seulement SQL. "

Les offres NoSQL disponibles aujourd'hui peuvent être réparties en quatre catégories distinctes, en fonction de leur conception et de leur destination:

  • Stocks de valeur-clés: Cette offre permet de stocker n'importe quel type de données sans avoir à utiliser un schéma. Ceci est en contraste avec les bases de données relationnelles, où vous devez définir le schéma (la structure de la table) avant toute insertion de données. Étant donné que les magasins de valeurs-clés ne nécessitent pas de schéma, vous disposez d'une grande flexibilité pour stocker des données dans de nombreux formats.

    Dans une banque de valeurs-clés, une ligne se compose simplement d'une clé (un identificateur) et d'une valeur, qui peut aller d'une valeur entière à une grande chaîne de données binaires. De nombreuses implémentations de magasins de valeurs-clés sont basées sur le papier Dynamo d'Amazon.

  • Magasins de familles de colonnes: Vous trouverez ici des bases de données dans lesquelles les colonnes sont regroupées en familles de colonnes et stockées ensemble sur le disque.

    Strictement parlant, nombre de ces bases de données ne sont pas axées sur les colonnes, car elles sont basées sur l'article BigTable de Google, qui stocke les données sous forme de carte triée multidimensionnelle.

  • Magasins de documents: Cette offre repose sur des collections de documents de même format et encodés pour améliorer l'efficacité.Les magasins de documents permettent à des documents individuels d'une collection d'inclure uniquement un sous-ensemble de champs, de sorte que seules les données nécessaires sont stockées. Pour les ensembles de données clairsemés, où de nombreux champs ne sont souvent pas remplis, cela peut se traduire par des économies d'espace significatives.

    En revanche, les colonnes vides dans les tables de base de données relationnelles occupent de l'espace. Les magasins de documents permettent également la flexibilité du schéma, car seuls les champs nécessaires sont stockés et de nouveaux champs peuvent être ajoutés. Une fois de plus, contrairement aux bases de données relationnelles, les structures de table sont définies avant que les données ne soient stockées et la modification des colonnes est une tâche fastidieuse qui affecte l'intégralité de l'ensemble de données.

  • Bases de graphe: Ici vous avez des bases de données qui stockent des structures de graphe - des représentations qui montrent des collections d'entités (sommets ou nœuds) et leurs relations (arêtes) entre elles. Ces structures permettent aux bases de données graphiques d'être extrêmement bien adaptées au stockage de structures complexes, comme les relations de liaison entre toutes les pages Web connues. (Par exemple, les pages Web individuelles sont des nœuds, et les liens qui les relient sont des liens d'une page à l'autre.)

    Google, bien sûr, utilise la technologie graphique et a inventé un moteur de traitement graphique appelé Pregel. algorithme. (Et oui, il y a un livre blanc sur Pregel.) Dans la communauté Hadoop, il y a un projet Apache appelé Giraph (basé sur le papier Pregel), un moteur de traitement graphique conçu pour traiter les graphiques stockés dans HDFS.

Les options de stockage et de traitement des données disponibles dans Hadoop sont dans de nombreux cas des implémentations des catégories NoSQL répertoriées ici. Cela vous aidera à mieux évaluer les solutions qui s'offrent à vous et à voir comment Hadoop peut compléter les entrepôts de données traditionnels.

Stockages de données noSQL par rapport à Hadoop - dummies

Le choix des éditeurs

Façons de perfectionner vos compétences scientifiques pour le test de sciences GED - mannequins

Façons de perfectionner vos compétences scientifiques pour le test de sciences GED - mannequins

Vous voulez pour vous assurer que vous êtes prêt quand vous allez passer le test GED Science. Lorsque vous passez le test, vous avez 90 minutes pour répondre à environ 50 questions dans les domaines scientifiques suivants: Domaine de contenu Pourcentage de questions Sciences de la vie 40% Sciences physiques (physique et chimie) 40% Terre et espace ...

À Quoi s'attendre de la section Raisonnement mathématique du GED - Les nuls

À Quoi s'attendre de la section Raisonnement mathématique du GED - Les nuls

Raisonnement mathématique section sur le GED teste les mathématiques que vous connaissez normalement à la fin de l'école secondaire. Parce que ce nouveau test est conçu pour vous préparer aux études postsecondaires et à l'emploi, il met l'accent sur les mathématiques en milieu de travail et les mathématiques scolaires. Environ 45% du test concerne un problème quantitatif ...

Conseils pour renforcer les phrases Wordy pour le GED RLA - dummies

Conseils pour renforcer les phrases Wordy pour le GED RLA - dummies

Un problème courant d'écriture sur le Raisonnement GED à travers le test d'arts du langage est des phrases verbeuses. La verbosité, dans l'esprit de la bonne écriture, est, selon les mots du grand poète, quelque chose que tout le monde devrait viser à éliminer pour que la précision de nos mots transparaisse et illumine le passage. Vous avez juste souffert à travers un ...

Le choix des éditeurs

Création d'un rapport avec Crystal Reports 10 - témoins

Création d'un rapport avec Crystal Reports 10 - témoins

Lorsque vous démarrez Crystal Reports 10, généralement l'une des trois choses suivantes: créer un rapport, modifier un rapport ou exécuter un rapport sur les données de votre base de données. Les rapports prennent des données à partir d'une base de données, les traitent, les formatent et les affichent ensuite sur une imprimante, un écran d'ordinateur ou un site Web. Crystal Reports ...

Traitant des commentaires Javadoc dans Eclipse - mannequins

Traitant des commentaires Javadoc dans Eclipse - mannequins

Lorsque vous utilisez Eclipse pour écrire du code Java, n'oubliez pas de éditez les commentaires de Javadoc (les choses qui commencent par / **). Vous pouvez ajouter des informations utiles lorsque vous modifiez les commentaires Javadoc et lorsque vous les modifiez, l'aide au code d'Eclipse propose des suggestions. N'oubliez pas ces astuces lorsque vous modifiez vos commentaires Javadoc: Ajouter un commentaire Javadoc: ...

Conversion de fichiers PDF, EPS ou Adobe Illustrator en éléments natifs QuarkXPress - mannequins

Conversion de fichiers PDF, EPS ou Adobe Illustrator en éléments natifs QuarkXPress - mannequins

Voici l'un des développements les plus excitants de QuarkXPress: Si vous avez déjà un document au format PDF, EPS ou Adobe Illustrator, QuarkXPress 2016 peut convertir tous ses objets en éléments natifs QuarkXPress en quelques secondes. Vous pouvez ensuite travailler avec ces éléments comme vous le pouvez avec d'autres éléments ...

Le choix des éditeurs

Traitement des bouffées de chaleur pendant la ménopause - les mannequins

Traitement des bouffées de chaleur pendant la ménopause - les mannequins

Souffrent souvent de bouffées de chaleur une vague intense de chaleur les surmonte. Suivez ces conseils pour réduire les bouffées de chaleur et leurs effets: Faites de l'exercice régulièrement. Seulement une femme sur 20 qui fait de l'exercice régulièrement éprouve des bouffées de chaleur. Parmi les femmes qui ne font pas d'exercice, une personne sur quatre éprouve des bouffées de chaleur. Allumez le ventilateur de plafond ou ...

Sexe For Dummies Cheat Sheet - les nuls

Sexe For Dummies Cheat Sheet - les nuls

Que vous vous considériez comme un Don Juan, une Lady Chatterly, ou un novice sexuel , tout le monde peut tirer le meilleur parti du sexe avec un peu plus de connaissances. Vous devriez savoir que les préliminaires sont quelque chose que vous devriez prendre en considération avec chaque interaction que vous et votre partenaire avez, ainsi que la façon de garder les choses ...

Mots et significations liés à la ménopause - mannequins

Mots et significations liés à la ménopause - mannequins

Bien que ce soit loin d'être une liste complète des termes que vous pourriez entendre être utilisé lorsque la ménopause est discutée, les cinq termes essentiels suivants devraient vous aider à comprendre les bases. HRT (hormonothérapie substitutive): Un traitement pour compléter les hormones que vous perdez pendant la ménopause - généralement une combinaison d'œstrogènes, ...