Accueil Finances personnelles Stockages de données noSQL par rapport à Hadoop - dummies

Stockages de données noSQL par rapport à Hadoop - dummies

Vidéo: Introduction aux bases de données NoSQL 2025

Vidéo: Introduction aux bases de données NoSQL 2025
Anonim

Les banques de données NoSQL souscrites à la notion "Just Say No to SQL" (pour paraphraser campagne de publicité anti-drogue dans les années 1980), et ils étaient une réaction aux limitations perçues des bases de données relationnelles (basées sur SQL). Ce n'est pas que ces gens détestaient SQL, mais ils étaient fatigués de forcer des chevilles carrées dans des trous ronds en résolvant des problèmes pour lesquels les bases de données relationnelles n'étaient pas conçues.

Une base de données relationnelle est un outil puissant, mais pour certains types de données (comme les paires clé-valeur ou graphiques) et certains modèles d'utilisation (comme le stockage à très grande échelle), une base de données relationnelle n'est pas disponible. t pratique. Et quand il s'agit de stockage à haut volume, la base de données relationnelle peut être coûteuse, à la fois en termes de coûts de licence de base de données et de coûts matériels. (Les bases de données relationnelles sont conçues pour fonctionner avec du matériel de niveau entreprise.)

Ainsi, avec le mouvement NoSQL, les programmeurs créatifs ont développé des dizaines de solutions pour différents types de problèmes de stockage et de traitement des données épineuses. Ces bases de données NoSQL fournissent généralement une évolutivité massive au moyen de la mise en cluster et sont souvent conçues pour permettre un haut débit et une faible latence.

Le nom NoSQL est quelque peu trompeur car beaucoup de bases de données qui correspondent à la catégorie ont le support SQL (plutôt que le support "NoSQL"). Pensez à son nom à la place "Non seulement SQL. "

Les offres NoSQL disponibles aujourd'hui peuvent être réparties en quatre catégories distinctes, en fonction de leur conception et de leur destination:

  • Stocks de valeur-clés: Cette offre permet de stocker n'importe quel type de données sans avoir à utiliser un schéma. Ceci est en contraste avec les bases de données relationnelles, où vous devez définir le schéma (la structure de la table) avant toute insertion de données. Étant donné que les magasins de valeurs-clés ne nécessitent pas de schéma, vous disposez d'une grande flexibilité pour stocker des données dans de nombreux formats.

    Dans une banque de valeurs-clés, une ligne se compose simplement d'une clé (un identificateur) et d'une valeur, qui peut aller d'une valeur entière à une grande chaîne de données binaires. De nombreuses implémentations de magasins de valeurs-clés sont basées sur le papier Dynamo d'Amazon.

  • Magasins de familles de colonnes: Vous trouverez ici des bases de données dans lesquelles les colonnes sont regroupées en familles de colonnes et stockées ensemble sur le disque.

    Strictement parlant, nombre de ces bases de données ne sont pas axées sur les colonnes, car elles sont basées sur l'article BigTable de Google, qui stocke les données sous forme de carte triée multidimensionnelle.

  • Magasins de documents: Cette offre repose sur des collections de documents de même format et encodés pour améliorer l'efficacité.Les magasins de documents permettent à des documents individuels d'une collection d'inclure uniquement un sous-ensemble de champs, de sorte que seules les données nécessaires sont stockées. Pour les ensembles de données clairsemés, où de nombreux champs ne sont souvent pas remplis, cela peut se traduire par des économies d'espace significatives.

    En revanche, les colonnes vides dans les tables de base de données relationnelles occupent de l'espace. Les magasins de documents permettent également la flexibilité du schéma, car seuls les champs nécessaires sont stockés et de nouveaux champs peuvent être ajoutés. Une fois de plus, contrairement aux bases de données relationnelles, les structures de table sont définies avant que les données ne soient stockées et la modification des colonnes est une tâche fastidieuse qui affecte l'intégralité de l'ensemble de données.

  • Bases de graphe: Ici vous avez des bases de données qui stockent des structures de graphe - des représentations qui montrent des collections d'entités (sommets ou nœuds) et leurs relations (arêtes) entre elles. Ces structures permettent aux bases de données graphiques d'être extrêmement bien adaptées au stockage de structures complexes, comme les relations de liaison entre toutes les pages Web connues. (Par exemple, les pages Web individuelles sont des nœuds, et les liens qui les relient sont des liens d'une page à l'autre.)

    Google, bien sûr, utilise la technologie graphique et a inventé un moteur de traitement graphique appelé Pregel. algorithme. (Et oui, il y a un livre blanc sur Pregel.) Dans la communauté Hadoop, il y a un projet Apache appelé Giraph (basé sur le papier Pregel), un moteur de traitement graphique conçu pour traiter les graphiques stockés dans HDFS.

Les options de stockage et de traitement des données disponibles dans Hadoop sont dans de nombreux cas des implémentations des catégories NoSQL répertoriées ici. Cela vous aidera à mieux évaluer les solutions qui s'offrent à vous et à voir comment Hadoop peut compléter les entrepôts de données traditionnels.

Stockages de données noSQL par rapport à Hadoop - dummies

Le choix des éditeurs

Principes de base du protocole de routage IP Multicast - dummies

Principes de base du protocole de routage IP Multicast - dummies

IP Le routage multicast est le routage du trafic multicast. La nature des données IP Multicast est telle qu'elle a ses propres problèmes de routage de réseau Cisco. Il existe quatre protocoles de multidiffusion principaux pris en charge par le Cisco IOS actuel. L'illustration vous montre approximativement où les protocoles sont utilisés; Ce qui suit est ...

Comment le protocole STP (Spanning Tree Protocol) gère les modifications du réseau - dummies

Comment le protocole STP (Spanning Tree Protocol) gère les modifications du réseau - dummies

Nouveau concentrateur ou passer à un réseau mappé STP (Spanning Tree Protocol)? Pour cet exemple, un concentrateur était connecté à un port sur les deux commutateurs 11: 99 et 77: 22. Un concentrateur était utilisé car il ne disposait pas d'une intelligence réseau. L'effet net est en fait le même que ...

Types de réseau local (LAN) - nuls

Types de réseau local (LAN) - nuls

Un WAN est un type de réseau local (LAN) . Un réseau local est un réseau privé généralement constitué d'une connexion réseau fiable, rapide et bien connectée. Les alternatives sur le framework LAN incluent CAN, MAN et WAN. Ces trois options de réseau sont illustrées ci-dessous: CAN Si vous utilisez le réseau LAN ...

Le choix des éditeurs

Bebo est l'application de médias sociaux pour vous? - les nuls

Bebo est l'application de médias sociaux pour vous? - les nuls

Comment savez-vous quel est le bon média social pour vous? La culture moderne devient de plus en plus dépendante des médias sociaux tels que Bebo, Facebook, Twitter et What'sApp, ainsi que de nombreux autres. Le questionnaire suivant vous aidera à déterminer si vous avez ou non ce qu'il faut pour être social sur le nouveau ...

Comment utiliser Bebo - dummies

Comment utiliser Bebo - dummies

Bebo, la nouvelle application des médias sociaux, est aussi facile à utiliser que C'est amusant à regarder. Vous pouvez obtenir cette nouvelle application sur Google Play Store et Apple App Store. Lancez Bebo et suivez les instructions à l'écran pour terminer le processus de création de compte. Après avoir téléchargé avec succès, ...

Le choix des éditeurs

Ce que vous pouvez trouver dans une barre latérale de blog - des mannequins

Ce que vous pouvez trouver dans une barre latérale de blog - des mannequins

La plupart des blogs contiennent du matériel de barre latérale. La plupart des blogs sont disposés en deux ou trois colonnes, et le contenu de la barre latérale apparaît généralement dans les deuxième et / ou troisième colonnes. Certains blogs n'ont pas de barres latérales, et sur d'autres blogs, vous pouvez découvrir des éléments supplémentaires au-delà de ce que vous voyez ici. Archives basées sur la date: Presque tous les blogs sont ...

Lorsqu'un réseau publicitaire est approprié pour votre blog maman - les mannequins

Lorsqu'un réseau publicitaire est approprié pour votre blog maman - les mannequins

Ne sont que quelques-unes modèles conflit en cours d'exécution des publicités avec vos meilleurs intérêts. C'est quand vous bloguez pour vendre vos propres produits ou pour promouvoir vos services professionnels. Même dans ce cas, il est toujours possible de diffuser des annonces sur ces blogs, surtout si les annonces font la promotion de produits et de services complémentaires et non concurrents. Mais si vous êtes ...

Quand maman blogue pour Swag is Okay - les mannequins

Quand maman blogue pour Swag is Okay - les mannequins

Dans certaines circonstances légitimes vous pouvez vous sentir travailler gratuitement vaut votre temps et la publicité que vous offrez à une marque. Cela peut être comparé à un stage non rémunéré. Si vous êtes stagiaire et que vous avez une excellente expérience de travail, alors c'est une entreprise précieuse. Si vous êtes stagiaire et que vous ne versez que du café et que vous livrez ...