Accueil Finances personnelles Dans le compactage HBase - nuls

Dans le compactage HBase - nuls

Vidéo: HBase CreateTable and Insert data on Ubuntu 2025

Vidéo: HBase CreateTable and Insert data on Ubuntu 2025
Anonim

Compaction , le processus par lequel HBase nettoie après lui-même, vient en deux saveurs: majeur et mineur. Les compactions majeures peuvent être un gros problème, mais vous devez d'abord comprendre les compactages mineurs.

Les compactions mineures combinent un nombre configurable de HFiles plus petits en un HFile plus grand. Vous pouvez régler le nombre de HFiles à compacter et la fréquence d'un compactage mineur. Les compactions mineures sont importantes car sans elles, la lecture d'une ligne particulière peut nécessiter de nombreuses lectures de disque et entraîner des performances globales lentes.

La figure, qui illustre le fonctionnement de ce concept, peut vous aider à visualiser comment le tableau suivant peut être conservé sur le système HDFS.

Vue logique des informations de contact client dans HBase

Clé de ligne Famille de colonnes: {Qualificateur de colonne: Version: Valeur}
00001 CustomerName: {'FN':

1383859182496: ' John ',

' LN ': 1383859182858:' Smith ',

' MN ': 1383859183001:' Timothée ',

' MN ': 1383859182915:' T '}

ContactInfo: {' EA ':

1383859183030:' John. Smith @ xyz. com ',

' SA ': 1383859183073:' 1 Hadoop Lane, NY

11111 '}

00002 NomClientèle: {' FN ':

1383859183103:' Jane ',

'LN': 1383859183163: 'Doe',

ContactInfo: {

'SA': 1383859185577: '7 HBase Ave, CA

22222'}

Notez comment la famille de colonnes CustomerName a été écrite dans HDFS avec deux vidages MemStore et comment les données de la famille de colonnes ContactInfo ont été conservées sur le disque avec un seul vidage MemStore. Cet exemple est hypothétique, mais c'est un scénario probable en fonction du timing des écritures.

Imaginez une société de services qui acquiert de plus en plus d'informations de contact client au fil du temps. La société de services peut connaître le nom et le prénom de son client mais ne pas connaître son deuxième prénom avant des heures ou des semaines plus tard dans les demandes de service ultérieures. Ce scénario entraînerait la persistance de parties de la ligne 00001 vers le système HDFS dans différents fichiers HFiles.

Jusqu'à ce que le système HBase effectue un compactage mineur, la lecture de la ligne 00001 nécessiterait trois lectures de disque pour récupérer le contenu HFile approprié! Les compactions mineures cherchent à minimiser les frais généraux du système tout en gardant le nombre de HFiles sous contrôle. Les concepteurs de HBase ont pris soin de donner à l'administrateur HBase autant de contrôle que possible pour que tout impact sur le système soit mineur. "

Comme son nom l'indique, un compactage majeur est différent de la perspective d'un impact sur le système. Cependant, le compactage est très important pour la fonctionnalité globale du système HBase. Une compaction majeure cherche à combiner tous les HFiles en un seul grand fichier HFile.

De plus, un nettoyage majeur est effectué après qu'un utilisateur a supprimé un enregistrement. Lorsqu'un utilisateur émet un appel Delete, le système HBase place un marqueur dans la paire clé-valeur afin qu'il puisse être définitivement supprimé lors du prochain compactage majeur.

De plus, comme les compactions majeures combinent tous les HFiles en un fichier HFile volumineux, il est temps que le système revoie les versions des données et les compare à la propriété TTL (time to live). Les valeurs plus anciennes que le TTL sont purgées.

Temps de vie se réfère à la variable dans HBase que vous pouvez définir afin de définir combien de temps les données avec plusieurs versions resteront dans HBase.

Vous avez peut-être deviné qu'un compactage majeur affecte de manière significative le temps de réponse du système. Les utilisateurs qui tentent d'ajouter, de récupérer ou de manipuler des données dans le système lors d'un compactage majeur peuvent constater un temps de réponse du système médiocre.

De plus, le cluster HBase peut devoir diviser des régions en même temps qu'une compression majeure et équilibrera les régions de tous les serveurs RegionServers. Ce scénario entraînerait une quantité importante de trafic réseau entre les serveurs RegionServers.

Pour ces raisons, votre administrateur HBase doit disposer d'une stratégie de compression majeure pour votre déploiement.

Dans le compactage HBase - nuls

Le choix des éditeurs

Comment créer et éditer des tableaux dans AutoCAD 2014 - mannequins

Comment créer et éditer des tableaux dans AutoCAD 2014 - mannequins

AutoCAD 2014 vous fournit avec bonheur la TABLE commande pour vos besoins de table. Après avoir créé un style de tableau approprié, l'ajout d'une table à un dessin est facile, avec la commande TABLE. Voici comment: Définir un courant de couche approprié. En supposant que vous laissez la couleur, le type de ligne et le poids de ligne définis sur ByLayer, le calque courant est ...

Comment créer et restaurer une vue nommée dans AutoCAD 2014 - les nuls

Comment créer et restaurer une vue nommée dans AutoCAD 2014 - les nuls

Si vous avez plusieurs fois Pour effectuer un zoom et effectuer un panoramique sur la même zone dans AutoCAD 2014, vous pouvez rapidement voir ce que vous voulez en utilisant une vue nommée. Après avoir nommé et enregistré une vue d'une zone particulière d'un dessin, vous pouvez revenir rapidement à cette zone en restaurant la vue. Vous utilisez ...

Comment créer un nouveau dessin à partir d'un dessin de modèle dans AutoCAD 2014 - les nuls

Comment créer un nouveau dessin à partir d'un dessin de modèle dans AutoCAD 2014 - les nuls

Lorsque vous démarrez dans l'espace de travail Drafting & Annotation ou dans l'ancien espace de travail AutoCAD Classic, AutoCAD 2014 crée un nouveau dessin vide configuré pour le dessin 2D. Selon l'endroit où vous vivez (votre pays, pas votre adresse postale!) Et le système de mesure dominant utilisé, AutoCAD basera ce nouveau dessin sur l'un des ...

Le choix des éditeurs

Automatiser les contrôles de sécurité du courrier électronique pour empêcher les piratages par courrier électronique - dummies

Automatiser les contrôles de sécurité du courrier électronique pour empêcher les piratages par courrier électronique - dummies

Le courrier électronique est un point d'entrée commun pour les attaques de piratage sur tous les types de systèmes - Windows, Linux, Unix - vous l'appelez. Vous pouvez implémenter les contre-mesures suivantes en tant que couche de sécurité supplémentaire pour vos systèmes de messagerie: Tarpitting: Tarpitting détecte les messages entrants destinés à des utilisateurs inconnus. Si votre serveur de messagerie prend en charge le tarpitting, il peut ...

ÉValue les vulnérabilités avec Hacks éthiques - mannequins

ÉValue les vulnérabilités avec Hacks éthiques - mannequins

Si vous trouvez des failles de sécurité potentielles, la prochaine étape consiste à confirmer vulnérabilités dans votre système ou votre réseau. Avant de tester, effectuez une recherche manuelle. Vous pouvez rechercher des babillards hackers, des sites Web et des bases de données de vulnérabilités, telles que: Common Vulnerabilities and Exposures Base de données de vulnérabilités US-CERT NIST National Vulnerability Database Ces sites répertorient les ...

Authentification des utilisateurs VPN Enterprise Mobile - Mannequins

Authentification des utilisateurs VPN Enterprise Mobile - Mannequins

Avant d'autoriser l'accès au réseau d'entreprise à partir de n'importe quel appareil mobile , vous devez d'abord identifier l'utilisateur. Un type de validation d'identité d'utilisateur est l'authentification. L'authentification de l'utilisateur est la validation qu'un utilisateur est vraiment ce qu'elle dit être. En d'autres termes, l'authentification de l'utilisateur prouve que la personne qui tente de se connecter à ...

Le choix des éditeurs

Pourquoi Word Knowledge est important pour ASVAB - mannequins

Pourquoi Word Knowledge est important pour ASVAB - mannequins

Mot La connaissance ne fait pas partie de l'ASVAB juste parce que l'armée aime utiliser de grands mots. C'est inclus parce que les mots représentent des idées, et plus vous comprenez de mots, plus vous pouvez comprendre d'idées (et mieux vous pouvez communiquer avec les autres). Un vocabulaire décent est essentiel dans l'armée si vous voulez ...

Comprendre le Big Four sur l'ASVAB: vos scores AFQT - les nuls

Comprendre le Big Four sur l'ASVAB: vos scores AFQT - les nuls

L'ASVAB pas de score global. Quand vous entendez quelqu'un dire: «J'ai un 80 sur mon ASVAB», cette personne parle du score du test de qualification des forces armées (AFQT), pas un score global ASVAB. Le score AFQT détermine si vous pouvez même vous enrôler dans l'armée, et seulement quatre des sous-tests ...