Accueil Finances personnelles Dans le compactage HBase - nuls

Dans le compactage HBase - nuls

Vidéo: HBase CreateTable and Insert data on Ubuntu 2025

Vidéo: HBase CreateTable and Insert data on Ubuntu 2025
Anonim

Compaction , le processus par lequel HBase nettoie après lui-même, vient en deux saveurs: majeur et mineur. Les compactions majeures peuvent être un gros problème, mais vous devez d'abord comprendre les compactages mineurs.

Les compactions mineures combinent un nombre configurable de HFiles plus petits en un HFile plus grand. Vous pouvez régler le nombre de HFiles à compacter et la fréquence d'un compactage mineur. Les compactions mineures sont importantes car sans elles, la lecture d'une ligne particulière peut nécessiter de nombreuses lectures de disque et entraîner des performances globales lentes.

La figure, qui illustre le fonctionnement de ce concept, peut vous aider à visualiser comment le tableau suivant peut être conservé sur le système HDFS.

Vue logique des informations de contact client dans HBase

Clé de ligne Famille de colonnes: {Qualificateur de colonne: Version: Valeur}
00001 CustomerName: {'FN':

1383859182496: ' John ',

' LN ': 1383859182858:' Smith ',

' MN ': 1383859183001:' Timothée ',

' MN ': 1383859182915:' T '}

ContactInfo: {' EA ':

1383859183030:' John. Smith @ xyz. com ',

' SA ': 1383859183073:' 1 Hadoop Lane, NY

11111 '}

00002 NomClientèle: {' FN ':

1383859183103:' Jane ',

'LN': 1383859183163: 'Doe',

ContactInfo: {

'SA': 1383859185577: '7 HBase Ave, CA

22222'}

Notez comment la famille de colonnes CustomerName a été écrite dans HDFS avec deux vidages MemStore et comment les données de la famille de colonnes ContactInfo ont été conservées sur le disque avec un seul vidage MemStore. Cet exemple est hypothétique, mais c'est un scénario probable en fonction du timing des écritures.

Imaginez une société de services qui acquiert de plus en plus d'informations de contact client au fil du temps. La société de services peut connaître le nom et le prénom de son client mais ne pas connaître son deuxième prénom avant des heures ou des semaines plus tard dans les demandes de service ultérieures. Ce scénario entraînerait la persistance de parties de la ligne 00001 vers le système HDFS dans différents fichiers HFiles.

Jusqu'à ce que le système HBase effectue un compactage mineur, la lecture de la ligne 00001 nécessiterait trois lectures de disque pour récupérer le contenu HFile approprié! Les compactions mineures cherchent à minimiser les frais généraux du système tout en gardant le nombre de HFiles sous contrôle. Les concepteurs de HBase ont pris soin de donner à l'administrateur HBase autant de contrôle que possible pour que tout impact sur le système soit mineur. "

Comme son nom l'indique, un compactage majeur est différent de la perspective d'un impact sur le système. Cependant, le compactage est très important pour la fonctionnalité globale du système HBase. Une compaction majeure cherche à combiner tous les HFiles en un seul grand fichier HFile.

De plus, un nettoyage majeur est effectué après qu'un utilisateur a supprimé un enregistrement. Lorsqu'un utilisateur émet un appel Delete, le système HBase place un marqueur dans la paire clé-valeur afin qu'il puisse être définitivement supprimé lors du prochain compactage majeur.

De plus, comme les compactions majeures combinent tous les HFiles en un fichier HFile volumineux, il est temps que le système revoie les versions des données et les compare à la propriété TTL (time to live). Les valeurs plus anciennes que le TTL sont purgées.

Temps de vie se réfère à la variable dans HBase que vous pouvez définir afin de définir combien de temps les données avec plusieurs versions resteront dans HBase.

Vous avez peut-être deviné qu'un compactage majeur affecte de manière significative le temps de réponse du système. Les utilisateurs qui tentent d'ajouter, de récupérer ou de manipuler des données dans le système lors d'un compactage majeur peuvent constater un temps de réponse du système médiocre.

De plus, le cluster HBase peut devoir diviser des régions en même temps qu'une compression majeure et équilibrera les régions de tous les serveurs RegionServers. Ce scénario entraînerait une quantité importante de trafic réseau entre les serveurs RegionServers.

Pour ces raisons, votre administrateur HBase doit disposer d'une stratégie de compression majeure pour votre déploiement.

Dans le compactage HBase - nuls

Le choix des éditeurs

Comment créer un en-tête ou un pied de page personnalisé dans Excel 2010 - dummies

Comment créer un en-tête ou un pied de page personnalisé dans Excel 2010 - dummies

Texte d'en-tête et de pied de page standard que vous pouvez sélectionner dans les menus déroulants, vous pouvez également créer un en-tête ou un pied de page personnalisé. En plus des éléments d'en-tête ou de pied de page typiques tels que le numéro de page, le nom de fichier et la date ou l'heure, vous pouvez insérer et mettre en forme une image. En outre, vous pouvez mettre en forme ...

Comment créer un en-tête ou un pied de page personnalisé dans Excel 2013 - dummies

Comment créer un en-tête ou un pied de page personnalisé dans Excel 2013 - dummies

Bien qu'Excel 2013 propose plusieurs en-têtes de stock et pieds de page, vous pouvez insérer des informations non disponibles ou dans un arrangement qu'Excel n'offre pas dans les en-têtes et pieds de page prêts à l'emploi. Pour ce faire, vous devez utiliser les boutons de commande qui apparaissent dans le groupe Éléments d'en-tête et de bas de page de l'onglet Conception de ...

Comment créer un nouveau dictionnaire personnalisé dans Excel 2007 - dummies

Comment créer un nouveau dictionnaire personnalisé dans Excel 2007 - dummies

Dans Excel 2007, vous pouvez créer des dictionnaires personnalisés à utiliser lors de la vérification orthographique de vos feuilles de calcul. Vous utilisez le bouton Ajouter au dictionnaire dans la boîte de dialogue Orthographe pour ajouter des mots inconnus à un dictionnaire personnel. Par défaut, Excel ajoute ces mots à un fichier de dictionnaire personnalisé nommé CUSTOM. DIC, mais vous pouvez créer un nouveau custom ...

Le choix des éditeurs

Conseils pour photographier un coucher de soleil Photo - mannequins

Conseils pour photographier un coucher de soleil Photo - mannequins

Le coucher de soleil vous donne la même lumière merveilleuse que le matin , seulement vous obtenez la lumière merveilleuse à la fin de la journée, puis le soleil plonge sous l'horizon et tous les nuages ​​dans la région sont baignés de teintes vertigineuses d'orange, de rose et de pourpre. Le lever et le coucher du soleil sont les proverbes ...

Utiliser le mode Live View - les mannequins

Utiliser le mode Live View - les mannequins

Live View est une fonction extrêmement utile sur votre appareil photo numérique. Lorsque vous utilisez l'affichage en direct, le miroir de la caméra se verrouille et vous voyez la scène sur votre écran LCD plutôt que dans le viseur. Cela vous donne une toile plus grande sur laquelle composer vos images. Lorsque vous photographiez en mode Live View, vous ...

Conseils pour une prise de vue photo Sunrise - mannequins

Conseils pour une prise de vue photo Sunrise - mannequins

Le lever du soleil est un moment glorieux pour la nature et la photographie de paysage. Vous capturez des images merveilleuses juste avant que le soleil se lève et comme il jette un coup d'oeil sur l'horizon, et aussi pendant une heure ou deux après le lever du soleil. Si vous faites votre travail en tant que photographe de la bonne façon, vous ne prenez pas une image - ...

Le choix des éditeurs

Utilisez Répétition dans votre blog - mannequins

Utilisez Répétition dans votre blog - mannequins

Dans la conception, répétition signifie utiliser les mêmes éléments ou des éléments similaires dans votre blog conception. Si vous étalez tous les éléments de votre conception de blog sur une table (virtuelle), vous voulez que toutes ces pièces semblent appartenir à un ensemble plus vaste. La répétition améliore la fluidité du design de votre blog en connectant différents designs ...

Utiliser Google Analytics pour consulter le trafic de référence de votre blog - le trafic de référence

Utiliser Google Analytics pour consulter le trafic de référence de votre blog - le trafic de référence

Est le trafic vous recevez qui vient de sites autres que les moteurs de recherche. Vous pourriez recevoir du trafic provenant de sites de médias sociaux comme Facebook, Twitter ou StumbleUpon. Ou vous pourriez recevoir du trafic d'autres blogs ou sites Web qui pointent vers vous. En regardant les endroits où votre trafic vient (et ne vient pas ...

Utiliser le serveur publicitaire OpenX OnRamp pour votre maman Blog - mannequins

Utiliser le serveur publicitaire OpenX OnRamp pour votre maman Blog - mannequins

Un serveur publicitaire est un logiciel Cela vous permettra de gérer toutes vos annonces d'un endroit, même si vous avez plus d'un blog. Il affiche les annonces, les fait pivoter, les cible et fournit des rapports de performances à vos clients publicitaires. OpenX a un produit gratuit appelé OpenX OnRamp quand vous arrivez à ...