Accueil Finances personnelles Garder trace des blocs de données avec NameNode dans HDFS - mannequins

Garder trace des blocs de données avec NameNode dans HDFS - mannequins

Table des matières:

Vidéo: 【TUTO】Gérer ses sauvegardes sur PS4 2025

Vidéo: 【TUTO】Gérer ses sauvegardes sur PS4 2025
Anonim

Le NameNode fait office de carnet d'adresses pour Hadoop Distributed File System (HDFS) car il ne sait pas seuls les blocs constituent des fichiers individuels mais également où sont stockés chacun de ces blocs et leurs répliques. Lorsqu'un utilisateur stocke un fichier dans HDFS, le fichier est divisé en blocs de données et trois copies de ces blocs de données sont stockées dans des nœuds esclaves dans le cluster Hadoop.

C'est beaucoup de blocs de données à suivre. Comme vous pouvez vous y attendre, savoir où les corps sont enterrés fait du NameNode un composant d'importance critique dans un cluster Hadoop. Si le NameNode n'est pas disponible, les applications ne peuvent accéder à aucune donnée stockée dans HDFS.

Si vous regardez la figure suivante, vous pouvez voir le démon NameNode s'exécuter sur un serveur de noeud maître. Toutes les informations de mappage traitant des blocs de données et de leurs fichiers correspondants sont stockées dans un fichier nommé.

HDFS est un système de fichiers de journalisation, ce qui signifie que les modifications de données sont consignées dans un journal d'édition qui suit les événements depuis le dernier point de contrôle - dernière fois que le journal d'édition a été fusionné. Dans HDFS, le journal d'édition est conservé dans un fichier nommé stocké sur le NameNode.

Démarrage et fonctionnement de NameNode

Pour comprendre le fonctionnement de NameNode, il est utile de voir comment il démarre. Le but de NameNode étant d'informer les applications du nombre de blocs de données à traiter et de conserver l'emplacement exact où elles sont stockées, il a besoin de tous les emplacements de bloc et des mappages de bloc vers fichier disponibles dans RAM.

Voici les étapes que le NameNode prend. Pour charger toutes les informations dont le NameNode a besoin après son démarrage, voici ce qui se passe:

  1. Le NameNode charge le fichier en mémoire.

  2. Le NameNode charge le fichier et rejoue les modifications journalisées pour mettre à jour les métadonnées de bloc déjà en mémoire.

  3. Les démons DataNode envoient les rapports de bloc NameNode.

    Pour chaque nœud esclave, il y a un rapport de bloc qui liste tous les blocs de données qui y sont stockés et décrit la santé de chacun.

Une fois le processus de démarrage terminé, le noeud NameNode dispose d'une image complète de toutes les données stockées dans HDFS et est prêt à recevoir des demandes d'application des clients Hadoop.

Comme les fichiers de données sont ajoutés et supprimés en fonction des demandes des clients, les modifications sont écrites sur les volumes de disque du nœud esclave, les modifications sont répercutées dans les emplacements de bloc et les métadonnées stockées dans la mémoire de NameNode..

Pendant toute la durée de vie du cluster, les démons DataNode envoient les pulsations NameNode (un signal rapide) toutes les trois secondes, indiquant qu'ils sont actifs.(Cette valeur par défaut est configurable.) Toutes les six heures (à nouveau, une valeur par défaut configurable), les DataNodes envoient au NameNode un rapport de bloc décrivant les blocs de fichiers sur leurs nœuds. De cette façon, le NameNode a toujours une vue actuelle des ressources disponibles dans le cluster.

Ecriture de données

Pour créer de nouveaux fichiers dans HDFS, le processus suivant doit avoir lieu:

  1. Le client envoie une requête au NameNode pour créer un nouveau fichier.

    Le NameNode détermine le nombre de blocs nécessaires et le client obtient un bail pour créer ces nouveaux blocs de fichiers dans le cluster. Dans le cadre de ce bail, le client a une limite de temps pour terminer la tâche de création. (Cette limite de temps garantit que l'espace de stockage n'est pas utilisé par les applications client défaillantes.)

  2. Le client écrit ensuite les premières copies des blocs de fichiers sur les nœuds esclaves à l'aide du bail attribué par NameNode.

    Le NameNode gère les demandes d'écriture et détermine où les blocs de fichiers et leurs répliques doivent être écrits, en équilibrant la disponibilité et les performances. La première copie d'un bloc de fichier est écrite dans un rack, et les deuxième et troisième copies sont écrites sur un rack différent de celui de la première copie, mais dans des nœuds esclaves différents dans le même rack. Cette disposition minimise le trafic réseau tout en garantissant qu'aucun bloc de données ne se trouve sur le même point de défaillance.

  3. Lorsque chaque bloc est écrit dans HDFS, un processus spécial écrit les répliques restantes sur les autres noeuds esclaves identifiés par NameNode.

  4. Une fois que les démons DataNode ont reconnu que les répliques de blocs de fichiers ont été créées, l'application cliente ferme le fichier et notifie le NameNode, qui ferme ensuite le bail ouvert.

Lecture de données

Pour lire des fichiers à partir de HDFS, le processus suivant doit avoir lieu:

  1. Le client envoie une requête au NameNode pour un fichier.

    Le NameNode détermine quels blocs sont impliqués et choisis, en fonction de la proximité globale des blocs entre eux et avec le client, le chemin d'accès le plus efficace.

  2. Le client accède alors aux blocs en utilisant les adresses données par NameNode.

Équilibrage des données dans le cluster Hadoop

Au fil du temps, avec des combinaisons de modèles d'intégration de données inégaux (où certains nœuds esclaves peuvent recevoir davantage de données) ou de défaillances de nœuds, les données risquent de se répartir inégalement entre les racks et des nœuds esclaves dans votre cluster Hadoop.

Cette distribution inégale peut avoir un impact négatif sur les performances car la demande sur les nœuds esclaves individuels sera déséquilibrée; les nœuds avec peu de données ne seront pas entièrement utilisés; et les nœuds avec beaucoup de blocs seront surutilisés. ( Note: La surutilisation et la sous-utilisation sont basées sur l'activité du disque, pas sur CPU ou RAM.)

HDFS inclut un utilitaire d'équilibrage pour redistribuer les blocs des nœuds esclaves surutilisés aux nœuds sous-utilisés tout en conservant la politique blocs sur différents noeuds et racks esclaves. Les administrateurs Hadoop doivent vérifier régulièrement l'intégrité de HDFS et, si les données sont distribuées de manière inégale, ils doivent appeler l'utilitaire d'équilibrage.

Conception du serveur maître NameNode

En raison de sa nature critique, le serveur maître exécutant le démon NameNode nécessite des exigences matérielles nettement différentes de celles d'un nœud esclave. Plus important encore, les composants au niveau de l'entreprise doivent être utilisés pour minimiser la probabilité d'une panne. En outre, vous aurez besoin de suffisamment de RAM pour charger en mémoire toutes les métadonnées et les données de localisation de tous les blocs de données stockés dans HDFS.

Garder trace des blocs de données avec NameNode dans HDFS - mannequins

Le choix des éditeurs

Façons de perfectionner vos compétences scientifiques pour le test de sciences GED - mannequins

Façons de perfectionner vos compétences scientifiques pour le test de sciences GED - mannequins

Vous voulez pour vous assurer que vous êtes prêt quand vous allez passer le test GED Science. Lorsque vous passez le test, vous avez 90 minutes pour répondre à environ 50 questions dans les domaines scientifiques suivants: Domaine de contenu Pourcentage de questions Sciences de la vie 40% Sciences physiques (physique et chimie) 40% Terre et espace ...

À Quoi s'attendre de la section Raisonnement mathématique du GED - Les nuls

À Quoi s'attendre de la section Raisonnement mathématique du GED - Les nuls

Raisonnement mathématique section sur le GED teste les mathématiques que vous connaissez normalement à la fin de l'école secondaire. Parce que ce nouveau test est conçu pour vous préparer aux études postsecondaires et à l'emploi, il met l'accent sur les mathématiques en milieu de travail et les mathématiques scolaires. Environ 45% du test concerne un problème quantitatif ...

Conseils pour renforcer les phrases Wordy pour le GED RLA - dummies

Conseils pour renforcer les phrases Wordy pour le GED RLA - dummies

Un problème courant d'écriture sur le Raisonnement GED à travers le test d'arts du langage est des phrases verbeuses. La verbosité, dans l'esprit de la bonne écriture, est, selon les mots du grand poète, quelque chose que tout le monde devrait viser à éliminer pour que la précision de nos mots transparaisse et illumine le passage. Vous avez juste souffert à travers un ...

Le choix des éditeurs

Création d'un rapport avec Crystal Reports 10 - témoins

Création d'un rapport avec Crystal Reports 10 - témoins

Lorsque vous démarrez Crystal Reports 10, généralement l'une des trois choses suivantes: créer un rapport, modifier un rapport ou exécuter un rapport sur les données de votre base de données. Les rapports prennent des données à partir d'une base de données, les traitent, les formatent et les affichent ensuite sur une imprimante, un écran d'ordinateur ou un site Web. Crystal Reports ...

Traitant des commentaires Javadoc dans Eclipse - mannequins

Traitant des commentaires Javadoc dans Eclipse - mannequins

Lorsque vous utilisez Eclipse pour écrire du code Java, n'oubliez pas de éditez les commentaires de Javadoc (les choses qui commencent par / **). Vous pouvez ajouter des informations utiles lorsque vous modifiez les commentaires Javadoc et lorsque vous les modifiez, l'aide au code d'Eclipse propose des suggestions. N'oubliez pas ces astuces lorsque vous modifiez vos commentaires Javadoc: Ajouter un commentaire Javadoc: ...

Conversion de fichiers PDF, EPS ou Adobe Illustrator en éléments natifs QuarkXPress - mannequins

Conversion de fichiers PDF, EPS ou Adobe Illustrator en éléments natifs QuarkXPress - mannequins

Voici l'un des développements les plus excitants de QuarkXPress: Si vous avez déjà un document au format PDF, EPS ou Adobe Illustrator, QuarkXPress 2016 peut convertir tous ses objets en éléments natifs QuarkXPress en quelques secondes. Vous pouvez ensuite travailler avec ces éléments comme vous le pouvez avec d'autres éléments ...

Le choix des éditeurs

Traitement des bouffées de chaleur pendant la ménopause - les mannequins

Traitement des bouffées de chaleur pendant la ménopause - les mannequins

Souffrent souvent de bouffées de chaleur une vague intense de chaleur les surmonte. Suivez ces conseils pour réduire les bouffées de chaleur et leurs effets: Faites de l'exercice régulièrement. Seulement une femme sur 20 qui fait de l'exercice régulièrement éprouve des bouffées de chaleur. Parmi les femmes qui ne font pas d'exercice, une personne sur quatre éprouve des bouffées de chaleur. Allumez le ventilateur de plafond ou ...

Sexe For Dummies Cheat Sheet - les nuls

Sexe For Dummies Cheat Sheet - les nuls

Que vous vous considériez comme un Don Juan, une Lady Chatterly, ou un novice sexuel , tout le monde peut tirer le meilleur parti du sexe avec un peu plus de connaissances. Vous devriez savoir que les préliminaires sont quelque chose que vous devriez prendre en considération avec chaque interaction que vous et votre partenaire avez, ainsi que la façon de garder les choses ...

Mots et significations liés à la ménopause - mannequins

Mots et significations liés à la ménopause - mannequins

Bien que ce soit loin d'être une liste complète des termes que vous pourriez entendre être utilisé lorsque la ménopause est discutée, les cinq termes essentiels suivants devraient vous aider à comprendre les bases. HRT (hormonothérapie substitutive): Un traitement pour compléter les hormones que vous perdez pendant la ménopause - généralement une combinaison d'œstrogènes, ...