Accueil Finances personnelles Comment optimiser les tâches MapReduce - les nuls

Comment optimiser les tâches MapReduce - les nuls

Table des matières:

Vidéo: Hadoop Rack Awareness 2024

Vidéo: Hadoop Rack Awareness 2024
Anonim

Outre l'optimisation du code d'application réel avec MapReduce techniques d'optimisation pour améliorer la fiabilité et la performance. Ils appartiennent à trois catégories: topologie matérielle / réseau, synchronisation et système de fichiers.

Topologie matérielle / réseau Big Data

Indépendamment de l'application, le matériel et les réseaux les plus rapides généreront probablement les temps d'exécution les plus rapides pour votre logiciel. Un avantage distinct de MapReduce est la possibilité de fonctionner sur des grappes peu coûteuses de matériel de base et de réseaux standards. Si vous ne faites pas attention à l'organisation physique de vos serveurs, vous n'obtiendrez pas les meilleures performances et le haut degré de tolérance aux pannes nécessaires pour prendre en charge les tâches Big Data.

Le matériel de base est souvent stocké dans des racks dans le centre de données. La proximité du matériel dans le rack offre un avantage en termes de performances par rapport au déplacement des données et / ou du code d'un rack à un autre. Au cours de l'implémentation, vous pouvez configurer votre moteur MapReduce pour qu'il prenne conscience de cette proximité et en tire profit.

Conserver les données et le code ensemble est l'une des meilleures optimisations pour les performances de MapReduce. En fait, plus les éléments de traitement matériel sont proches l'un de l'autre, moins vous devrez faire face à la latence.

Synchronisation de Big Data

Comme il est inefficace de conserver tous les résultats de votre mapping dans le nœud, les mécanismes de synchronisation copient les résultats de mapping sur les nœuds réducteurs immédiatement après qu'ils ont été complétés. le traitement peut commencer tout de suite. Toutes les valeurs d'une même clé sont envoyées au même réducteur, garantissant à nouveau des performances supérieures et une meilleure efficacité.

Les sorties de réduction sont écrites directement dans le système de fichiers. Elles doivent donc être conçues et réglées pour de meilleurs résultats.

Système de fichiers Big Data

Votre implémentation MapReduce est supportée par un système de fichiers distribué. La principale différence entre les systèmes de fichiers locaux et distribués est la capacité. Pour gérer les énormes quantités d'informations dans un vaste monde de données, les systèmes de fichiers doivent être répartis sur plusieurs machines ou nœuds dans un réseau.

Les implémentations MapReduce reposent sur un style de distribution maître-esclave, où le nœud maître stocke toutes les métadonnées, les droits d'accès, le mappage et l'emplacement des fichiers et des blocs, etc. Les esclaves sont des nœuds où les données réelles sont stockées. Toutes les demandes vont au maître et sont ensuite traitées par le nœud esclave approprié.Lorsque vous envisagez la conception du système de fichiers, vous devez prendre en compte les éléments suivants:

  • Restez au chaud: Comme vous pouvez vous en douter, le nœud maître risque d'être surchargé car tout y commence. En outre, si le nœud maître échoue, tout le système de fichiers est inaccessible tant que le maître n'est pas restauré. Une optimisation très importante consiste à créer un nœud maître "warm standby" qui peut être mis en service si un problème survient avec le maître en ligne.

  • Le plus grand est le mieux: La taille du fichier est également un facteur important. Beaucoup de petits fichiers (moins de 100 Mo) doivent être évités. Les systèmes de fichiers distribués prenant en charge les moteurs MapReduce fonctionnent mieux lorsqu'ils sont remplis avec un nombre modeste de fichiers volumineux.

  • La vue longue: Comme les charges de travail sont gérées par lots, la bande passante réseau très soutenue est plus importante que les temps d'exécution rapides des mappeurs ou des réducteurs. L'approche optimale consiste pour le code à diffuser beaucoup de données lors de la lecture et à nouveau lorsqu'il est temps d'écrire dans le système de fichiers.

  • Gardez-le en sécurité: Mais pas trop. L'ajout de couches de sécurité sur le système de fichiers distribué dégradera ses performances. Les autorisations de fichiers sont là pour se prémunir contre les conséquences inattendues, pas un comportement malveillant. La meilleure approche consiste à s'assurer que seuls les utilisateurs autorisés ont accès à l'environnement du centre de données et à protéger le système de fichiers distribué de l'extérieur.

Comment optimiser les tâches MapReduce - les nuls

Le choix des éditeurs

Utilisant le mode rafale: La photographie d'action des mannequins

Utilisant le mode rafale: La photographie d'action des mannequins

Canon EOS Rebel T1i / 500D nécessite un vitesse d'obturation rapide - et un doigt de déclenchement rapide. Heureusement, le Canon EOS Digital Rebel a un mode Drive (ou Burst), qui enregistre une série continue d'images tant que vous maintenez le bouton de l'obturateur enfoncé. Si vous voulez obtenir de superbes photos d'un sujet en mouvement rapide, le mode Drive ...

En utilisant le mode en direct (détection de visage) sur votre Canon EOS Rebel T6 / 1300

En utilisant le mode en direct (détection de visage) sur votre Canon EOS Rebel T6 / 1300

Lorsque vous activez ce mode, le Rebel T6 recherche les visages dans le cadre. Vous devrez peut-être appuyer brièvement sur le déclencheur pour réactiver l'appareil photo avant que la fonction de détection de visage ne s'enclenche. Si un visage est détecté, l'appareil photo affiche un cadre de mise au point sur le visage, comme indiqué sur ...

En utilisant les modes automatiques sur votre Canon EOS Rebel T3 / 1100D - mannequins

En utilisant les modes automatiques sur votre Canon EOS Rebel T3 / 1100D - mannequins

Pour le plus automatique de la photographie automatique, permettant aux personnes ayant une expérience minimale de capturer de belles images, réglez votre sélecteur de mode Canon EOS Rebel T3 / 1100D sur l'un des deux paramètres suivants: Auto complet: Le nom de ce mode, indiqué dans la figure suivante, indique que le l'appareil photo prend le contrôle total de toutes les expositions, luminosité, flash, ...

Le choix des éditeurs

5 Bons contrôles comptables qui minimisent le vol - les nuls

5 Bons contrôles comptables qui minimisent le vol - les nuls

Voici un résumé de cinq techniques puissantes pour minimiser les problèmes surgissez lorsque vous avez des personnes ayant des niveaux de compétence et de fiabilité différents qui travaillent avec vos données QuickBooks: Comparez régulièrement les inventaires physiques avec les enregistrements de comptabilité d'inventaire. Une des choses que vous pouvez faire, à la fois pour minimiser vos pertes d'inventaire et ...

6 Astuces pour utiliser la stratégie avec QuickBooks - les nuls

6 Astuces pour utiliser la stratégie avec QuickBooks - les nuls

Si vous utilisez QuickBooks pour vous aider à mettre en place une stratégie pratique, il y a quelques choses que vous pourriez vouloir considérer. Assurez-vous de bien comprendre ces points clés: Connaissez les trois stratégies. Habituellement, une entreprise ne peut avoir qu'une stratégie commerciale sur trois: Stratégie basée sur les coûts Stratégie basée sur la différenciation Stratégie axée sur les objectifs Choisissez une stratégie. ...

5 Astuces pour simplifier l'installation de QuickBooks 2014 - les nuls

5 Astuces pour simplifier l'installation de QuickBooks 2014 - les nuls

Si vous êtes une petite entreprise configurant QuickBooks Logiciel de comptabilité 2014, vous apprécierez ces cinq conseils utiles. Minimisez le processus d'installation de QuickBooks avec ces astuces et techniques, et vous obtiendrez une conclusion rapide et réussie. Astuce # 1 de QuickBooks: Convertir en QuickBooks à compter du 1er janvier Convertir en un nouveau système de comptabilité dès le début ...

Le choix des éditeurs

Logique Puzzles pour garder votre esprit net - les mannequins

Logique Puzzles pour garder votre esprit net - les mannequins

Mettent votre casse-tête pour résoudre ces énigmes logiques! Chacun a juste une réponse. Les niveaux sont faciles, délicats, durs et traîtres, «facile» étant (bien sûr) les puzzles les plus faciles, et «traître» étant les plus difficiles. Facile: Combien de fois un mathématicien peut-il soustraire dix de 100? Facile: Déchiffrez cet indice: YYYMEN Tricky: Une femme ...

Maintien de la stabilité de l'humeur dans les troubles bipolaires - mannequins

Maintien de la stabilité de l'humeur dans les troubles bipolaires - mannequins

Plan thérapeutique global qu'une personne atteinte de trouble bipolaire doit suivre et maintenir la stabilité de l'humeur est assez simple. Suivez ce plan de traitement: Prenez vos médicaments tels que prescrits, même lorsque vous vous sentez bien, et consultez votre médecin avant de faire des changements de médicaments. Établir des routines qui assurent un horaire régulier de veille-sommeil. Manque de qualité ...

Faire un pré-accord pour recevoir un traitement pour trouble bipolaire - les variables nominales

Faire un pré-accord pour recevoir un traitement pour trouble bipolaire - les variables nominales

En pleine Manie ou dépression, une personne peut ne pas penser assez clairement pour se faire soigner et peut même refuser le traitement nécessaire. Les êtres chers veulent faire ce qu'il y a de mieux, mais ils hésitent souvent, ne sachant pas quand intervenir et quoi faire. Devraient-ils appeler votre médecin ou votre thérapeute ou vous conduire?