Table des matières:
Vidéo: Hadoop Rack Awareness 2024
Un principe de base de Hadoop est la mise à l'échelle avec des nœuds esclaves supplémentaires pour répondre aux exigences croissantes de stockage et de traitement des données. Dans un modèle de mise à l'échelle, vous devez examiner attentivement la conception des clusters, car des dizaines, voire des centaines, de nœuds esclaves devront éventuellement être mis en rack, alimentés, mis en réseau et refroidis.
Facteurs de forme du serveur
L'un des premiers choix auxquels les architectes informatiques devront faire face lors de la conception d'un cluster Hadoop est de savoir lequel des deux facteurs de forme suivants utiliser pour les nœuds Hadoop:
-
Serveur lame: Conçu pour une densité maximale, vous pouvez entasser autant de ces bébés dans un seul rack que possible. Les serveurs lame s'emboîtent dans des boîtiers lames dotés de nombreux composants serveur standard, tels que le stockage dédié, la mise en réseau, l'alimentation et le refroidissement. Ces composants sont partagés entre les serveurs lame, ce qui signifie que chaque serveur lame individuel peut être beaucoup plus petit.
Les serveurs lames sont un choix attrayant en surface car vous pouvez prendre un rack standard et déployer entre 40 et 50 de ces serveurs lames. Le problème de l'utilisation de lames pour les déploiements Hadoop est qu'elles reposent sur certains composants partagés, ce qui n'est pas conforme à l'architecture Hadoop à partage nul, où chacun des nœuds esclaves est autonome et possède ses propres ressources dédiées.
Plus important encore, les lames ont peu de place pour le stockage local, souvent avec pas plus de deux ou trois baies de lecteur. Ceci est un non-démarreur pour Hadoop, car les nœuds esclaves ont besoin de beaucoup plus de capacité de stockage dédiée.
-
Serveur rack: Serveurs complets sans composants partagés et possibilité d'extension matérielle, les serveurs rack sont le véritable choix pour Hadoop car ils sont très autonomes. Un serveur rack configuré de manière appropriée pour être un nœud esclave Hadoop occupe généralement deux RU, vous pouvez donc en placer 20 dans un rack standard.
Coût de propriété
Lors du choix et de la conception d'un nœud esclave, vos considérations les plus importantes sont généralement les coûts initiaux d'achat et le volume de stockage. Cependant, le coût de propriété est également important. Cependant, il s'agit d'un exercice délicat d'équilibrage, car les choix affectant les coûts d'approvisionnement, la consommation d'énergie, le refroidissement, la performance matérielle et la densité sont souvent en opposition. Pour vous aider à faire les bons choix, voici quelques conseils (assez spécifiques):
-
Réservez des alimentations redondantes pour les nœuds maîtres. L'alimentation redondante des nœuds esclaves est excessive - une panne d'alimentation dans un nœud esclave n'affecterait pas fortement le cluster.Cependant, avoir des alimentations redondantes sur tous les nœuds esclaves augmenterait la consommation d'énergie et générerait plus de chaleur.
-
Choisissez des vitesses d'horloge médianes pour les processeurs de nœud esclave . Les processeurs avec des vitesses d'horloge plus élevées ne coûtent pas seulement plus cher mais consomment plus d'énergie et génèrent beaucoup plus de chaleur.
-
Choisissez des serveurs rack conçus pour Hadoop. Avec la popularité croissante de Hadoop, tous les principaux fournisseurs de matériel offrent maintenant des serveurs rack qui sont des nœuds esclaves idéaux, avec 12 à 20 baies de disques pour le stockage local.
Les serveurs rack conçus pour fonctionner en tant que nœuds esclaves Hadoop sont généralement trop volumineux pour prendre en charge un facteur de forme d'une RU, mais l'utilisation de deux RU peut entraîner un gaspillage d'espace. Pour une utilisation plus efficace de l'espace, certains fournisseurs de matériel ont libéré des serveurs rack qui entassent plusieurs nœuds esclaves dans un seul châssis.
À titre d'exemple, dans cette forme compressée, un rack standard peut contenir jusqu'à 27 nœuds esclaves (même avec des commutateurs de réseau), chaque nœud esclave pouvant accueillir 15 unités de disque pour HDFS. Le résultat de cet arrangement est une densité beaucoup plus élevée et une meilleure utilisation de l'espace dans le centre de données.