L'importance de la virtualisation pour les Big Data - Les mannequins

La résolution de gros problèmes de données nécessite la gestion de grands volumes de stockage de données hautement distribués. et applications à forte intensité de données. La virtualisation fournit le niveau d'efficacité supplémentaire pour faire des plates-formes de Big Data une réalité. Bien que la virtualisation ne soit techniquement pas une exigence pour l'analyse de Big Data, les frameworks logiciels sont plus efficaces dans un environnement virtualisé.

La virtualisation a trois caractéristiques qui supportent l'évolutivité et l'efficacité opérationnelle requises pour les environnements Big Data:

Partitionnement: Dans la virtualisation, de nombreuses applications et systèmes d'exploitation sont pris en charge par un seul système physique. partitionner les ressources disponibles.
Isolation: Chaque machine virtuelle est isolée de son système physique hôte et d'autres machines virtualisées. En raison de cette isolation, si une instance virtuelle tombe en panne, les autres machines virtuelles et le système hôte ne sont pas affectés. De plus, les données ne sont pas partagées entre une instance virtuelle et une autre.
Encapsulation: Une machine virtuelle peut être représentée sous la forme d'un fichier unique, ce qui vous permet de l'identifier facilement en fonction des services qu'elle fournit.

Virtualisation de Big Data Server

Dans la virtualisation de serveur, un serveur physique est partitionné en plusieurs serveurs virtuels. Le matériel et les ressources d'une machine - y compris la mémoire vive (RAM), l'unité centrale, le disque dur et le contrôleur de réseau - peuvent être virtualisés en une série de machines virtuelles qui exécutent chacune leurs propres applications et systèmes d'exploitation.

Une machine virtuelle (VM) est une représentation logicielle d'une machine physique qui peut exécuter ou exécuter les mêmes fonctions que la machine physique. Une fine couche de logiciel est en fait insérée dans le matériel qui contient un moniteur de machine virtuelle, ou hyperviseur .

La virtualisation de serveur utilise l'hyperviseur pour fournir une efficacité dans l'utilisation des ressources physiques. Bien entendu, les tâches d'installation, de configuration et d'administration sont associées à la configuration de ces machines virtuelles.

La virtualisation des serveurs permet de garantir que votre plate-forme peut évoluer au besoin pour gérer les volumes importants et les types de données variés inclus dans votre analyse de Big Data. Vous ne connaissez peut-être pas l'ampleur du volume nécessaire avant de commencer votre analyse. Cette incertitude rend le besoin de virtualisation de serveur encore plus important, fournissant à votre environnement la capacité de répondre à la demande imprévue de traitement de très grands ensembles de données.

En outre, la virtualisation des serveurs constitue la base qui permet à de nombreux services cloud utilisés en tant que sources de données dans une analyse de grandes quantités de données. La virtualisation augmente l'efficacité du cloud, ce qui facilite l'optimisation de nombreux systèmes complexes.

Virtualisation de l'application Big Data

La virtualisation de l'infrastructure applicative offre un moyen efficace de gérer les applications en fonction de la demande des clients. L'application est encapsulée d'une manière qui supprime ses dépendances du système informatique physique sous-jacent. Cela contribue à améliorer la gestion globale et la portabilité de l'application.

En outre, le logiciel de virtualisation de l'infrastructure applicative permet généralement de codifier les règles d'utilisation techniques et commerciales afin de garantir que chacune de vos applications exploite les ressources physiques et virtuelles de manière prévisible. Des gains d'efficacité sont obtenus car vous pouvez plus facilement distribuer les ressources informatiques en fonction de la valeur commerciale relative de vos applications.

La virtualisation de l'infrastructure applicative associée à la virtualisation des serveurs peut contribuer à garantir le respect des accords de niveau de service métier. La virtualisation de serveur surveille l'utilisation du processeur et de la mémoire, mais ne tient pas compte des variations de la priorité métier lors de l'allocation des ressources.

Virtualisation de réseau de Big Data

La virtualisation de réseau constitue un moyen efficace d'utiliser le réseau comme un pool de ressources de connexion. Au lieu de s'appuyer sur le réseau physique pour gérer le trafic, vous pouvez créer plusieurs réseaux virtuels utilisant tous la même implémentation physique. Cela peut être utile si vous devez définir un réseau pour la collecte de données avec un certain ensemble de caractéristiques de performance et de capacité et un autre réseau pour des applications avec des performances et des capacités différentes.

La virtualisation du réseau permet de réduire ces goulots d'étranglement et d'améliorer la capacité à gérer les grandes données distribuées nécessaires à l'analyse des grandes quantités de données.

Processeur de Big Data et virtualisation de la mémoire

La virtualisation du processeur permet d'optimiser le processeur et de maximiser les performances. La virtualisation de la mémoire dissocie la mémoire des serveurs.

Dans l'analyse de données volumineuses, vous pouvez avoir des requêtes répétées de grands ensembles de données et la création d'algorithmes analytiques avancés, tous conçus pour rechercher des modèles et des tendances qui ne sont pas encore compris. Ces analyses avancées peuvent nécessiter beaucoup de puissance de traitement (CPU) et de mémoire (RAM). Pour certains de ces calculs, cela peut prendre beaucoup de temps sans ressources CPU et mémoire suffisantes.

Virtualisation du stockage de données volumineuses et du stockage

La virtualisation des données peut être utilisée pour créer une plate-forme pour les services de données dynamiques liés. Cela permet aux données d'être facilement recherchées et liées grâce à une source de référence unifiée. Par conséquent, la virtualisation des données fournit un service abstrait qui fournit des données sous une forme cohérente, quelle que soit la base de données physique sous-jacente. En outre, la virtualisation des données expose les données mises en cache à toutes les applications pour améliorer les performances.

La virtualisation du stockage combine les ressources de stockage physiques afin de les partager plus efficacement. Cela réduit le coût de stockage et facilite la gestion des magasins de données requis pour l'analyse de grandes quantités de données.