Table des matières:
- Public Computing Cloud d'Amazon pour le Big Data
- Google Big Data Services
- Microsoft Azure pour le big data
- OpenStack pour le Big Data
Vidéo: How Amazon Uses Explosive-Resistant Devices To Transfer Data To AWS 2024
Les fournisseurs de cloud sont de toutes formes et de toutes tailles et proposent de nombreux produits pour le big data. Certains sont des noms familiers tandis que d'autres émergent récemment. Certains des fournisseurs de services cloud qui offrent des services IaaS pouvant être utilisés pour les mégadonnées incluent Amazon. com, AT & T, GoGrid, Joyent, Rackspace, IBM et Verizon / Terremark.
Public Computing Cloud d'Amazon pour le Big Data
Actuellement, l'un des fournisseurs de services IaaS les plus en vue est Amazon Web Services avec son Elastic Compute Cloud (Amazon EC2). Amazon n'a pas commencé avec une vision pour construire une grande entreprise de services d'infrastructure.
Au lieu de cela, l'entreprise a construit une infrastructure massive pour soutenir sa propre entreprise de vente au détail et a découvert que ses ressources étaient sous-utilisées. Au lieu de permettre à cet actif de rester inactif, il a décidé de tirer parti de cette ressource tout en augmentant la rentabilité. Le service EC2 d'Amazon a été lancé en 2006 et continue d'évoluer.
Amazon EC2 offre une évolutivité sous le contrôle de l'utilisateur, l'utilisateur payant les ressources à l'heure. L'utilisation du terme élastique dans la dénomination de l'EC2 d'Amazon est significative. Ici, l'élasticité fait référence à la capacité qu'ont les utilisateurs EC2 d'augmenter ou de diminuer les ressources d'infrastructure affectées à leurs besoins.
Amazon propose également d'autres services Big Data aux clients de son portefeuille Amazon Web Services. Ceux-ci sont les suivants:
-
Amazon Elastic MapReduce: Ciblé pour le traitement d'énormes volumes de données. Elastic MapReduce utilise un framework Hadoop hébergé fonctionnant sur EC2 et Amazon Simple Storage Service (Amazon S3). Les utilisateurs peuvent maintenant exécuter HBase.
-
Amazon DynamoDB: Un service de base de données SQL (NoSQL) entièrement géré. DynamoDB est un service de stockage de données à haute disponibilité, tolérant aux pannes, qui offre une évolutivité transparente et évolutive, ainsi qu'une administration simple. Il est implémenté sur les disques SSD (Solid State Disks) pour une plus grande fiabilité et de hautes performances.
-
Amazon Simple Storage Service (S3): Service Web conçu pour stocker n'importe quelle quantité de données. La force de son centre de conception est la performance et l'évolutivité, il n'est donc pas aussi chargé que les autres magasins de données. Les données sont stockées dans des «compartiments» et vous pouvez sélectionner une ou plusieurs régions globales pour le stockage physique afin de répondre aux besoins de latence ou de réglementation.
-
Amazon High Performance Computing: Adapté aux tâches spécialisées, ce service fournit des grappes de calcul hautes performances à faible latence. Le plus souvent utilisé par les scientifiques et les universitaires, HPC fait son entrée sur le marché en raison de l'offre d'Amazon et d'autres fournisseurs HPC.Les clusters Amazon HPC sont spécialement conçus pour des charges de travail spécifiques et peuvent être facilement reconfigurés pour de nouvelles tâches.
-
Amazon RedShift: Disponible en aperçu limité, RedShift est un service d'entreposage de données à l'échelle du pétaoctet, basé sur une architecture MPP évolutive. Géré par Amazon, il offre une alternative sécurisée et fiable aux entrepôts de données internes et est compatible avec plusieurs outils de veille économique populaires.
Google Big Data Services
Google, le géant de la recherche sur Internet, propose également un certain nombre de services de cloud ciblés pour le Big Data. Ces fonctionnalités sont les suivantes:
-
Google Compute Engine: Fonctionnalité cloud pour l'informatique sur les machines virtuelles, Google Compute Engine offre un environnement informatique sécurisé et flexible à partir de centres de données écoénergétiques. Google propose également des solutions de gestion de la charge de travail de plusieurs partenaires technologiques qui ont optimisé leurs produits pour Google Compute Engine.
-
Google Big Query: Vous permet d'exécuter des requêtes de type SQL à grande vitesse contre des ensembles de données volumineux comportant potentiellement des milliards de lignes. Bien qu'il soit bon pour l'interrogation des données, les données ne peuvent pas être modifiées après qu'elles y sont. Considérez Google Big Query comme un système de traitement analytique en ligne (OLAP) pour les mégadonnées. C'est bon pour les rapports ad hoc ou l'analyse exploratoire.
-
API Google Prediction: Outil d'apprentissage automatique basé sur le cloud pour de grandes quantités de données, Prediction est capable d'identifier les modèles dans les données, puis de les mémoriser. Il peut en apprendre plus sur un motif chaque fois qu'il est utilisé. Les modèles peuvent être analysés à diverses fins, y compris la détection de la fraude, l'analyse du taux de désabonnement et le sentiment du client.
Microsoft Azure pour le big data
Basé sur des abstractions Windows et SQL, Microsoft a produit un ensemble d'outils de développement, de support de machine virtuelle, de gestion et de services multimédias dans une offre PaaS. Pour les clients ayant une expertise approfondie dans. Net, SQLServer et Windows, l'adoption du PaaS basé sur Azure est simple.
Pour répondre aux nouvelles exigences en matière d'intégration de Big Data aux solutions Windows Azure, Microsoft a également ajouté Windows Azure HDInsight. Basé sur Hortonworks Data Platform (HDP), qui, selon Microsoft, offre une compatibilité à 100% avec Apache Hadoop, HDInsight prend en charge la connexion avec Microsoft Excel et d'autres outils de Business Intelligence (BI). En plus de Azure HDInsight peut également être déployé sur Windows Server.
OpenStack pour le Big Data
Lancé par Rackspace et la NASA, OpenStack est en train de mettre en place une plate-forme open-cloud destinée aux clouds publics ou privés. Tandis que l'organisation est étroitement gérée par Rackspace, elle est passée à une fondation OpenStack distincte. Bien que les entreprises puissent tirer parti d'OpenStack pour créer des implémentations propriétaires, la désignation OpenStack requiert la conformité à une implémentation standard des services.
L'objectif d'OpenStack est de fournir une spécification de nuage multitenant massivement mise à l'échelle pouvant s'exécuter sur n'importe quel matériel. OpenStack construit un vaste écosystème de partenaires intéressés par l'adoption de sa plate-forme cloud, y compris Dell, HP, Intel, Cisco, Red Hat et IBM, ainsi qu'au moins 100 autres qui utilisent OpenStack comme base pour leurs offres cloud.
En substance, OpenStack est une initiative IaaS open source basée sur Ubuntu, un système d'exploitation basé sur la distribution Linux Debian. Il peut également fonctionner sur la version Linux de Red Hat.
OpenStack offre une gamme de services, y compris le calcul, le stockage d'objets, le catalogue et le référentiel, le tableau de bord, l'identité et la mise en réseau. En termes de big data, Rackspace et Hortonworks (fournisseur d'une plate-forme open source de gestion de données basée sur Apache Hadoop) ont annoncé que Rackspace va lancer un service Hadoop OpenStack basé sur le cloud public, qui sera validé et soutenu par Hortonworks. pour créer rapidement un grand environnement de données.