Accueil Finances personnelles Comparant Hadoop Distributions - les nuls

Comparant Hadoop Distributions - les nuls

Vidéo: Pig/Hive/Cascading. Le calcul "Batch" sur cluster Hadoop. 2024

Vidéo: Pig/Hive/Cascading. Le calcul "Batch" sur cluster Hadoop. 2024
Anonim

Vous trouverez que l'écosystème Hadoop comporte de nombreux composants, qui existent tous comme leurs propres projets Apache. Étant donné que Hadoop a considérablement évolué et qu'il est confronté à d'importants changements, les différentes versions de ces composants de la communauté open source peuvent ne pas être totalement compatibles avec les autres composants. Cela pose des difficultés considérables pour les personnes cherchant à obtenir un démarrage indépendant avec Hadoop en téléchargeant et compilant des projets directement à partir d'Apache.

Red Hat est, pour beaucoup de gens, le modèle de la façon de gagner de l'argent avec succès sur le marché des logiciels open source. Qu'est-ce que Red Hat a fait est de prendre Linux (un système d'exploitation open source), regrouper tous ses composants requis, construire un programme d'installation simple, et fournir un support payant à tous les clients.

De la même manière que Red Hat fournit un emballage pratique pour Linux, un certain nombre de sociétés ont intégré Hadoop et certaines technologies connexes dans leurs propres distributions Hadoop. Cette liste décrit les plus importants:

  • Cloudera : Cloudera est peut-être le joueur le plus connu dans le domaine et il est le principal architecte de Doug Cutting, le co-fondateur de Hadoop. Cloudera est considéré par beaucoup de personnes comme le leader du marché dans l'espace Hadoop car il a publié la première distribution Hadoop commerciale et est un contributeur très actif du code à l'écosystème Hadoop.

    Cloudera Enterprise, un produit positionné par Cloudera au centre de ce que l'on appelle le "Enterprise Data Hub", inclut la Distribution Cloudera pour Hadoop (CDH), une distribution open-source de Hadoop et de ses projets connexes. comme son propriétaire Cloudera Manager. Un abonnement au support technique pour les composants de base de CDH est également inclus.

    Le principal modèle commercial de Cloudera repose depuis longtemps sur sa capacité à tirer parti de sa distribution CDH populaire et à fournir des services et une assistance payants. À l'automne 2013, Cloudera a officiellement annoncé qu'elle se concentrait sur l'ajout de composants propriétaires exclusifs à valeur ajoutée à Hadoop open source pour agir comme un facteur de différenciation.

    De plus, Cloudera a pris l'habitude d'accélérer l'adoption des codes open source alpha et bêta pour les nouvelles versions de Hadoop. Son approche consiste à prendre en charge les composants qu'il considère comme matures et à les rééquiper dans les bibliothèques Open Source prêtes à la production qui sont incluses dans sa distribution.

  • EMC : Pivotal HD, la distribution Apache Hadoop d'EMC, intègre nativement la technologie de base de données de traitement massivement parallèle (MPP) d'EMC (anciennement connue sous le nom de Greenplum et maintenant HAWQ) avec Apache Hadoop.Le résultat est une distribution Hadoop haute performance avec un vrai traitement SQL pour Hadoop. Des requêtes SQL et d'autres outils de Business Intelligence peuvent être utilisés pour analyser les données stockées dans HDFS.

  • Hortonworks : un autre acteur majeur sur le marché Hadoop, Hortonworks possède le plus grand nombre de committers et de contributeurs de code pour les composants de l'écosystème Hadoop. (Les Committers sont les gardiens des projets Apache et ont le pouvoir d'approuver les changements de code.)

    Hortonworks est une spin-off de Yahoo!, qui était le moteur d'origine du projet Hadoop car il avait besoin d'une plate-forme à grande échelle pour soutenir son activité de moteur de recherche. De tous les fournisseurs de distribution Hadoop, Hortonworks est le plus engagé dans le mouvement open source, basé sur le volume de travail de développement qu'il contribue à la communauté et parce que tous ses efforts de développement sont (éventuellement) intégrés dans la base de code open source.

    Le modèle commercial de Hortonworks repose sur sa capacité à tirer parti de sa distribution HDP populaire et à fournir des services et un soutien rémunérés. Cependant, il ne vend pas de logiciels propriétaires. Au contraire, l'entreprise soutient avec enthousiasme l'idée de travailler au sein de la communauté open source pour développer des solutions répondant aux exigences des fonctionnalités d'entreprise (par exemple, un traitement plus rapide des requêtes avec Hive).

    Hortonworks a noué de nombreuses relations avec des entreprises établies dans l'industrie de la gestion de données: Teradata, Microsoft, Informatica et SAS, par exemple. Bien que ces sociétés n'aient pas leurs propres offres Hadoop internes, elles collaborent avec Hortonworks pour fournir des solutions Hadoop intégrées avec leurs propres ensembles de produits.

    L'offre Hortonworks Hadoop est la plate-forme de données Hortonworks (HDP), qui inclut Hadoop ainsi que les outils et projets associés. Contrairement à Cloudera, Hortonworks ne publie que des versions HDP avec un code de production de la communauté open source.

  • IBM : Big Blue offre une gamme d'offres Hadoop, avec un accent sur la valeur ajoutée par rapport à la pile Hadoop open source.

  • Intel: Intel Distribution pour Apache Hadoop (distribution Intel) fournit un traitement distribué et une gestion des données pour les applications d'entreprise qui analysent les mégadonnées.

    Les principales caractéristiques comprennent d'excellentes performances avec des optimisations pour les processeurs Intel Xeon, le stockage SSD Intel et la mise en réseau Intel 10GbE; la sécurité des données via le cryptage et le décryptage dans HDFS, et le contrôle d'accès basé sur les rôles avec une granularité au niveau des cellules dans HBase; amélioration des performances des requêtes Hive; prise en charge de l'analyse statistique avec un connecteur pour R, le progiciel statistique open source populaire; graphiques analytiques via Intel Graph Builder.

  • MapR : pour une distribution complète pour Apache Hadoop et les projets connexes indépendants de Apache Software Foundation, ne cherchez pas plus loin que MapR. Bénéficiant de l'absence de dépendances Java ou de dépendance au système de fichiers Linux, MapR est promue comme la seule distribution Hadoop offrant une protection complète des données, aucun point de défaillance unique et des avantages significatifs en termes de facilité d'utilisation.

    Trois éditions MapR sont disponibles: M3, M5 et M7. L'édition M3 est gratuite et disponible pour une utilisation illimitée en production. MapR M5 est une offre logicielle d'abonnement de niveau intermédiaire; et MapR M7 est une distribution complète pour Apache Hadoop et HBase qui comprend Pig, Hive, Sqoop, et bien plus encore.

Comparant Hadoop Distributions - les nuls

Le choix des éditeurs

Utilisant le mode rafale: La photographie d'action des mannequins

Utilisant le mode rafale: La photographie d'action des mannequins

Canon EOS Rebel T1i / 500D nécessite un vitesse d'obturation rapide - et un doigt de déclenchement rapide. Heureusement, le Canon EOS Digital Rebel a un mode Drive (ou Burst), qui enregistre une série continue d'images tant que vous maintenez le bouton de l'obturateur enfoncé. Si vous voulez obtenir de superbes photos d'un sujet en mouvement rapide, le mode Drive ...

En utilisant le mode en direct (détection de visage) sur votre Canon EOS Rebel T6 / 1300

En utilisant le mode en direct (détection de visage) sur votre Canon EOS Rebel T6 / 1300

Lorsque vous activez ce mode, le Rebel T6 recherche les visages dans le cadre. Vous devrez peut-être appuyer brièvement sur le déclencheur pour réactiver l'appareil photo avant que la fonction de détection de visage ne s'enclenche. Si un visage est détecté, l'appareil photo affiche un cadre de mise au point sur le visage, comme indiqué sur ...

En utilisant les modes automatiques sur votre Canon EOS Rebel T3 / 1100D - mannequins

En utilisant les modes automatiques sur votre Canon EOS Rebel T3 / 1100D - mannequins

Pour le plus automatique de la photographie automatique, permettant aux personnes ayant une expérience minimale de capturer de belles images, réglez votre sélecteur de mode Canon EOS Rebel T3 / 1100D sur l'un des deux paramètres suivants: Auto complet: Le nom de ce mode, indiqué dans la figure suivante, indique que le l'appareil photo prend le contrôle total de toutes les expositions, luminosité, flash, ...

Le choix des éditeurs

5 Bons contrôles comptables qui minimisent le vol - les nuls

5 Bons contrôles comptables qui minimisent le vol - les nuls

Voici un résumé de cinq techniques puissantes pour minimiser les problèmes surgissez lorsque vous avez des personnes ayant des niveaux de compétence et de fiabilité différents qui travaillent avec vos données QuickBooks: Comparez régulièrement les inventaires physiques avec les enregistrements de comptabilité d'inventaire. Une des choses que vous pouvez faire, à la fois pour minimiser vos pertes d'inventaire et ...

6 Astuces pour utiliser la stratégie avec QuickBooks - les nuls

6 Astuces pour utiliser la stratégie avec QuickBooks - les nuls

Si vous utilisez QuickBooks pour vous aider à mettre en place une stratégie pratique, il y a quelques choses que vous pourriez vouloir considérer. Assurez-vous de bien comprendre ces points clés: Connaissez les trois stratégies. Habituellement, une entreprise ne peut avoir qu'une stratégie commerciale sur trois: Stratégie basée sur les coûts Stratégie basée sur la différenciation Stratégie axée sur les objectifs Choisissez une stratégie. ...

5 Astuces pour simplifier l'installation de QuickBooks 2014 - les nuls

5 Astuces pour simplifier l'installation de QuickBooks 2014 - les nuls

Si vous êtes une petite entreprise configurant QuickBooks Logiciel de comptabilité 2014, vous apprécierez ces cinq conseils utiles. Minimisez le processus d'installation de QuickBooks avec ces astuces et techniques, et vous obtiendrez une conclusion rapide et réussie. Astuce # 1 de QuickBooks: Convertir en QuickBooks à compter du 1er janvier Convertir en un nouveau système de comptabilité dès le début ...

Le choix des éditeurs

Logique Puzzles pour garder votre esprit net - les mannequins

Logique Puzzles pour garder votre esprit net - les mannequins

Mettent votre casse-tête pour résoudre ces énigmes logiques! Chacun a juste une réponse. Les niveaux sont faciles, délicats, durs et traîtres, «facile» étant (bien sûr) les puzzles les plus faciles, et «traître» étant les plus difficiles. Facile: Combien de fois un mathématicien peut-il soustraire dix de 100? Facile: Déchiffrez cet indice: YYYMEN Tricky: Une femme ...

Maintien de la stabilité de l'humeur dans les troubles bipolaires - mannequins

Maintien de la stabilité de l'humeur dans les troubles bipolaires - mannequins

Plan thérapeutique global qu'une personne atteinte de trouble bipolaire doit suivre et maintenir la stabilité de l'humeur est assez simple. Suivez ce plan de traitement: Prenez vos médicaments tels que prescrits, même lorsque vous vous sentez bien, et consultez votre médecin avant de faire des changements de médicaments. Établir des routines qui assurent un horaire régulier de veille-sommeil. Manque de qualité ...

Faire un pré-accord pour recevoir un traitement pour trouble bipolaire - les variables nominales

Faire un pré-accord pour recevoir un traitement pour trouble bipolaire - les variables nominales

En pleine Manie ou dépression, une personne peut ne pas penser assez clairement pour se faire soigner et peut même refuser le traitement nécessaire. Les êtres chers veulent faire ce qu'il y a de mieux, mais ils hésitent souvent, ne sachant pas quand intervenir et quoi faire. Devraient-ils appeler votre médecin ou votre thérapeute ou vous conduire?