Vidéo: Comparison of PIG, HIVE and MAP REDUCE - Big Data Hadoop Course by TELCOMA Training 2024
Pour faire court, Hive fournit à Hadoop un pont vers le monde des SGBDR. et fournit un dialecte SQL connu sous le nom Hive Query Language (Hive Query Language), qui peut être utilisé pour effectuer des tâches de type SQL. C'est la grande nouvelle, mais Hive offre plus que ce que l'on peut imaginer, ou plus d'applications de cette nouvelle technologie que ce que vous pouvez présenter dans un terrain d'ascenseur standard.
Par exemple, Hive rend également possible le concept connu sous le nom d'augmentation d'entrepôt de données d'entreprise (EDW), un cas d'utilisation majeur pour Apache Hadoop, où les entrepôts de données sont configurés spécifiquement pour l'analyse et le reporting des données.
Maintenant, certains experts diront que Hadoop (avec Hive, HBase, Sqoop et ses copains assortis) peut remplacer l'EDW. Cependant, Apache Hadoop est une excellente addition à l'entreprise et peut augmenter et compléter les EDW existants. Hive, HBase et Sqoop permettent l'augmentation EDW. La technologie RDBMS / EDW est étroitement associée à la technologie d'extraction, de transformation et de chargement (ETL). Pour comprendre ce que fait ETL, il est utile de savoir que, dans de nombreux cas, les données ne peuvent pas être immédiatement chargées dans la base de données relationnelle: elles doivent d'abord être extraites de leur source native, transformées dans un format approprié et chargées dans le SGBDR. EDW.
Vous pouvez voir que Hive est un puissant outil ETL à part entière, avec le principal acteur dans ce domaine: Apache Pig. Là encore, les utilisateurs peuvent essayer de configurer Hive et Pig en tant que
les nouveaux outils ETL pour le centre de données. (Laissez-les essayer.)
Comme pour le débat sur EDW et Apache Hadoop, ces technologies Apache Hadoop ne remplacent pas
directement les outils ETL existants, mais sont plutôt de nouveaux outils ETL puissants. utilisé le cas échéant.Enfin, Apache Hive vous offre de puissants outils d'analyse, tous dans le cadre de HiveQL. Ces outils devraient sembler familiers aux professionnels de l'informatique qui comprennent comment utiliser SQL.