Accueil Finances personnelles Mine Big Data avec Hive - les nuls

Mine Big Data avec Hive - les nuls

Vidéo: Formation Big Data avec Apache Spark: Initiation | L’écosystème du Big Data 2025

Vidéo: Formation Big Data avec Apache Spark: Initiation | L’écosystème du Big Data 2025
Anonim

Hive est une couche de stockage de données orientée par lots, basée sur les éléments de base de Hadoop (HDFS et MapReduce) et est très utile dans les grandes données. Il fournit aux utilisateurs qui connaissent SQL une implémentation SQL-Lite simple appelée HiveQL sans sacrifier l'accès via des mappeurs et des réducteurs. Avec Hive, vous pouvez obtenir le meilleur des deux mondes: un accès de type SQL à des données structurées et une analyse sophistiquée de Big Data avec MapReduce.

Contrairement à la plupart des entrepôts de données, Hive n'est pas conçu pour répondre rapidement aux requêtes. En fait, les requêtes peuvent prendre plusieurs minutes ou même plusieurs heures selon la complexité. En conséquence, Hive est mieux utilisé pour l'exploration de données et des analyses plus approfondies qui ne nécessitent pas de comportements en temps réel. Parce qu'il repose sur la fondation Hadoop, il est très extensible, évolutif et résilient, ce qui n'est pas le cas de l'entrepôt de données moyen.

Hive utilise trois mécanismes pour l'organisation des données:

  • Tables: Les tables Hive sont les mêmes que les tables RDBMS constituées de lignes et de colonnes. Étant donné que Hive est en couches sur Hadoop HDFS, les tables sont mappées aux répertoires du système de fichiers. En outre, Hive prend en charge les tables stockées dans d'autres systèmes de fichiers natifs.

  • Partitions: Une table Hive peut prendre en charge une ou plusieurs partitions. Ces partitions sont mappées aux sous-répertoires du système de fichiers sous-jacent et représentent la distribution des données dans la table. Par exemple, si une table est appelée autos, avec une valeur de clé 12345 et une valeur de fabricant Ford, le chemin de la partition sera / hivewh / autos / kv = 12345 / Ford.

  • Godets: À leur tour, les données peuvent être divisées en godets. Les buckets sont stockés en tant que fichiers dans le répertoire de partition du système de fichiers sous-jacent. Les compartiments sont basés sur le hachage d'une colonne dans la table. Dans l'exemple précédent, vous pourriez avoir un seau appelé Focus, contenant tous les attributs d'une voiture Ford Focus.

Les métadonnées Hive sont stockées en externe dans le métastore. "Le métastore est une base de données relationnelle contenant les descriptions détaillées du schéma Hive, y compris les types de colonnes, les propriétaires, les données de clé et de valeur, les statistiques de table, etc. Le métastore est capable de synchroniser les données de catalogue avec d'autres services de métadonnées de l'écosystème Hadoop.

Hive prend en charge un langage de type SQL appelé HiveQL. HiveQL prend en charge de nombreuses primitives SQL, telles que select, join, aggregate, union all, etc. Il prend également en charge les requêtes et les insertions multitables en partageant les données d'entrée dans une seule instruction HiveQL. HiveQL peut être étendu pour prendre en charge l'agrégation définie par l'utilisateur, la transformation de colonne et les scripts MapReduce incorporés.

Mine Big Data avec Hive - les nuls

Le choix des éditeurs

À Quoi s'attendre après l'examen PHR / SPHR - les nuls

À Quoi s'attendre après l'examen PHR / SPHR - les nuls

Félicitations. Vous avez cliqué sur le bouton d'arrivée et terminé l'expérience éprouvante de passer l'examen PHR ou SPHR. Cependant, avant que vous puissiez partir, vous avez quelques petites tâches à faire - le plus important étant de recevoir votre score. Voici ce que vous devez faire après avoir fini. Répondre à l'enquête Avant de découvrir comment vous ...

L'ABC de la journée d'examen PHR / SPHR - les nuls

L'ABC de la journée d'examen PHR / SPHR - les nuls

Quelques facteurs communs peuvent contribuer au succès PHR / SPHR jour de test, peu importe votre éducation ou votre expérience. Voici trois conseils importants qui peuvent vous aider à vous mettre dans le bon état d'esprit. Attitude: Croyez que vous pouvez réussir Effectuez une recherche sur Internet sur le terme «le pouvoir de la pensée positive» et vous pouvez ...

Utiliser l'analyse PEST pour interpréter les objectifs d'examen PHR / SPHR - les nuls

Utiliser l'analyse PEST pour interpréter les objectifs d'examen PHR / SPHR - les nuls

Que vous pouvez utiliser l'analyse PEST - les changements politiques, économiques, sociaux et technologiques - pour interpréter un objectif d'examen PHR / SPHR boueux dans le cadre de vos efforts d'étude. Les suggestions comprennent les besoins en RH tels que la toxicomanie, l'organisation syndicale et l'embauche d'anciens combattants. Le rôle des RH a continué d'évoluer parallèlement aux besoins des employeurs ...

Le choix des éditeurs

Ce qui fait une bonne application iOS - les nuls

Ce qui fait une bonne application iOS - les nuls

Vous utilisez le même kit de développement logiciel et une grande partie du même code pour développer des applications iPad, iPhone et iPod touch. L'iPad fonctionne avec le même système d'exploitation que l'iPhone et l'iPod touch. Cependant, l'iPad est un appareil plus grand avec plus de puissance et un affichage plus grand, comme le montre cette figure. Pour beaucoup ...

Que faire des interruptions de votre application iOS? Mannequins

Que faire des interruptions de votre application iOS? Mannequins

Sur un appareil iOS en cours d'exécution iOS 4. 2 ou versions plus récentes, divers événements autres que la résiliation peuvent interrompre votre application pour permettre à l'utilisateur de répondre - par exemple, des alertes de calendrier ou l'utilisateur en appuyant sur le bouton Veille / Réveil - et votre application passe à l'état inactif. Si l'utilisateur choisit d'ignorer une interruption, votre application ...

Quand utiliser Sous-classe dans iOS 6 Développement d'applications - les sous-clichés

Quand utiliser Sous-classe dans iOS 6 Développement d'applications - les sous-clichés

Vous permettent de personnaliser comportements pendant que vous développez votre application iOS. Gardez à l'esprit les points suivants concernant le sous-classement lorsque vous développez votre application: Au cours de la première étape, vous créez une nouvelle classe, appelée sous-classe, héritant des propriétés d'une autre classe (super). ...

Le choix des éditeurs

Transfert d'images numériques de votre appareil photo vers votre ordinateur Windows - mannequins

Transfert d'images numériques de votre appareil photo vers votre ordinateur Windows - mannequins

Vous pouvez facilement transférer des images votre appareil photo numérique à votre ordinateur. Ce transfert de caméra à ordinateur nécessite que vous ayez installé le pilote de votre caméra sur votre PC. Pour transférer des photos de votre appareil photo numérique ou de votre lecteur de cartes sur votre PC

Transfert de photos numériques de votre carte mémoire vers votre ordinateur avec un adaptateur de carte PC

Transfert de photos numériques de votre carte mémoire vers votre ordinateur avec un adaptateur de carte PC

De nombreux ordinateurs portables ont un emplacement pour connecter des périphériques PC Card (tels que des modems). Vous pouvez acheter un adaptateur pour vos cartes mémoire afin qu'elles s'adaptent à ces emplacements. Après avoir installé le logiciel d'une carte (suivez les instructions fournies avec votre carte), transférer des fichiers image sur votre ordinateur est un jeu d'enfant: