Accueil Finances personnelles Mine Big Data avec Hive - les nuls

Mine Big Data avec Hive - les nuls

Vidéo: Formation Big Data avec Apache Spark: Initiation | L’écosystème du Big Data 2024

Vidéo: Formation Big Data avec Apache Spark: Initiation | L’écosystème du Big Data 2024
Anonim

Hive est une couche de stockage de données orientée par lots, basée sur les éléments de base de Hadoop (HDFS et MapReduce) et est très utile dans les grandes données. Il fournit aux utilisateurs qui connaissent SQL une implémentation SQL-Lite simple appelée HiveQL sans sacrifier l'accès via des mappeurs et des réducteurs. Avec Hive, vous pouvez obtenir le meilleur des deux mondes: un accès de type SQL à des données structurées et une analyse sophistiquée de Big Data avec MapReduce.

Contrairement à la plupart des entrepôts de données, Hive n'est pas conçu pour répondre rapidement aux requêtes. En fait, les requêtes peuvent prendre plusieurs minutes ou même plusieurs heures selon la complexité. En conséquence, Hive est mieux utilisé pour l'exploration de données et des analyses plus approfondies qui ne nécessitent pas de comportements en temps réel. Parce qu'il repose sur la fondation Hadoop, il est très extensible, évolutif et résilient, ce qui n'est pas le cas de l'entrepôt de données moyen.

Hive utilise trois mécanismes pour l'organisation des données:

  • Tables: Les tables Hive sont les mêmes que les tables RDBMS constituées de lignes et de colonnes. Étant donné que Hive est en couches sur Hadoop HDFS, les tables sont mappées aux répertoires du système de fichiers. En outre, Hive prend en charge les tables stockées dans d'autres systèmes de fichiers natifs.

  • Partitions: Une table Hive peut prendre en charge une ou plusieurs partitions. Ces partitions sont mappées aux sous-répertoires du système de fichiers sous-jacent et représentent la distribution des données dans la table. Par exemple, si une table est appelée autos, avec une valeur de clé 12345 et une valeur de fabricant Ford, le chemin de la partition sera / hivewh / autos / kv = 12345 / Ford.

  • Godets: À leur tour, les données peuvent être divisées en godets. Les buckets sont stockés en tant que fichiers dans le répertoire de partition du système de fichiers sous-jacent. Les compartiments sont basés sur le hachage d'une colonne dans la table. Dans l'exemple précédent, vous pourriez avoir un seau appelé Focus, contenant tous les attributs d'une voiture Ford Focus.

Les métadonnées Hive sont stockées en externe dans le métastore. "Le métastore est une base de données relationnelle contenant les descriptions détaillées du schéma Hive, y compris les types de colonnes, les propriétaires, les données de clé et de valeur, les statistiques de table, etc. Le métastore est capable de synchroniser les données de catalogue avec d'autres services de métadonnées de l'écosystème Hadoop.

Hive prend en charge un langage de type SQL appelé HiveQL. HiveQL prend en charge de nombreuses primitives SQL, telles que select, join, aggregate, union all, etc. Il prend également en charge les requêtes et les insertions multitables en partageant les données d'entrée dans une seule instruction HiveQL. HiveQL peut être étendu pour prendre en charge l'agrégation définie par l'utilisateur, la transformation de colonne et les scripts MapReduce incorporés.

Mine Big Data avec Hive - les nuls

Le choix des éditeurs

Utilisant le mode rafale: La photographie d'action des mannequins

Utilisant le mode rafale: La photographie d'action des mannequins

Canon EOS Rebel T1i / 500D nécessite un vitesse d'obturation rapide - et un doigt de déclenchement rapide. Heureusement, le Canon EOS Digital Rebel a un mode Drive (ou Burst), qui enregistre une série continue d'images tant que vous maintenez le bouton de l'obturateur enfoncé. Si vous voulez obtenir de superbes photos d'un sujet en mouvement rapide, le mode Drive ...

En utilisant le mode en direct (détection de visage) sur votre Canon EOS Rebel T6 / 1300

En utilisant le mode en direct (détection de visage) sur votre Canon EOS Rebel T6 / 1300

Lorsque vous activez ce mode, le Rebel T6 recherche les visages dans le cadre. Vous devrez peut-être appuyer brièvement sur le déclencheur pour réactiver l'appareil photo avant que la fonction de détection de visage ne s'enclenche. Si un visage est détecté, l'appareil photo affiche un cadre de mise au point sur le visage, comme indiqué sur ...

En utilisant les modes automatiques sur votre Canon EOS Rebel T3 / 1100D - mannequins

En utilisant les modes automatiques sur votre Canon EOS Rebel T3 / 1100D - mannequins

Pour le plus automatique de la photographie automatique, permettant aux personnes ayant une expérience minimale de capturer de belles images, réglez votre sélecteur de mode Canon EOS Rebel T3 / 1100D sur l'un des deux paramètres suivants: Auto complet: Le nom de ce mode, indiqué dans la figure suivante, indique que le l'appareil photo prend le contrôle total de toutes les expositions, luminosité, flash, ...

Le choix des éditeurs

5 Bons contrôles comptables qui minimisent le vol - les nuls

5 Bons contrôles comptables qui minimisent le vol - les nuls

Voici un résumé de cinq techniques puissantes pour minimiser les problèmes surgissez lorsque vous avez des personnes ayant des niveaux de compétence et de fiabilité différents qui travaillent avec vos données QuickBooks: Comparez régulièrement les inventaires physiques avec les enregistrements de comptabilité d'inventaire. Une des choses que vous pouvez faire, à la fois pour minimiser vos pertes d'inventaire et ...

6 Astuces pour utiliser la stratégie avec QuickBooks - les nuls

6 Astuces pour utiliser la stratégie avec QuickBooks - les nuls

Si vous utilisez QuickBooks pour vous aider à mettre en place une stratégie pratique, il y a quelques choses que vous pourriez vouloir considérer. Assurez-vous de bien comprendre ces points clés: Connaissez les trois stratégies. Habituellement, une entreprise ne peut avoir qu'une stratégie commerciale sur trois: Stratégie basée sur les coûts Stratégie basée sur la différenciation Stratégie axée sur les objectifs Choisissez une stratégie. ...

5 Astuces pour simplifier l'installation de QuickBooks 2014 - les nuls

5 Astuces pour simplifier l'installation de QuickBooks 2014 - les nuls

Si vous êtes une petite entreprise configurant QuickBooks Logiciel de comptabilité 2014, vous apprécierez ces cinq conseils utiles. Minimisez le processus d'installation de QuickBooks avec ces astuces et techniques, et vous obtiendrez une conclusion rapide et réussie. Astuce # 1 de QuickBooks: Convertir en QuickBooks à compter du 1er janvier Convertir en un nouveau système de comptabilité dès le début ...

Le choix des éditeurs

Logique Puzzles pour garder votre esprit net - les mannequins

Logique Puzzles pour garder votre esprit net - les mannequins

Mettent votre casse-tête pour résoudre ces énigmes logiques! Chacun a juste une réponse. Les niveaux sont faciles, délicats, durs et traîtres, «facile» étant (bien sûr) les puzzles les plus faciles, et «traître» étant les plus difficiles. Facile: Combien de fois un mathématicien peut-il soustraire dix de 100? Facile: Déchiffrez cet indice: YYYMEN Tricky: Une femme ...

Maintien de la stabilité de l'humeur dans les troubles bipolaires - mannequins

Maintien de la stabilité de l'humeur dans les troubles bipolaires - mannequins

Plan thérapeutique global qu'une personne atteinte de trouble bipolaire doit suivre et maintenir la stabilité de l'humeur est assez simple. Suivez ce plan de traitement: Prenez vos médicaments tels que prescrits, même lorsque vous vous sentez bien, et consultez votre médecin avant de faire des changements de médicaments. Établir des routines qui assurent un horaire régulier de veille-sommeil. Manque de qualité ...

Faire un pré-accord pour recevoir un traitement pour trouble bipolaire - les variables nominales

Faire un pré-accord pour recevoir un traitement pour trouble bipolaire - les variables nominales

En pleine Manie ou dépression, une personne peut ne pas penser assez clairement pour se faire soigner et peut même refuser le traitement nécessaire. Les êtres chers veulent faire ce qu'il y a de mieux, mais ils hésitent souvent, ne sachant pas quand intervenir et quoi faire. Devraient-ils appeler votre médecin ou votre thérapeute ou vous conduire?