Accueil Finances personnelles Le flux d'applications Pig Latin dans Hadoop - les mannequins

Le flux d'applications Pig Latin dans Hadoop - les mannequins

Vidéo: ОТ АТЕИСТА К СВЯТОСТИ 2025

Vidéo: ОТ АТЕИСТА К СВЯТОСТИ 2025
Anonim

À la base, Pig Latin est un langage de flux de données , dans lequel vous définissez un flux de données et une série de transformations appliquées aux données. grâce à votre application. Ceci est en contraste avec un langage de flux de contrôle (comme C ou Java), où vous écrivez une série d'instructions.

Dans les langages de flux de contrôle, vous utilisez des constructions telles que les boucles et la logique conditionnelle (comme une instruction if). Vous ne trouverez pas de boucles et si les déclarations en latin Pig.

Si vous avez besoin de convaincre que travailler avec Pig est beaucoup plus facile que de devoir écrire des programmes Map and Reduce, commencez par jeter un oeil à la vraie syntaxe de Pig:

A = LOAD 'fichier_données. SMS';. B = GROUPE …; … C = FILTRE …;. DUMP B;. STOCKER C INTO 'Résultats';

Une partie du texte de cet exemple ressemble à l'anglais, n'est-ce pas? Pas trop effrayant, au moins à ce stade. En regardant chaque ligne à son tour, vous pouvez voir le flux de base d'un programme Pig. (Notez que ce code peut faire partie d'un script ou être émis sur le shell interactif appelé Grunt.)

  1. Load: Vous chargez d'abord (LOAD) les données que vous voulez manipuler.

    Comme dans un travail MapReduce classique, ces données sont stockées dans HDFS. Pour qu'un programme Pig accède aux données, vous devez d'abord indiquer à Pig quel fichier ou quels fichiers utiliser. Pour cette tâche, vous utilisez la commande LOAD 'data_file'.

    Ici, 'data_file' peut spécifier un fichier HDFS ou un répertoire. Si un répertoire est spécifié, tous les fichiers de ce répertoire sont chargés dans le programme.

    Si les données sont stockées dans un format de fichier qui n'est pas nativement accessible à Pig, vous pouvez éventuellement ajouter la fonction USING à l'instruction LOAD pour spécifier une fonction définie par l'utilisateur qui peut lire (et interpréter) les données.

  2. Transformation: vous exécutez les données à travers un ensemble de transformations qui, bien au-dessous du capuchon et loin de tout ce qui vous concerne, sont traduites en un ensemble de tâches Map et Reduce.

    La logique de transformation est l'endroit où toutes les manipulations de données ont lieu. Ici, vous pouvez FILTRER des lignes qui ne vous intéressent pas, JOINDRE deux ensembles de fichiers de données, des données GROUP pour construire des agrégations, ORDER des résultats, et faire beaucoup, beaucoup plus.

  3. Dump: Enfin, vous sauvegardez (DUMP) les résultats sur l'écran

    ou

    Store (STORE) les résultats dans un fichier quelque part.

    Vous utiliseriez généralement la commande DUMP pour envoyer la sortie à l'écran lorsque vous déboguez vos programmes. Lorsque votre programme passe en production, il vous suffit de remplacer l'appel DUMP par un appel STORE afin que les résultats de l'exécution de vos programmes soient stockés dans un fichier pour traitement ultérieur ou analyse.

Le flux d'applications Pig Latin dans Hadoop - les mannequins

Le choix des éditeurs

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Pour approfondir votre conscience consciente, vous devez pratiquer une méditation de pleine conscience sur une base quotidienne. Familiarisez-vous avec certaines des médiations suivantes. Avec le temps, vous deviendrez plus conscient de votre vie quotidienne. Body Meditation Meditation - Cette méditation implique de passer environ une demi-heure, en prenant conscience de ...

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Les Templiers sont presque aussi fictifs dans Dan Brown Le code Da Vinci comme les chevaliers Jedi sont dans Star Wars. Bien que le héros Robert Langdon hésite d'abord à élever les Templiers dans ses cours, parce que la mention même d'eux fait ressortir les amants du complot, Brown n'a aucun problème à les faire participer ...

Démystification des mythes communs sur la franc-maçonnerie - mannequins

Démystification des mythes communs sur la franc-maçonnerie - mannequins

La franc-maçonnerie moderne existe depuis 1717. Les premières contre-vérités concoctées sur l'Ordre sont apparues en impression à peu près en même temps. Les États-Unis étaient consumés par l'hystérie anti-maçonnique à la fin des années 1820, et l'Europe a fait de Mason-bashing un sport populaire pendant deux siècles, le liant souvent à la propagande antisémite. Internet n'a que ...

Le choix des éditeurs

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

Dans la boîte de dialogue Configurer l'affichage dans PowerPoint, cliquez sur le bouton Configurer l'affichage dans l'onglet Diaporama du ruban Office 2011 pour Mac, ou choisissez Diaporama → Configurer l'affichage dans la barre de menus. Dans les deux cas, la boîte de dialogue Configurer l'affichage polyvalent apparaît. Choisir un type de spectacle dans PowerPoint 2011 pour Mac ...

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement d'un fichier sur lequel vous travaillez dans Office 2011 pour Mac est aussi simple que de cliquer sur le bouton Enregistrer dans la barre d'outils Standard, en appuyant sur Commande-S ou en choisissant Fichier → Enregistrer. Si votre fichier a été enregistré précédemment, l'enregistrement du fichier remplace la copie existante du fichier par votre version mise à jour. Si votre fichier n'a pas ...

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Dans Office 2011 pour Mac, l'ajout d'une nouvelle présentation de diapositive à une diapositive dans la vue Diapositive maître de PowerPoint 2011 est une tâche assez simple à effectuer. Suivez ces étapes pour commencer: Assurez-vous que vous êtes en mode Masque des diapositives. Choisissez Affichage → Maître → Masque de diapositives dans la barre de menus. Cliquez sur l'onglet Masque des diapositives du ruban, ...

Le choix des éditeurs

Sélectionnez PowerPoint 2007 Objects - dummies

Sélectionnez PowerPoint 2007 Objects - dummies

Avant de pouvoir modifier un objet PowerPoint 2007 sur une diapositive, vous devez le sélectionner. Dans les présentations PowerPoint, les objets peuvent être du texte, des graphiques, des images clipart, des formes, etc. Voici quelques instructions pour sélectionner les objets PowerPoint 2007: Objets texte: Pour sélectionner un objet texte PowerPoint 2007, déplacez le point d'insertion sur le texte qui ...

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Le contrôle shapePoint de powerPoint vous permet style des objets de ligne ou la bordure pour les objets de forme solide sur vos diapositives PowerPoint. Le contrôle Shape Outline se trouve dans le groupe Styles de formes de l'onglet Outils de dessin. Vous pouvez modifier les paramètres suivants pour le contour: Couleur: Définit la couleur utilisée pour ...

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 est le logiciel de présentation le plus puissant disponible pour créer et éditer la diapositive montrer des présentations pour le travail, la maison ou l'école. PowerPoint 2016 offre un certain nombre de raccourcis clavier utiles pour effectuer des tâches rapidement. Voici quelques raccourcis pour le formatage PowerPoint commun, l'édition et les tâches de fichiers et de documents. De plus, après avoir créé votre chef-d'œuvre, vous ...