Vidéo: Breathing New Life into Apache Oozie with Apache Ambari Workflow Manager 2024
En tant que moteur de workflow, Oozie vous permet d'exécuter un ensemble d'applications Hadoop dans une séquence spécifique appelée workflow . Vous pouvez configurer les flux de travail Oozie de trois façons, en fonction de votre situation particulière. Vous pouvez utiliser
-
La configuration par défaut. Fichier XML: Définit les paramètres qui ne changent pas pour le flux de travail.
-
Le travail. fichier de propriétés: Définit les paramètres communs à un déploiement particulier du workflow. Les définitions ici remplacent celles faites dans le config-default. fichier xml.
-
Les paramètres de la ligne de commande: Définit les paramètres spécifiques à l'appel du workflow. Les définitions ici remplacent celles faites dans le travail. fichier de propriétés et le config-default. fichier xml.
Les détails de configuration diffèrent en fonction de l'action à laquelle ils sont associés. Par exemple, comme vous pouvez le voir dans l'action MapReduce (map-action) dans la liste suivante, vous avez beaucoup plus de choses à configurer ici:
… @@ 1 serverName: 8021 serverName: 8020 @@ 2 @@ 3 jobConfig. xml … mapreduce. carte. mannequins de classe. Oozie. FlightMilesMapper mapreduce. réduire. mannequins de classe. Oozie. FlightMilesReducer mapred. mapoutput. clé. classe org. apache. hadoop. io. Texte mapred. mapoutput. valeur. classe org. apache. hadoop. io. Mapred IntWritable. sortie. clé. classe org. apache. hadoop. io. Texte mapred. sortie. valeur. classe org. apache. hadoop. io. Mapred IntWritable. contribution. dir '/ usr / dirk / voldata' mapred. sortie. dir '/ usr / dirk / flightmiles' … …
Par opposition à une action de système de fichiers (fs) comme celle montrée ici:
… …