Video: MVC 2025
Apache Oozie er inkludert i alle store Hadoop-distribusjoner, inkludert Apache Bigtop. I Hadoop-klyngen skal du installere Oozie-serveren på en kantnode, hvor du også vil kjøre andre klientprogrammer mot klyngens data, som vist.
Edge noder er designet for å være en gateway for utvendig nettverk til Hadoop-klyngen. Dette gjør dem ideelle for dataoverføringsteknologier (Flume, for eksempel), men også klientprogrammer og annen applikasjonsinfrastruktur som Oozie. Oozie trenger ikke en dedikert server, og kan lett sameksistere med andre tjenester som er ideelt for kantnoder, som Pig and Hive.
Etter at Oozie er distribuert, er du klar til å starte Oozie-serveren. Oozies infrastruktur er installert i katalogen $ OOZIE_HOME. Derfra løp du oozie-start. sh kommando for å starte serveren. (Som du kanskje forventer, innebærer å stoppe serveren å skrive oozie-stop. Sh.) Du kan teste statusen til Oozie-forekomsten din ved å kjøre kommandoen
oozie admin-status
Etter at du har installert Oozie-serveren og startet, kan du katalogisere og kjøre dine ulike arbeidsflyt, koordinator eller buntejobber. Når du jobber med jobbene dine, lagrer Oozie katalogdefinisjonene - dataene som beskriver alle Oozie-objekter (arbeidsflyt, koordinator og buntjobber) - så vel som deres tilstander i en dedikert database.
Som standard er Oozie konfigurert til å bruke den innebygde Derby-databasen, men du kan bruke MySQL, Oracle eller PostgreSQL, hvis du trenger det.
Du har fire alternativer for interaksjon med Oozie-serveren:
-
Java API: Dette alternativet er nyttig i situasjoner der du har din egen planleggingskode i Java-programmer, og du må kontrollere utførelsen av din Oozie-arbeidsflyter, koordinatorer eller bunter fra din søknad.
-
REST-API: Igjen, fungerer dette alternativet godt i de tilfellene der du vil bruke din egen planleggingskode som grunnlag for dine Oozie-arbeidsflyter, koordinatorer eller bunter, eller hvis du ønsker å bygge ditt eget grensesnitt eller utvide en eksisterende for å administrere Oozie-serveren.
-
Command Line Interface (CLI): Det er det tradisjonelle Linux-kommandolinjegrensesnittet for Oozie.
-
Oozie Webkonsoll: Ok, kanskje du ikke kan gjøre mye samhandling her, men Oozie Web Console gir deg en (skrivebeskyttet) visning av Oozie-serverens tilstand, som er nyttig for overvåking av dine Oozie jobber.
Hue, et Hadoop administrasjonsgrensesnitt, gir et annet verktøy for å jobbe med Oozie.Oozie-arbeidsflyter, koordinatorer og bunter er alle definert ved hjelp av XML, noe som kan være kjedelig å redigere, spesielt for komplekse situasjoner. Hue gir et GUI designerverktøy for å grafisk bygge arbeidsflyter og andre Oozie objekter.
Under dekslene inneholder Oozie en innebygd Tomcat webserver som håndterer inngang og utgang.
