Video: HDInsight: Fast Interactive Queries with Hive on LLAP | Azure Friday 2025
Her finner du ut hvordan Last ned og distribuere HBase i frittstående modus. Det er utrolig enkelt å installere HBase og begynne å bruke teknologien. Bare husk at HBase vanligvis distribueres på en klynge av råvareservere, men du kan også enkelt distribuere HBase i en frittstående konfigurasjon i stedet for læring eller demonstrasjonsformål.
Som Apache Hadoop støtter HBase Linux, men du kan kan bruke Windows i ikke-produksjonsmiljøer hvis du først laster ned Cygwin. Cygwin gir Microsoft Windows-brukere et Unix-skjerm med alle kommandoer og verktøy. Så hvis du følger hurtigveiledningen, vil du laste ned den nyeste versjonen av HBase.
Du får velge hvor du skal installere HBase. Det viser seg at hvis du vil at ting skal kjøre i frittstående modus, må du redigere et par filer før du faktisk kan starte HBase. Den første filen vises i følgende liste. Endringene du vil gjøre er dristige for å få dem til å skille seg ut:
hbase. rootdir fil: /// hjem / biadmin / min-lokal-hbase / hbase-data hbase. klyngen. fordelt true hbase. dyrepasser. eiendom. clientPort 2222 Eiendom fra ZooKeeper's config zoo. cfg. Porten som kundene vil koble til. hbase. dyrepasser. eiendom. dataDir / home / biadmin / min-local-hbase / dyrepasser hbase. dyrepasser. quorum bivm
Du angir en katalog i det lokale filsystemet for å lagre HBase-dataene. I produksjonsmiljøer vil denne egenskapen peke på HDFS for datalageret. For illustrasjons skyld vil pseudo-distribuert modus føre til at HBase starter en RegionServer-forekomst, en MasterServer-forekomst og en Zookeeper-prosess.
I tillegg må du spesifisere katalogen hvor Zookeeper vil lagre dataene sine () og en liste over servere som Zookeeper skal kjøre for å danne et quorum (). For frittstående, spesifiserer du bare den eneste Zookeeper-serveren.
Komme i gang med HBase i frittstående modus er veldig grei, delvis fordi HBase administrerer Zookeeper for deg. Du kan laste ned en egen Zookeeper-utgave og peke HBase til den, men for frittstående installasjoner, vil du finne det mye lettere å la HBase administrere Zookeeper for deg.
For å krystallisere beslutningen om å la HBase administrere Zookeeper for deg, her er hvordan du setter en miljøvariabel i enda en HBase-fil. Følgende liste viser hva som må legges til:
# Fortell HBase om den skal administrere sin egen forekomst av Zookeeper eller ikke. eksporter HBASE_MANAGES_ZK = true # Java-implementeringen skal brukes.Java 1. 6 påkrevd. eksporter JAVA_HOME = / opt / ibm / biginsights / jdk
Du må sørge for at du peker på din valgte JDK. Til slutt må du spesifisere navnet på ditt Linux-system i enda en fil. (I et fullt distribuert produksjonsmiljø vil denne filen ha en linje for linjeliste over alle servere som HBase kan starte RegionServer-prosessen på.)
Du kan nå starte HBase og teste installasjonen din. For å starte HBase, bruk skriptet som skrevet ut i følgende liste.
$ cd $ INSTALL_DIR / hbase-0. 94. 7 / bin $. / Start-hbase. sh bivm: starter zookeeper, logging til / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-zookeeper-bivm. ut start master, logging til / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-master-bivm. ut localhost: starter regionerver, logging til / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-regionserver-bivm. ut
Vær oppmerksom på at den første linjen har en CD-fil (endre katalogen) som flytter deg til en miljøvariabel. Du må sette denne variabelen til din faktiske installasjonsmappe for HBase eller skrive ut hele banen.
Bruk deretter verktøylinjen JConsole, som følger med Java, for å utføre en rask sjekk på hvilke prosesser som kjører etter at skriptet er ferdig. Du kan starte verktøylinjen JConsole ved å skrive følgende kommando: $ JAVA_HOME / bin / jconsole.
JConsole avslører at de tre prosessene som skriptet hevdet å starte, faktisk kjører - zookontrolleren, mesteren og RegionServer-prosessene.
For å sette HBase gjennom sine skritt, samhandler du med alle tre HBase-prosessene, som starter med MasterServer. Som standard rapporterer MasterServer om systemstatus ved hjelp av et nettleserbrukergrensesnitt på portnummer 60010. I eksempelet kan du bekrefte at MasterServer kjører riktig ved å skrive inn følgende URL i en nettleser: // bivm: 60010 /. Å gjøre det bringer opp informasjonen du ser her.
