Video: Apache Drill Introduction 2025
Apache Drill er et kandidatprosjekt i Apache-inkubatoren. Apache Drill er ikke særlig syk, skjønt. Apache Software Foundation (ASF) kandidat teknologier alle begynner som inkubator prosjekter før de blir offisielle ASF teknologier. Du kan lese om Apache-inkubatoren. Du kan lese om Drill.
Inspirert av Googles Dremel-teknologi, er det oppgitte resultatmålet for Drill å aktivere SQL-spørringer mot en petabyte eller flere data fordelt på 10 000-pluss servere. Figuren illustrerer arkitekturen til Apache Drill.
Du kan se at nøkkelen til Drill-arkitekturen er DrillBit-serverne distribuert på hver dataknute. Merk at hver server inneholder en spørringsparameter, kompilator, optimaliserer og kjøretid, men det er en master DrillBit-server nominert av Zookeeper-servere, som overvåker utførelsen av spørringene og ser etter oppdraget å trekke sammen de foreløpige resultatene i en enkelt sett med utgang.
Som Dremel, kan Drill sameksistere med, og utfylle MapReduce, men MapReduce er ikke vant til å oppfylle spørringer, som med Apache Hive. I stedet er utførelsesmotorer kalt Drillbits blitt utviklet av medlemmer av Drill-fellesskapet.
Dette fellesskapet tar sikte på å gi forespørsler om lavt ventetid for applikasjoner som sanntidsdriftspaneler, bedriftsdetektering og andre tidsfølsomme brukstilfeller. Drill støtter nestede datatyper som Avro, JSON og Google protokollbuffere. Disse nestede datatyper tillater svært store, deormaliserte tabeller.
Drill-utviklingslaget jobber også med å tilby omfattende SQL-støtte ved å målrette SQL2003-overholdelse. Til slutt merk at boreteknikken gir HBase-støtte, slik at brukerne kan spørre HBase-tabeller med SQL.
