Video: Sqoop Import and Export data from RDMBS and HDFS 2025
Det er overbevisende grunner til at SQL har vist seg å være motstandsdyktig. IT-bransjen har 40 års erfaring med SQL, siden den ble utviklet av IBM tidlig på 1970-tallet. Med økningen i vedtaket av relasjonsdatabaser på 1980-tallet, har SQL siden blitt en standard ferdighet for de fleste IT-fagfolk.
Du kan enkelt se hvorfor SQL har vært så vellykket: Det er relativt enkelt å lære, og SQL-spørringer er ganske lesbare. Denne lettheten kan spores tilbake til et kjerneplan i SQL - det faktum at det er et deklarativt språk, i motsetning til et imperativt språk.
For et språk som er deklarativ betyr at dine spørsmål bare omhandler arten av dataene som blir bedt om - ideelt sett bør det ikke være noe i spørringen som bestemmer hvordan behandlingen bør utføres. Med andre ord, alt du angir i SQL, er hvilken informasjon du vil ha tilbake fra systemet - ikke hvordan du får det.
I motsetning til, med et imperativt språk (C, for eksempel, eller Java eller Python), inneholder koden din instruksjoner der du definerer handlingene du trenger systemet til å utføre.
I tillegg til de (lettgjorte) ferdighetene til dine SQL-vennlige IT-profesjonelle, har også tiårers databaseapplikasjoner blitt bygd med SQL-grensesnitt. Når vi snakker om hvordan Hadoop kan utfylle datalageret, er det klart at organisasjoner vil lagre strukturerte data i Hadoop. Og som et resultat vil de kjøre noen av deres eksisterende programlogikk mot Hadoop.
Ingen ønsker å betale for applikasjoner som skal skrives om, så et SQL-grensesnitt er svært ønskelig.
Med utviklingen av SQL-grensesnitt til Hadoop-data, er en interessant trend at kommersielle forretningsanalyser og dataadministrasjonsverktøy nesten hopper på Hadoop-båndvognen, inkludert business intelligence-rapportering; statistiske pakker; Utdrag, transformer og last rammeverk (ETL); og en rekke andre verktøy. I de fleste tilfeller er grensesnittet til Hadoop-dataene Hive.
