Hjem Personlig finansiering Hadoop som et spørringsark for Cold Warehouse Data - dummies

Hadoop som et spørringsark for Cold Warehouse Data - dummies

Video: Big data. Ciutadans sota control 2025

Video: Big data. Ciutadans sota control 2025
Anonim

En rekke studier viser at de fleste data i et bedriftsdatavarehus sjelden blir spurt. Databaseleverandører har reagert på slike observasjoner ved å implementere egne metoder for å sortere ut hvilke data som blir plassert der.

En metode ordner datarunet til betegnelser for varmt, varmt eller kaldt, hvor varmt data (noen ganger kalt aktiv data) brukes ofte, brukes varm data fra tid til annen, og kaldt data brukes sjelden. Den foreslåtte løsningen for mange leverandører er å lagre de kalde dataene på langsommere disker i datalagringskapasitetene eller å lage klare caching-strategier for å holde de varme dataene i minnet blant annet.

Problemet med denne tilnærmingen er at selv om tregere lagring er brukt, er det fortsatt dyrt å lagre kalde, sjelden brukte data i et lager. Kostnadene her stammer fra begge maskinvare og programvare lisensiering. Samtidig arkiveres kald og sovende data ofte til tape.

Denne tradisjonelle modellen for arkiveringsdata brytes ned når du vil spørre alle kalddata på en kostnadseffektiv og relativt effektiv måte - uten å måtte be om gamle bånd, med andre ord.

Hvis du ser på kostnadene og driftskarakteristikkene til Hadoop, ser det ut til at det er satt til å bli den nye sikkerhetstape. Hadoop er billig, hovedsakelig fordi Hadoop-systemer er designet for å bruke en lavere klasse maskinvare enn det som normalt brukes i datalagringssystemer. En annen betydelig kostnadsbesparelse er programvare lisensiering.

Commercial Hadoop distribusjonslisenser krever en brøkdel av kostnaden for relasjonsdatamagasinet programvare lisenser, som er beryktet for å være dyrt. Fra et operativt perspektiv er Hadoop designet for å skalere bare ved å legge til flere slave noder til en eksisterende klynge. Og som slave noder legges til og datasettene vokser i volum, gjør Hadops databehandlingsrammer at programmene dine sømløst kan håndtere den økte arbeidsbelastningen.

Hadoop representerer en enkel, fleksibel og rimelig måte å presse behandling på tvers av tusenvis av servere.

Med sin skalerbare og rimelige arkitektur synes Hadoop å være et perfekt valg for arkivering av lagerdata … bortsett fra en liten sak: Det meste av IT-verdenen kjører på SQL, og SQL alene spiller ikke bra med Hadoop.

Visst, jo mer Hadoop-vennlig NoSQL-bevegelse er i live og bra, men de fleste strømbrukere bruker nå SQL ved hjelp av vanlige verktøy uten bruk av hylle som genererer SQL-spørringer under hetten - produkter som Tableau, Microsoft Excel, og IBM Cognos BI.

Det er sant at Hadoop-økosystemet inkluderer Hive, men Hive støtter bare en delmengde av SQL, og selv om ytelsen forbedres (sammen med SQL-støtte), er det ikke så fort til å svare på mindre spørsmål som relasjonssystemer er. Nylig har det vært stor fremgang rundt SQL-tilgangen til Hadoop, som har banet vei for Hadoop å bli det nye målet for elektroniske datalagringsarkiver.

Avhengig av Hadoop-leverandøren blir SQL (eller SQL-lignende) APIer tilgjengelige slik at de mer vanlige rapporteringsverktøyene og rapporteringsverktøyene kan sømløst utgjøre SQL som utføres på data lagret i Hadoop. For eksempel har IBM sin Big SQL API, Cloudera har Impala, og Hive selv, via Hortonworks Stinger-initiativet, blir stadig mer kompatibel med SQL.

Selv om ulike synspunkter eksisterer (noen har som mål å forbedre Hive, noen, for å utvide Hive, og andre, for å gi et alternativ), prøver alle disse løsningene å håndtere to problemer: MapReduce er en dårlig løsning for å utføre mindre spørringer, og SQL-tilgang er - for nå - nøkkelen til at IT-arbeidere kan bruke sine eksisterende SQL-ferdigheter for å få verdier ut av data lagret i Hadoop.

Hadoop som et spørringsark for Cold Warehouse Data - dummies

Redaktørens valg

Hvordan du samler ressurser i Minecraft - dummies

Hvordan du samler ressurser i Minecraft - dummies

Du kan samle ressurser på flere måter for Minecraft-strukturen - noen er mer effektiv enn andre. Her finner du noen forskjellige måter å samle materialer på for din struktur. Du har et par forskjellige alternativer når det gjelder gruvedrift. Hver har sine fordeler og ulemper, så det er opp til ...

Hvordan bygge Minecraft-kretser og -maskiner med Minecart-spor - dummier

Hvordan bygge Minecraft-kretser og -maskiner med Minecart-spor - dummier

Minecart og skinner er Minecraft-funksjoner ofte brukt til å transportere spillere. Men de kan også utføre mange mekaniske egenskaper bedre enn de vanlige redstone-elementene. Minecarts er enheter som kan rulle raskt langs minecartskinner. De kan svinge, gå opp og ned skråninger, og til og med spore (selv om de lider mye ...

Hvordan bygge din første Minecraft Garden - dummies

Hvordan bygge din første Minecraft Garden - dummies

Se hvordan du oppretter en vakker hage i Minecraft ved å planlegge riktig layout, få en rekke unike planter, og organisere plass.

Redaktørens valg

Markedet ditt mobilnettsted til media - dummies

Markedet ditt mobilnettsted til media - dummies

IPhone og iPad er varme emner i media i disse dager. Når du er ferdig med å designe nettstedet ditt for disse nye medieenhetene, ikke glem å markedsføre dem til tradisjonelle medier. Tiltrekke medieoppmerksomhet til mobilwebområdet ditt er ikke i motsetning til å tiltrekke det til noen annen virksomhet. Trikset er å fortelle et godt ...

Gjør skannede dokumenter søkbare og redigerbare - dummies

Gjør skannede dokumenter søkbare og redigerbare - dummies

Når du skanner et dokument direkte til en PDF-fil, Acrobat fanger all tekst og grafikk på hver side som om de alle var bare ett stort grafisk bilde. Dette er bra så langt det går, bortsett fra at det ikke går veldig langt fordi du ikke kan redigere eller søke i PDF-dokumentet ...

Markedet med SMS-meldinger - dummies

Markedet med SMS-meldinger - dummies

Lengden på SMS- begrenset til 160 tegn, så reklamemeldingen din må være kort og søt. Disse meldingene kan inneholde lenker til nettsteder eller klikk for å ringe meldinger: Du klikker på SMS, slik at telefonen ringer. SMS-kampanjer er mye enklere å håndtere enn ...

Redaktørens valg

Rediger, endre farge eller fjern Photoshop Shape Layers - dummies

Rediger, endre farge eller fjern Photoshop Shape Layers - dummies

Bruk formlag i Photoshop Creative Suite 5 når målet med designet ditt er å integrere vektormodeller og pikseldata sømløst. Når du har opprettet et formlag, kan du redigere formen, endre fargen eller fjerne laget helt. Rediger en form Som Adobe Illustrator, gir Photoshop både et valg av sti ...

Oppdag Photoshops malerverktøy - dummies

Oppdag Photoshops malerverktøy - dummies

Ingenting i Photoshop CC gir deg mer presis kontroll over fargen i bildet ditt enn ved bruk av blyantpenningen verktøy med en 1-piks pensel. Husk at bildet ditt består av mange småfargede firkanter (piksler), og at fargen på de enkelte firkantene er det som gir utseendet til et tre eller et ...

Forbedre portretter i Photoshop CC - dummier

Forbedre portretter i Photoshop CC - dummier

Forbedre detaljer som å avklare motivets briller i Photoshop CC kan hjelpe bildene dine og portretter ser det mye bedre ut. Whitening tennene er et annet godt triks for å lyse opp bildene dine. Deklarende briller i Photoshop Eyeglasses kan være fotografens mareritt! Refleksjonene fra glass er vanligvis spekulative høydepunkter - det vil si områder av ren ...