Hjem Personlig finansiering Alternative distribusjonsformfaktorer for Hadoop - dummies

Alternative distribusjonsformfaktorer for Hadoop - dummies

Innholdsfortegnelse:

Video: Acoustic Alternative Rock | Top 20 Alternative Rock Songs Of The 2000s 2025

Video: Acoustic Alternative Rock | Top 20 Alternative Rock Songs Of The 2000s 2025
Anonim

Selv om Hadoop har det beste når det er installert på en fysisk datamaskin, hvor behandlingen har direkte tilgang til dedikert lagring og nettverk, har Hadoop alternative distribusjoner. Og selv om de er mindre effektive enn den dedikerte maskinvaren, er det i enkelte tilfeller alternativer som er mulige alternativer.

Virtualiserte servere

En stor trend i IT-sentre over det siste tiåret er virtualisering, hvor en stor server kan være vert for flere "virtuelle maskiner" som ser ut og fungerer som enkelt maskiner. I stedet for dedikert maskinvare, er en organisasjon hele settet av applikasjoner og repositorier distribuert på virtualisert maskinvare.

Denne tilnærmingen har mange fordeler: Sentralisering av IT forenkler vedlikehold, IT-investeringer er maksimert på grunn av færre ubrukte CPU-sykluser, og det totale maskinvareavtrykket er lavere, noe som resulterer i lavere total eierkostnad.

Organisasjoner der IT-distribusjonene er helt virtualiserte, tilsier i noen tilfeller at alle nye applikasjoner følger denne modellen. Selv om Hadoop kan distribueres på denne måten, i hovedsak som en virtuell klynge (med virtuelle masterknuter og virtuelle slave noder), oppstår ytelsen, delvis fordi lagring er SAN-basert og ikke er lokalt knyttet til de fleste virtualiserte miljøer.

Fordi Hadoop er designet for å fungere best når alle tilgjengelige CPU-kjerner har rask tilgang til uavhengig spinndisker, opprettes en flaskehals som hele kartet og reduserer oppgaver, og begynner å behandle data via det begrensede nettverket mellom CPUer og SAN. Siden graden av isolasjon mellom virtualiserte serverressurser er begrenset (virtuelle servere deler ressurser med hverandre), kan Hadoop arbeidsbelastninger også påvirkes av annen aktivitet.

Når den virtuelle serverens ytelse påvirkes av en annen serveres arbeidsbelastning, er det faktisk kjent i IT-kretser som et "støyende nabo" -problem!

Virtualiserte miljøer kan imidlertid være ganske nyttige, men i noen tilfeller. For eksempel, hvis organisasjonen din trenger å fullføre en engangsforskningsanalyse av et stort datasett, kan du enkelt lage en midlertidig klynge i ditt virtualiserte miljø. Denne metoden er ofte en raskere måte å få intern godkjenning enn å utholde de byråkratiske problemene med å skaffe seg ny dedikert maskinvare.

Når du eksperimenterer med Hadoop, kjører du det ofte på de bærbare maskinene dine via en virtuell maskin (VM). Hadoop er ekstremt sakte i denne typen miljø, men hvis du bruker små datasett, er det et verdifullt lærings- og testverktøy.

Cloud-distribusjoner

Variasjoner av virtualiserte miljøer er cloud computing-leverandører som Amazon, Rackspace og IBM SoftLayer. De fleste store offentlige cloud-leverandører har nå MapReduce eller Hadoop-tilbud tilgjengelig for bruk. Igjen, deres ytelse er dårligere enn å distribuere klassen din på dedikert maskinvare, men det er bedre.

Cloud-leverandører lager Hadoop-optimaliserte miljøer der slave noder har lokalt lagret lagring og dedikert nettverk. Hypervisorer blir også langt mer effektive, med redusert overhead og latens.

Ikke vurder en sky løsning for langsiktige applikasjoner, fordi kostnadene ved å leie cloud computing ressurser er betydelig høyere enn å eie og vedlikeholde et tilsvarende system. Med en skyleverandør betaler du for enkelhets skyld og for å kunne laste ut overhead av provisjonsmaskinvare. Imidlertid er skyen en ideell plattform for testing, utdanning og engangs databehandling.

Bortsett fra ytelses- og kostnadsoverveielser, har du lovgivningsmessige hensyn med offentlig distribusjon av cloud. Hvis du har sensitive data, som må lagres enten internt eller i landet, er det ikke et alternativ for offentlig publisering av cloud. I tilfeller som dette, hvor du trenger bekvemmeligheten av en skybasert distribusjon, er en privat sky et godt alternativ, hvis det er tilgjengelig.

Alternative distribusjonsformfaktorer for Hadoop - dummies

Redaktørens valg

Hvordan du samler ressurser i Minecraft - dummies

Hvordan du samler ressurser i Minecraft - dummies

Du kan samle ressurser på flere måter for Minecraft-strukturen - noen er mer effektiv enn andre. Her finner du noen forskjellige måter å samle materialer på for din struktur. Du har et par forskjellige alternativer når det gjelder gruvedrift. Hver har sine fordeler og ulemper, så det er opp til ...

Hvordan bygge Minecraft-kretser og -maskiner med Minecart-spor - dummier

Hvordan bygge Minecraft-kretser og -maskiner med Minecart-spor - dummier

Minecart og skinner er Minecraft-funksjoner ofte brukt til å transportere spillere. Men de kan også utføre mange mekaniske egenskaper bedre enn de vanlige redstone-elementene. Minecarts er enheter som kan rulle raskt langs minecartskinner. De kan svinge, gå opp og ned skråninger, og til og med spore (selv om de lider mye ...

Hvordan bygge din første Minecraft Garden - dummies

Hvordan bygge din første Minecraft Garden - dummies

Se hvordan du oppretter en vakker hage i Minecraft ved å planlegge riktig layout, få en rekke unike planter, og organisere plass.

Redaktørens valg

Markedet ditt mobilnettsted til media - dummies

Markedet ditt mobilnettsted til media - dummies

IPhone og iPad er varme emner i media i disse dager. Når du er ferdig med å designe nettstedet ditt for disse nye medieenhetene, ikke glem å markedsføre dem til tradisjonelle medier. Tiltrekke medieoppmerksomhet til mobilwebområdet ditt er ikke i motsetning til å tiltrekke det til noen annen virksomhet. Trikset er å fortelle et godt ...

Gjør skannede dokumenter søkbare og redigerbare - dummies

Gjør skannede dokumenter søkbare og redigerbare - dummies

Når du skanner et dokument direkte til en PDF-fil, Acrobat fanger all tekst og grafikk på hver side som om de alle var bare ett stort grafisk bilde. Dette er bra så langt det går, bortsett fra at det ikke går veldig langt fordi du ikke kan redigere eller søke i PDF-dokumentet ...

Markedet med SMS-meldinger - dummies

Markedet med SMS-meldinger - dummies

Lengden på SMS- begrenset til 160 tegn, så reklamemeldingen din må være kort og søt. Disse meldingene kan inneholde lenker til nettsteder eller klikk for å ringe meldinger: Du klikker på SMS, slik at telefonen ringer. SMS-kampanjer er mye enklere å håndtere enn ...

Redaktørens valg

Rediger, endre farge eller fjern Photoshop Shape Layers - dummies

Rediger, endre farge eller fjern Photoshop Shape Layers - dummies

Bruk formlag i Photoshop Creative Suite 5 når målet med designet ditt er å integrere vektormodeller og pikseldata sømløst. Når du har opprettet et formlag, kan du redigere formen, endre fargen eller fjerne laget helt. Rediger en form Som Adobe Illustrator, gir Photoshop både et valg av sti ...

Oppdag Photoshops malerverktøy - dummies

Oppdag Photoshops malerverktøy - dummies

Ingenting i Photoshop CC gir deg mer presis kontroll over fargen i bildet ditt enn ved bruk av blyantpenningen verktøy med en 1-piks pensel. Husk at bildet ditt består av mange småfargede firkanter (piksler), og at fargen på de enkelte firkantene er det som gir utseendet til et tre eller et ...

Forbedre portretter i Photoshop CC - dummier

Forbedre portretter i Photoshop CC - dummier

Forbedre detaljer som å avklare motivets briller i Photoshop CC kan hjelpe bildene dine og portretter ser det mye bedre ut. Whitening tennene er et annet godt triks for å lyse opp bildene dine. Deklarende briller i Photoshop Eyeglasses kan være fotografens mareritt! Refleksjonene fra glass er vanligvis spekulative høydepunkter - det vil si områder av ren ...