Hjem Personlig finansiering Alternative distribusjonsformfaktorer for Hadoop - dummies

Alternative distribusjonsformfaktorer for Hadoop - dummies

Innholdsfortegnelse:

Video: Acoustic Alternative Rock | Top 20 Alternative Rock Songs Of The 2000s 2024

Video: Acoustic Alternative Rock | Top 20 Alternative Rock Songs Of The 2000s 2024
Anonim

Selv om Hadoop har det beste når det er installert på en fysisk datamaskin, hvor behandlingen har direkte tilgang til dedikert lagring og nettverk, har Hadoop alternative distribusjoner. Og selv om de er mindre effektive enn den dedikerte maskinvaren, er det i enkelte tilfeller alternativer som er mulige alternativer.

Virtualiserte servere

En stor trend i IT-sentre over det siste tiåret er virtualisering, hvor en stor server kan være vert for flere "virtuelle maskiner" som ser ut og fungerer som enkelt maskiner. I stedet for dedikert maskinvare, er en organisasjon hele settet av applikasjoner og repositorier distribuert på virtualisert maskinvare.

Denne tilnærmingen har mange fordeler: Sentralisering av IT forenkler vedlikehold, IT-investeringer er maksimert på grunn av færre ubrukte CPU-sykluser, og det totale maskinvareavtrykket er lavere, noe som resulterer i lavere total eierkostnad.

Organisasjoner der IT-distribusjonene er helt virtualiserte, tilsier i noen tilfeller at alle nye applikasjoner følger denne modellen. Selv om Hadoop kan distribueres på denne måten, i hovedsak som en virtuell klynge (med virtuelle masterknuter og virtuelle slave noder), oppstår ytelsen, delvis fordi lagring er SAN-basert og ikke er lokalt knyttet til de fleste virtualiserte miljøer.

Fordi Hadoop er designet for å fungere best når alle tilgjengelige CPU-kjerner har rask tilgang til uavhengig spinndisker, opprettes en flaskehals som hele kartet og reduserer oppgaver, og begynner å behandle data via det begrensede nettverket mellom CPUer og SAN. Siden graden av isolasjon mellom virtualiserte serverressurser er begrenset (virtuelle servere deler ressurser med hverandre), kan Hadoop arbeidsbelastninger også påvirkes av annen aktivitet.

Når den virtuelle serverens ytelse påvirkes av en annen serveres arbeidsbelastning, er det faktisk kjent i IT-kretser som et "støyende nabo" -problem!

Virtualiserte miljøer kan imidlertid være ganske nyttige, men i noen tilfeller. For eksempel, hvis organisasjonen din trenger å fullføre en engangsforskningsanalyse av et stort datasett, kan du enkelt lage en midlertidig klynge i ditt virtualiserte miljø. Denne metoden er ofte en raskere måte å få intern godkjenning enn å utholde de byråkratiske problemene med å skaffe seg ny dedikert maskinvare.

Når du eksperimenterer med Hadoop, kjører du det ofte på de bærbare maskinene dine via en virtuell maskin (VM). Hadoop er ekstremt sakte i denne typen miljø, men hvis du bruker små datasett, er det et verdifullt lærings- og testverktøy.

Cloud-distribusjoner

Variasjoner av virtualiserte miljøer er cloud computing-leverandører som Amazon, Rackspace og IBM SoftLayer. De fleste store offentlige cloud-leverandører har nå MapReduce eller Hadoop-tilbud tilgjengelig for bruk. Igjen, deres ytelse er dårligere enn å distribuere klassen din på dedikert maskinvare, men det er bedre.

Cloud-leverandører lager Hadoop-optimaliserte miljøer der slave noder har lokalt lagret lagring og dedikert nettverk. Hypervisorer blir også langt mer effektive, med redusert overhead og latens.

Ikke vurder en sky løsning for langsiktige applikasjoner, fordi kostnadene ved å leie cloud computing ressurser er betydelig høyere enn å eie og vedlikeholde et tilsvarende system. Med en skyleverandør betaler du for enkelhets skyld og for å kunne laste ut overhead av provisjonsmaskinvare. Imidlertid er skyen en ideell plattform for testing, utdanning og engangs databehandling.

Bortsett fra ytelses- og kostnadsoverveielser, har du lovgivningsmessige hensyn med offentlig distribusjon av cloud. Hvis du har sensitive data, som må lagres enten internt eller i landet, er det ikke et alternativ for offentlig publisering av cloud. I tilfeller som dette, hvor du trenger bekvemmeligheten av en skybasert distribusjon, er en privat sky et godt alternativ, hvis det er tilgjengelig.

Alternative distribusjonsformfaktorer for Hadoop - dummies

Redaktørens valg

Hvordan å stable og gruppereformer i Word 2013 - dummies

Hvordan å stable og gruppereformer i Word 2013 - dummies

Enkeltformer kan noen ganger være nyttige i en dokument, men den virkelige kraften til Word 2013's Shapes-funksjonen kan bli funnet ved å kombinere figurer for å lage mer komplekse tegninger og logoer. Du kan stable formene oppå hverandre og kontrollere rekkefølgen de vises i stakken. Når du har ...

Hvordan du angir punktavstand i Word 2013 - dummies

Hvordan du angir punktavstand i Word 2013 - dummies

Word 2013 lar deg legge til "luft" til plass før eller etter eller i midten av avsnittene dine. I midten av avsnittet har du linjeavstand. Før og etter avsnittet kommer punktavstand. Hvordan sette linjeavstanden Endre linjeavstanden legger til ekstra mellomrom mellom alle tekstlinjer ...

Slik starter du et nytt dokument i Word 2007 - dummies

Slik starter du et nytt dokument i Word 2007 - dummies

Starter et nytt dokument i Word 2007 er lett. Hvis du nettopp har startet Word 2007 og vil åpne et tomt dokument, kan du følge tre enkle trinn.

Redaktørens valg

Slik oppretter du en AWS Administrator User - Dummies

Slik oppretter du en AWS Administrator User - Dummies

Opprett Administrator-gruppen er det første trinnet for å sikre at din AWS (Amazon Web Services) -kontoen er fortsatt trygg. Det neste trinnet er å opprette en konto for deg selv og tilordne den til administratorgruppen, slik at du har full tilgang til de administrative funksjonene i din AWS-konto. Følgende trinn beskriver hvordan ...

Vurderer AWS-støttede plattformer - dummies

Vurderer AWS-støttede plattformer - dummies

Hvis du ikke har behandlet AWS eller skyen ennå, du kan være fristet til å tenke på plattformer som en bestemt kombinasjon av gjenstander. For eksempel, når du ser ditt eget lokale oppsett, har du en server som kjører et bestemt operativsystem og har et bestemt sett med maskinvareressurser. Systemet har en bestemt ...

Lage skuffer på Amazon Web Services - dummies

Lage skuffer på Amazon Web Services - dummies

Når du er den stolte eieren av Amazon Web Services (AWS ) konto, det er på tide å gjøre noe nyttig, som å lage en bøtte. Start med å sjekke ut dine S3-ressurser. For å gjøre det, klikk S3-lenken på startsiden for AWS Management Console, som vist her: Du er tatt til en side som lar deg administrere ...

Redaktørens valg

Slik bruker du Eye-Fi med Evernote-dummies

Slik bruker du Eye-Fi med Evernote-dummies

Et selskap kalt Eye-Fi gjør det mulig å Koble kameraet ditt med Evernote, selv uten å koble kameraet til datamaskinen. Følg disse trinnene for å bruke Eye-Fi: Følg instruksjonene som følger med Eye-Fi-kortet for å konfigurere en Eye-Fi-konto. Sett inn Eye-Fi-kortet i kameraet. Slå på kameraet ditt. ...

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hele poenget med å lagre nyttig informasjon er for å kunne finne den senere. Tagging i Evernote er fundamentalt lik for alle plattformer og er ekstremt nyttig når du dash om å prøve å skrive inn notater på hvilken enhet du bruker på den tiden. For å lage en tagg for et notat på en datamaskin eller ...