Hjem Personlig finansiering Slik bruker du datastreaming for store data - dummier

Slik bruker du datastreaming for store data - dummier

Video: Unlimited 4G Hotspot for $20 per Month! 2025

Video: Unlimited 4G Hotspot for $20 per Month! 2025
Anonim

Noen ganger, når de nærmer seg store data, står selskaper overfor store mengder data og en liten ide om hvor de skal gå neste. Angi datastreaming. Når en betydelig mengde data må behandles raskt i nær sanntid for å få innsikt, er data i bevegelse i form av streaming data det beste svaret.

Hva er data som er ikke i ro? Dette ville være systemer som styrer aktive transaksjoner og derfor må ha utholdenhet. I disse tilfellene lagres dataene i en operativ datalager. Men i andre situasjoner har disse transaksjonene blitt utført, og det er på tide å analysere dataene vanligvis i et datalager eller datamaskin.

Dette betyr at informasjonen blir behandlet i batch og ikke i sanntid. Når organisasjoner planlegger sin fremtid, må de kunne analysere mye data, alt fra informasjon om hvilke kunder som kjøper og hvorfor. Det er viktig å forstå de ledende indikatorene for endring. Med andre ord, hvordan vil endringer påvirke hvilke produkter og tjenester en organisasjon vil tilby i fremtiden?

Mange forskningsorganisasjoner bruker denne typen store dataanalyser for å finne nye medisiner. Et forsikringsselskap vil kanskje sammenligne mønstre av trafikkulykker over et bredt geografisk område med værstatistikk. I disse tilfellene finnes det ingen fordel for å administrere denne informasjonen i sanntidshastighet. Klart må analysen være rask og praktisk. I tillegg vil organisasjoner analysere dataene for å se om nye mønstre kommer fram.

Streaming data er en analytisk databehandling plattform som er fokusert på hastighet. Dette skyldes at disse programmene krever en kontinuerlig strøm av ofte ustrukturerte data som skal behandles. Derfor analyseres data kontinuerlig og transformeres i minnet før det lagres på en disk. Behandling av datastrømmer fungerer ved å behandle "tidsvinduer" av data i minnet over en klynge av servere.

Dette ligner tilnærmingen når man håndterer data i hvilemodus Hadoop. Den primære forskjellen er spørsmålet om hastighet. I Hadoop-klyngen samles data i batch-modus og behandles deretter. Hastighet betyr mindre i Hadoop enn det gjør i datastrømning. Noen nøkkelprinsipper definerer når bruk av strømmer er mest hensiktsmessig:

  • Når det er nødvendig å bestemme en kjøpsmulighet for kjøp ved inngangspunktet, enten via sosiale medier eller via tillatelsesbasert meldingstjeneste

  • Samle informasjon om bevegelsen rundt en sikker side

  • For å kunne reagere på et arrangement som trenger umiddelbar respons, for eksempel en tjenesteavbrudd eller en endring i pasientens medisinske tilstand

  • Beregning av kostnader i sanntid, som er avhengig av variabler som bruk og tilgjengelige ressurser

Streaming-data er nyttig når analyser må gjøres i sanntid mens dataene er i gang.Faktisk reduseres verdien av analysen (og ofte dataene) med tiden. Hvis du for eksempel ikke kan analysere og handle umiddelbart, kan en salgsmulighet gå tapt, eller en trussel kan gå uoppdaget.

Følgende er noen eksempler som kan bidra til å forklare hvordan dette er nyttig.

Et kraftverk må være et svært sikkert miljø, slik at uautoriserte personer ikke forstyrrer levering av strøm til kunder. Bedrifter plasserer ofte sensorer rundt omkretsen av et område for å oppdage bevegelse. Men et problem kan eksistere. En stor forskjell eksisterer mellom en kanin som scurries rundt på siden og en bil kjører raskt og bevisst. Derfor må den enorme mengden data som kommer fra disse sensorene analyseres i sanntid, slik at en alarm bare høres når en faktisk trussel eksisterer.

Et teleselskap i et konkurransedyktig marked ønsker å sikre at utbruddene overvåkes nøye, slik at en oppdaget nedgang i servicenivåer kan økes til den aktuelle gruppen. Kommunikasjonssystemer genererer store datamengder som må analyseres i sanntid for å kunne ta de riktige tiltakene. En forsinkelse med å oppdage en feil kan på alvor påvirke kundetilfredsheten.

Det er unødvendig å si at bedrifter har å gjøre med mye data som må behandles og analyseres i sanntid. Derfor er det fysiske miljøet som støtter dette responsnivået kritisk. Streaming datamiljøer krever vanligvis en klynget maskinvareoppløsning, og noen ganger må en massivt parallell behandlingsmetode kreves for å håndtere analysen.

En viktig faktor for streaming dataanalyse er at det er en enkeltpassanalyse. Med andre ord, kan analytikeren ikke reanalysere dataene etter at den er streamet. Dette er vanlig i applikasjoner der du leter etter fravær av data.

Hvis flere passeringer kreves, må dataene legges inn i en slags varehus hvor det kan foretas tilleggsanalyse. For eksempel er det ofte nødvendig å etablere kontekst. Hvordan sammenligner disse streamingdataene med historiske data? Denne korrelasjonen kan fortelle deg mye om hva som har endret seg, og hva som endrer seg, kan bety for virksomheten din.

Slik bruker du datastreaming for store data - dummier

Redaktørens valg

10 Tips for visuelt analysere og presentere data i Excel - dummies

10 Tips for visuelt analysere og presentere data i Excel - dummies

Her er noen konkrete forslag om hvordan du med hell kan bruke diagrammer som dataanalyseværktøy i Excel, og hvordan du kan bruke diagrammer for å mer effektivt kommunisere resultatene av dataanalysen du gjør. Bruk riktig diagramtype Hva mange mennesker ikke skjønner er at du bare kan lage fem ...

10 Måter å forbedre Power Pivot Performance - dummies

10 Måter å forbedre Power Pivot Performance - dummies

Når du publiserer Power Pivot-rapporter på nettet, har du tenkt for å gi publikum den beste opplevelsen som er mulig. En stor del av denne erfaringen er å sikre at ytelsen er god. Ordet ytelse (som det gjelder applikasjoner og rapportering) er vanligvis synonymt med hastighet - eller hvor raskt et program utfører bestemte handlinger ...

Legger ekstra analyselagre til Excel-diagrammer - dummies

Legger ekstra analyselagre til Excel-diagrammer - dummies

Det er ikke uvanlig å bli bedt om å legge til Ekstra analyse til din visualisering som vanligvis ikke er plottet på et Excel-diagram. For eksempel viser dette diagramet salg for hvert kvartal, men klienten vil kanskje også se prosentveksten i samme kvartal. De fleste Excel-analytikere oppfyller dette behovet med faktiske tekstbokser. ...

Redaktørens valg

Reise fotografering kamera sammenligning diagram - dummies

Reise fotografering kamera sammenligning diagram - dummies

Fra smarte telefoner til punkt-og-skyte og digitale speilreflekskameraer, du har en mange fotograferingsvalg der ute. Bruk følgende diagram for å se hvilken type kamera som passer best for deg. Smartphone Point-and-shoot dSLR Bildesensor Kvalitet Lav til middels Medium Høy Vannbestandig (egnet for basseng) Sjeldne Få modeller Sjeldne Optiske Zoom Lav ...

Ta et makrofoto-dummies

Ta et makrofoto-dummies

Fotografi (makrofotografi) gir deg den som ser bildene dine, utsikt over verden ikke normalt sett av det blotte øye. De fleste kameraer, selv smarttelefoner, kan skyte ting med en rimelig nærhet med en viss grad av klarhet og fokus. Mens du reiser, finner du ting som skyter nærbilde, for eksempel hva du spiser til middag, en merkelig feil, ...

Forestille et Moving Object - dummies

Forestille et Moving Object - dummies

Når du ser et bilde, skjønner du selv hva som skjedde da det ble tatt. Noen bilder kan innebære bevegelse eller aktivitet. For eksempel kan du fokusere på en sykkel som beveger seg nedover gaten med bygningene bak den sløret. Dette er annerledes enn grunne dybdeskarphet, men fordi blenderåpningen ikke er det som skaper ...

Redaktørens valg

ACT-strategi for å multiplisere en horisontal matrise med en vertikal matrise - dummies

ACT-strategi for å multiplisere en horisontal matrise med en vertikal matrise - dummies

På ACT Matematisk test, du må sannsynligvis multiplisere par matriser som har enten en rad eller en kolonne. En enkel måte å formere en horisontal matrise med en vertikal matris er å sette opp et lite rutenett. Denne metoden lar deg fylle ut tallene for å få det riktige svaret. Matrix ...

ACT-strategi for å løse en matrise ved hjelp av en determinant-dummies

ACT-strategi for å løse en matrise ved hjelp av en determinant-dummies

Er en determinant en vanlig operasjon utført på en firkantet matrise. På ACT Math-testen er den eneste determinantformelen du trenger å være kjent med, for en 2 x 2-matrise. Her er formelen for determinanten av Merk at determinanten av en matrise bare er et tall, ikke en matrise. Å ...

ACT Trick for Quadratics: Slik finner du raskt en Parabola-dummies retning

ACT Trick for Quadratics: Slik finner du raskt en Parabola-dummies retning

For å spare tid når du graver en kvadratisk funksjon på ACT Math-testen, kan du raskt bestemme retningen for parabolen ved hjelp av et enkelt triks basert på koeffisienten a. Dette trikset vedrører tegnet på variabelen a (i uttrykket ax2): Når a er positivt, er grafen konkav opp. I ...