Hjem Personlig finansiering Identifiser dataene du trenger for dine store data - dummies

Identifiser dataene du trenger for dine store data - dummies

Innholdsfortegnelse:

Video: Safe and Sorry – Terrorism & Mass Surveillance 2024

Video: Safe and Sorry – Terrorism & Mass Surveillance 2024
Anonim

Få oversikt over hvilken type data du har å gjøre med i ditt store dataprosjekt. Mange organisasjoner erkjenner at mange internt genererte data ikke har vært vant til sitt fulle potensial tidligere.

Ved å utnytte nye verktøy, får organisasjoner ny innsikt fra tidligere uutnyttede kilder til ustrukturert data i e-post, kundeserviceoppføringer, sensordata og sikkerhetslogger. I tillegg er det stor interesse i å lete etter ny innsikt basert på analyse av data som hovedsakelig er eksternt for organisasjonen, for eksempel sosiale media, mobilplassering, trafikk og vær.

Utforskningsfasen for store data

I de tidlige stadiene av analysen vil du søke etter mønstre i dataene. Det er bare ved å undersøke svært store datamengder at nye og uventede relasjoner og korrelasjoner mellom elementene kan bli tydelige. Disse mønstrene kan for eksempel gi innsikt i kundepreferanser for et nytt produkt. Du trenger en plattform for å organisere dine store data for å se etter disse mønstrene.

Hadoop er mye brukt som en underliggende byggestein for å fange og behandle store data. Hadoop er designet med evner som gir raskere behandling av store data og gjør det mulig å identifisere mønstre i store mengder data på relativt kort tid. De to primære komponentene i Hadoop - Hadoop Distributed File System (HDFS) og MapReduce - brukes til å administrere og behandle dine store data.

FlumeNG for stor dataintegrasjon

Det er ofte nødvendig å samle, aggregere og flytte ekstremt store mengder strømdata for å søke etter skjulte mønstre i store data. Tradisjonelle integrasjonsverktøy som ETL ville ikke være rask nok til å flytte de store datastrømmene i tide for å levere resultater for analyse som sanntids svindeloppdagelse. FlumeNG laster data i sanntid ved å streame dataene dine til Hadoop.

Vanligvis brukes Flume til å samle store mengder loggdata fra distribuerte servere. Den følger alle fysiske og logiske noder i en Flume-installasjon. Agent noder er installert på serverne og er ansvarlig for å håndtere måten en enkelt datastrøm overføres og behandles fra startpunktet til bestemmelsesstedet.

I tillegg brukes samlere til å gruppere datastrømmene til større strømmer som kan skrives til et Hadoop-filsystem eller annen stor datalagringsbeholder. Flume er designet for skalerbarhet og kan kontinuerlig legge til flere ressurser til et system for å håndtere svært store mengder data på en effektiv måte.Flumes produksjon kan integreres med Hadoop og Hive for analyse av dataene.

Flume har også transformasjonselementer som kan brukes på dataene og kan gjøre Hadoop-infrastrukturen din til en streamingkilde for ustrukturerte data.

Mønster i store data

Du finner mange eksempler på selskaper som begynner å realisere konkurransefortrinnene fra stor dataanalyse. For mange bedrifter blir datastrømmer for sosiale medier stadig en integrert del av en digital markedsføringsstrategi. I undersøkelsesstadiet kan denne teknologien brukes til å raskt søke gjennom store mengder streamingdata og trekke ut trendmønstrene som er relatert til bestemte produkter eller kunder.

Kodifiseringsfasen for store data

Med hundrevis av butikker og tusenvis av kunder trenger du en repeterbar prosess for å gjøre spranget fra mønsteridentifikasjon til implementering av nytt produktvalg og mer målrettet markedsføring. Når du har funnet noe interessant i din store dataanalyse, kodifiserer du den og gjør den til en del av forretningsprosessen.

For å kodifisere forholdet mellom dine store dataanalyser og driftsdata må du integrere dataene.

Stor dataintegrasjon og integreringstrinn

Store data har stor innvirkning på mange aspekter av datahåndtering, inkludert dataintegrasjon. Tradisjonelt har dataintegrasjon fokusert på bevegelse av data gjennom mellomvare, inkludert spesifikasjoner for meldingsoverføring og krav til applikasjonsprogrammeringsgrensesnitt (APIer). Disse konseptene for dataintegrasjon er mer hensiktsmessige for å administrere data i ro i stedet for data i bevegelse.

Flyttet inn i den nye verden av ustrukturerte data og streamingdata endrer det konvensjonelle begrepet dataintegrasjon. Hvis du vil innlemme analysen av streamingdata i forretningsprosessen, trenger du avansert teknologi som er rask nok til at du kan ta beslutninger i sanntid.

Etter at den store dataanalysen er fullført, trenger du en tilnærming som gjør at du kan integrere eller inkorporere resultatene av din store dataanalyse i forretningsprosessen og i sanntidsaksjoner.

Selskaper har høye forventninger til å få reell forretningsverdi fra stor dataanalyse. Faktisk vil mange selskaper gjerne begynne en dypere analyse av internt genererte store data, for eksempel sikkerhetsloggdata, som ikke tidligere var mulig på grunn av teknologiske begrensninger.

Teknologier for høyhastighets transport av svært store og raske data er et krav for integrering på tvers av distribuerte store datakilder og mellom store data og operasjonelle data. Ustrukturerte datakilder må ofte flyttes raskt over store geografiske avstander for deling og samarbeid.

Kobling av tradisjonelle kilder med store data er en flertallet prosess etter at du har sett på alle dataene fra streaming store datakilder og identifisert relevante mønstre. Etter å ha redusert mengden data du trenger for å administrere og analysere, må du nå tenke på integrasjon.

Identifiser dataene du trenger for dine store data - dummies

Redaktørens valg

Hvordan å stable og gruppereformer i Word 2013 - dummies

Hvordan å stable og gruppereformer i Word 2013 - dummies

Enkeltformer kan noen ganger være nyttige i en dokument, men den virkelige kraften til Word 2013's Shapes-funksjonen kan bli funnet ved å kombinere figurer for å lage mer komplekse tegninger og logoer. Du kan stable formene oppå hverandre og kontrollere rekkefølgen de vises i stakken. Når du har ...

Hvordan du angir punktavstand i Word 2013 - dummies

Hvordan du angir punktavstand i Word 2013 - dummies

Word 2013 lar deg legge til "luft" til plass før eller etter eller i midten av avsnittene dine. I midten av avsnittet har du linjeavstand. Før og etter avsnittet kommer punktavstand. Hvordan sette linjeavstanden Endre linjeavstanden legger til ekstra mellomrom mellom alle tekstlinjer ...

Slik starter du et nytt dokument i Word 2007 - dummies

Slik starter du et nytt dokument i Word 2007 - dummies

Starter et nytt dokument i Word 2007 er lett. Hvis du nettopp har startet Word 2007 og vil åpne et tomt dokument, kan du følge tre enkle trinn.

Redaktørens valg

Slik oppretter du en AWS Administrator User - Dummies

Slik oppretter du en AWS Administrator User - Dummies

Opprett Administrator-gruppen er det første trinnet for å sikre at din AWS (Amazon Web Services) -kontoen er fortsatt trygg. Det neste trinnet er å opprette en konto for deg selv og tilordne den til administratorgruppen, slik at du har full tilgang til de administrative funksjonene i din AWS-konto. Følgende trinn beskriver hvordan ...

Vurderer AWS-støttede plattformer - dummies

Vurderer AWS-støttede plattformer - dummies

Hvis du ikke har behandlet AWS eller skyen ennå, du kan være fristet til å tenke på plattformer som en bestemt kombinasjon av gjenstander. For eksempel, når du ser ditt eget lokale oppsett, har du en server som kjører et bestemt operativsystem og har et bestemt sett med maskinvareressurser. Systemet har en bestemt ...

Lage skuffer på Amazon Web Services - dummies

Lage skuffer på Amazon Web Services - dummies

Når du er den stolte eieren av Amazon Web Services (AWS ) konto, det er på tide å gjøre noe nyttig, som å lage en bøtte. Start med å sjekke ut dine S3-ressurser. For å gjøre det, klikk S3-lenken på startsiden for AWS Management Console, som vist her: Du er tatt til en side som lar deg administrere ...

Redaktørens valg

Slik bruker du Eye-Fi med Evernote-dummies

Slik bruker du Eye-Fi med Evernote-dummies

Et selskap kalt Eye-Fi gjør det mulig å Koble kameraet ditt med Evernote, selv uten å koble kameraet til datamaskinen. Følg disse trinnene for å bruke Eye-Fi: Følg instruksjonene som følger med Eye-Fi-kortet for å konfigurere en Eye-Fi-konto. Sett inn Eye-Fi-kortet i kameraet. Slå på kameraet ditt. ...

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hele poenget med å lagre nyttig informasjon er for å kunne finne den senere. Tagging i Evernote er fundamentalt lik for alle plattformer og er ekstremt nyttig når du dash om å prøve å skrive inn notater på hvilken enhet du bruker på den tiden. For å lage en tagg for et notat på en datamaskin eller ...