Hjem Personlig finansiering Endre Business Intelligence-produkter til å håndtere store data - dummies

Endre Business Intelligence-produkter til å håndtere store data - dummies

Innholdsfortegnelse:

Video: The Third Industrial Revolution: A Radical New Sharing Economy 2024

Video: The Third Industrial Revolution: A Radical New Sharing Economy 2024
Anonim

Tradisjonelle forretningsinformasjonsprodukter var ikke egentlig designet for å håndtere store data, slik at de kanskje krever noen endringer. De ble designet for å jobbe med svært strukturerte, velforståtte data, ofte lagret i et relasjonsdatabase og vist på skrivebordet eller datamaskinen. Denne tradisjonelle business intelligence-analysen brukes vanligvis på stillbilder av data i stedet for hele mengden data tilgjengelig. Hva er forskjellig med stor dataanalyse?

Stor datadata

Store data består av strukturert, halvstrukturert og ustrukturert data. Du har ofte mye av det, og det kan være ganske komplisert. Når du tenker på å analysere det, må du være oppmerksom på de potensielle egenskapene til dataene dine:

  • Det kan komme fra usikre kilder. Stor dataanalyse innebærer ofte å aggregere data fra ulike kilder. Disse kan omfatte både interne og eksterne datakilder. Hvor pålitelige er disse eksterne kildene til informasjon? For eksempel, hvor pålitelig er sosiale medier data som en tweet? Informasjonen kan komme fra en ubekreftet kilde. Integriteten til disse dataene må vurderes i analysen.

  • Det kan være skittent. Skitne data refererer til unøyaktige, ufullstendige eller feilaktige data. Dette kan inkludere feilstaving av ord; en sensor som er ødelagt, ikke riktig kalibrert eller ødelagt på noen måte; eller til og med dupliserte data. Dataforskere diskuterer hvor de skal rense dataene - enten nær kilden eller i sanntid.

    Selvfølgelig sier en tankegang at de skitne dataene ikke bør rengjøres i det hele tatt fordi det kan inneholde interessante utjevninger. Rensestrategien vil trolig avhenge av kilden og typen data og målet med analysen. For eksempel, hvis du utvikler et spamfilter, er målet å oppdage de dårlige elementene i dataene, slik at du ikke vil rengjøre det.

  • Signal / støyforholdet kan være lavt. Med andre ord kan signalet (brukbar informasjon) bare være en liten prosentandel av dataene; støyen er resten. Å være i stand til å trekke ut et lite signal fra støyende data, er en fordel for store dataanalyser, men du må være oppmerksom på at signalet faktisk kan være lite.

  • Det kan være sanntid. I mange tilfeller prøver du å analysere sanntids datastrømmer.

Stor datastyring skal være en viktig del av analysekvasjonen. Under forretningsanalyser må forbedringer gjøres for styringsløsninger for å sikre sannheten som kommer fra de nye datakildene, særlig fordi de kombineres med eksisterende pålitelige data lagret i et lager.Datasikkerhet og personvernløsninger må også forbedres for å støtte styring / styring av store data lagret i ny teknologi.

Analytiske store datalgoritmer

Når du vurderer stor dataanalyse, må du være klar over at når du strekker seg utover skrivebordet, må algoritmene du bruker ofte bli refactored, endre intern kode uten å påvirke ekstern funksjon. Skjønnheten i en stor datainfrastruktur er at du kan kjøre en modell som pleide å ta timer eller dager i minutter.

Dette lar deg gjenta på modellen hundrevis av ganger over. Hvis du imidlertid kjører en regresjon på en milliard rader med data over et distribuert miljø, må du vurdere ressursbehovene knyttet til volumet av data og dets plassering i klyngen. Dine algoritmer må være databevisste.

I tillegg begynner leverandørene å tilby nye analyser designet for å bli plassert nær de store datakilder for å analysere data på plass. Denne tilnærmingen med å kjøre analytikk nært til datakildene, minimerer mengden lagrede data ved bare å beholde dataene med høy verdi. Det gjør det også mulig å analysere dataene før, noe som er kritisk for beslutningstaking i sanntid.

Selvfølgelig vil analysene fortsette å utvikle seg. For eksempel kan det hende du trenger real-time visualiseringsfunksjoner for å vise sanntidsdata som kontinuerlig endres. Hvordan plotter du praktisk talt en milliard poeng på en grafplot? Eller, hvordan jobber du med de prediktive algoritmer slik at de utfører raskt nok og dyp nok analyse for å utnytte et stadig voksende, komplekst datasett? Dette er et område med aktiv forskning.

Støtte for stor datainfrastruktur

Det er nok å si at hvis du leter etter en plattform, må den oppnå følgende:

  • Integrere teknologier: Infrastrukturen trenger å integrere nye store datateknologier med tradisjonell teknologi for å kunne behandle alle slags store data og gjøre det forbrukbart av tradisjonelle analyser.

  • Lag store mengder forskjellig data: Det kan være nødvendig med et bedriftsherdet Hadoop-system som kan behandle / lagre / administrere store mengder data i ro, enten det er strukturert, halvstrukturert eller ustrukturert.

  • Prosessdata i bevegelse: Det kan være nødvendig med en strømkompatibilitet for å behandle data i bevegelse som kontinuerlig genereres av sensorer, smarte enheter, video, lyd og logger for å støtte beslutningstaking i sanntid.

  • Lagerdata: Det kan hende du trenger en løsning optimalisert for operasjonelle eller dype analytiske arbeidsbelastninger for å lagre og administrere de voksende mengdene pålitelige data.

Og selvfølgelig trenger du muligheten til å integrere dataene du allerede har på plass sammen med resultatene av den store dataanalysen.

Endre Business Intelligence-produkter til å håndtere store data - dummies

Redaktørens valg

Hvordan å stable og gruppereformer i Word 2013 - dummies

Hvordan å stable og gruppereformer i Word 2013 - dummies

Enkeltformer kan noen ganger være nyttige i en dokument, men den virkelige kraften til Word 2013's Shapes-funksjonen kan bli funnet ved å kombinere figurer for å lage mer komplekse tegninger og logoer. Du kan stable formene oppå hverandre og kontrollere rekkefølgen de vises i stakken. Når du har ...

Hvordan du angir punktavstand i Word 2013 - dummies

Hvordan du angir punktavstand i Word 2013 - dummies

Word 2013 lar deg legge til "luft" til plass før eller etter eller i midten av avsnittene dine. I midten av avsnittet har du linjeavstand. Før og etter avsnittet kommer punktavstand. Hvordan sette linjeavstanden Endre linjeavstanden legger til ekstra mellomrom mellom alle tekstlinjer ...

Slik starter du et nytt dokument i Word 2007 - dummies

Slik starter du et nytt dokument i Word 2007 - dummies

Starter et nytt dokument i Word 2007 er lett. Hvis du nettopp har startet Word 2007 og vil åpne et tomt dokument, kan du følge tre enkle trinn.

Redaktørens valg

Slik oppretter du en AWS Administrator User - Dummies

Slik oppretter du en AWS Administrator User - Dummies

Opprett Administrator-gruppen er det første trinnet for å sikre at din AWS (Amazon Web Services) -kontoen er fortsatt trygg. Det neste trinnet er å opprette en konto for deg selv og tilordne den til administratorgruppen, slik at du har full tilgang til de administrative funksjonene i din AWS-konto. Følgende trinn beskriver hvordan ...

Vurderer AWS-støttede plattformer - dummies

Vurderer AWS-støttede plattformer - dummies

Hvis du ikke har behandlet AWS eller skyen ennå, du kan være fristet til å tenke på plattformer som en bestemt kombinasjon av gjenstander. For eksempel, når du ser ditt eget lokale oppsett, har du en server som kjører et bestemt operativsystem og har et bestemt sett med maskinvareressurser. Systemet har en bestemt ...

Lage skuffer på Amazon Web Services - dummies

Lage skuffer på Amazon Web Services - dummies

Når du er den stolte eieren av Amazon Web Services (AWS ) konto, det er på tide å gjøre noe nyttig, som å lage en bøtte. Start med å sjekke ut dine S3-ressurser. For å gjøre det, klikk S3-lenken på startsiden for AWS Management Console, som vist her: Du er tatt til en side som lar deg administrere ...

Redaktørens valg

Slik bruker du Eye-Fi med Evernote-dummies

Slik bruker du Eye-Fi med Evernote-dummies

Et selskap kalt Eye-Fi gjør det mulig å Koble kameraet ditt med Evernote, selv uten å koble kameraet til datamaskinen. Følg disse trinnene for å bruke Eye-Fi: Følg instruksjonene som følger med Eye-Fi-kortet for å konfigurere en Eye-Fi-konto. Sett inn Eye-Fi-kortet i kameraet. Slå på kameraet ditt. ...

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hele poenget med å lagre nyttig informasjon er for å kunne finne den senere. Tagging i Evernote er fundamentalt lik for alle plattformer og er ekstremt nyttig når du dash om å prøve å skrive inn notater på hvilken enhet du bruker på den tiden. For å lage en tagg for et notat på en datamaskin eller ...