Hjem Personlig finansiering Ustrukturerte data i et stort datamiljø - dummier

Ustrukturerte data i et stort datamiljø - dummier

Innholdsfortegnelse:

Video: Hva er GDPR? 2025

Video: Hva er GDPR? 2025
Anonim

Ustrukturerte data er data som ikke følger et spesifisert format for store data. Hvis 20 prosent av dataene er tilgjengelige for bedrifter er strukturerte data, er de andre 80 prosent ustrukturert. Ustrukturerte data er egentlig de fleste dataene du vil møte. Inntil nylig støttet teknologien imidlertid ikke mye med det, unntatt å lagre det eller analysere det manuelt.

Kilder til ustrukturerte store data

Ustrukturerte data er overalt. Faktisk utfører de fleste enkeltpersoner og organisasjoner sine liv rundt ustrukturerte data. Akkurat som med strukturert data, er ustrukturert data enten maskingenerert eller menneskelig generert.

Her er noen eksempler på maskingenerert ustrukturert data:

  • Satellittbilder: Dette inkluderer værdata eller dataene som regjeringen fanger i satellittovervåkingsbildet. Bare tenk på Google Earth, og du får bildet.

  • Vitenskapelige data: Dette inkluderer seismiske bilder, atmosfæriske data og høy energi fysikk.

  • Fotografier og video: Dette inkluderer sikkerhet, overvåking og trafikkvideo.

  • Radar- eller sonardata: Dette inkluderer kjøretøy, meteorologiske og oceanografiske seismiske profiler.

Følgende liste viser noen få eksempler på menneskelig genererte ustrukturerte data:

  • Tekst internt til din bedrift: Tenk på all tekst innenfor dokumenter, logger, undersøkelsesresultater og e-post. Bedriftsinformasjon representerer faktisk en stor prosentandel av tekstinformasjonen i verden i dag.

  • Sosiale medier data: Denne data genereres fra sosiale medier plattformer som YouTube, Facebook, Twitter, LinkedIn og Flickr.

  • Mobildata: Dette inkluderer data som tekstmeldinger og plasseringsinformasjon.

  • Nettstedets innhold: Dette kommer fra alle nettsteder som leverer ustrukturert innhold, som YouTube, Flickr eller Instagram.

Og listen fortsetter.

Noen mener at begrepet ustrukturerte data er misvisende fordi hvert dokument kan inneholde sin egen spesifikke struktur eller formatering basert på programvaren som opprettet den. Men det som er internt i dokumentet er virkelig ustrukturert.

Ustrukturerte data er langt størst i data-ligningen, og brukstilfeller for ustrukturerte data ekspanderer raskt. På tekstsiden alene kan tekstanalyser brukes til å analysere ustrukturert tekst og å trekke ut relevante data og omforme dataene til strukturert informasjon som kan brukes på ulike måter.

For eksempel er et populært stort datautbruksomgang sosial mediaanalyse for bruk med høyt volumkunder. I tillegg analyseres ustrukturerte data fra anropssentral notater, e-post, skriftlige kommentarer i en undersøkelse og andre dokumenter for å forstå kundeadferd. Dette kan kombineres med sosiale medier fra titalls millioner kilder for å forstå kundeopplevelsen.

En CMS-rolle i stor datastyring

Organisasjoner lagrer noen ustrukturerte data i databaser. De bruker imidlertid også Enterprise Content Management Systems (CMS) som kan håndtere hele livsyklusen av innholdet. Dette kan inneholde webinnhold, dokumentinnhold og andre former for medier.

I henhold til Association for Information and Image Management (AIIM) består en ideell organisasjon som tilbyr utdanning, forskning og beste praksis, Enterprise Content Management (ECM) "strategier, metoder og verktøy som brukes til å fange, administrere, lagre, bevare og levere innhold og dokumenter relatert til organisatoriske prosesser. "Teknologiene som inngår i ECM inkluderer dokumentbehandling, rekordbehandling, bildebehandling, arbeidsflytbehandling, webinnholdshåndtering og samarbeid.

En hel bransje har vokst opp rundt å administrere innhold, og mange leverandører av innholdsforvaltning skaler ut sine løsninger for å håndtere store mengder ustrukturert data. Nye teknologier utvikles imidlertid også for å hjelpe til med å støtte ustrukturert data og analyse av ustrukturerte data. Noen av disse støtter både strukturert og ustrukturert data. Noen støtter sanntidsstrømmer. Disse inkluderer teknologier som Hadoop, MapReduce og streaming.

Systemer som er utformet for å lagre innhold i form av innholdsstyringssystemer, er ikke lenger frittstående løsninger. Snarere er det sannsynligvis de vil være en del av en samlet dataadministrasjonsløsning. For eksempel kan organisasjonen din overvåke Twitter-feeder som deretter kan programmere utløse et CMS-søk.

Nå har personen som utløste tweeten fått et svar tilbake som gir et sted hvor personen kan finne det produktet han eller hun kanskje leter etter. Den største fordelen er når denne typen interaksjon kan skje i sanntid. Det illustrerer også verdien av å utnytte sanntids ustrukturert, strukturert (kundedata om personen som tweeted) og semi-strukturert (det faktiske innholdet i CMS) -dataene.

Virkeligheten er at du sannsynligvis vil bruke en hybrid tilnærming til å løse dine store dataproblemer. For eksempel er det ikke fornuftig å flytte alt ditt nyhetsinnhold, for eksempel til Hadoop på stedet, fordi det skal hjelpe til med å håndtere ustrukturerte data.

Ustrukturerte data i et stort datamiljø - dummier

Redaktørens valg

Hvordan du samler ressurser i Minecraft - dummies

Hvordan du samler ressurser i Minecraft - dummies

Du kan samle ressurser på flere måter for Minecraft-strukturen - noen er mer effektiv enn andre. Her finner du noen forskjellige måter å samle materialer på for din struktur. Du har et par forskjellige alternativer når det gjelder gruvedrift. Hver har sine fordeler og ulemper, så det er opp til ...

Hvordan bygge Minecraft-kretser og -maskiner med Minecart-spor - dummier

Hvordan bygge Minecraft-kretser og -maskiner med Minecart-spor - dummier

Minecart og skinner er Minecraft-funksjoner ofte brukt til å transportere spillere. Men de kan også utføre mange mekaniske egenskaper bedre enn de vanlige redstone-elementene. Minecarts er enheter som kan rulle raskt langs minecartskinner. De kan svinge, gå opp og ned skråninger, og til og med spore (selv om de lider mye ...

Hvordan bygge din første Minecraft Garden - dummies

Hvordan bygge din første Minecraft Garden - dummies

Se hvordan du oppretter en vakker hage i Minecraft ved å planlegge riktig layout, få en rekke unike planter, og organisere plass.

Redaktørens valg

Markedet ditt mobilnettsted til media - dummies

Markedet ditt mobilnettsted til media - dummies

IPhone og iPad er varme emner i media i disse dager. Når du er ferdig med å designe nettstedet ditt for disse nye medieenhetene, ikke glem å markedsføre dem til tradisjonelle medier. Tiltrekke medieoppmerksomhet til mobilwebområdet ditt er ikke i motsetning til å tiltrekke det til noen annen virksomhet. Trikset er å fortelle et godt ...

Gjør skannede dokumenter søkbare og redigerbare - dummies

Gjør skannede dokumenter søkbare og redigerbare - dummies

Når du skanner et dokument direkte til en PDF-fil, Acrobat fanger all tekst og grafikk på hver side som om de alle var bare ett stort grafisk bilde. Dette er bra så langt det går, bortsett fra at det ikke går veldig langt fordi du ikke kan redigere eller søke i PDF-dokumentet ...

Markedet med SMS-meldinger - dummies

Markedet med SMS-meldinger - dummies

Lengden på SMS- begrenset til 160 tegn, så reklamemeldingen din må være kort og søt. Disse meldingene kan inneholde lenker til nettsteder eller klikk for å ringe meldinger: Du klikker på SMS, slik at telefonen ringer. SMS-kampanjer er mye enklere å håndtere enn ...

Redaktørens valg

Rediger, endre farge eller fjern Photoshop Shape Layers - dummies

Rediger, endre farge eller fjern Photoshop Shape Layers - dummies

Bruk formlag i Photoshop Creative Suite 5 når målet med designet ditt er å integrere vektormodeller og pikseldata sømløst. Når du har opprettet et formlag, kan du redigere formen, endre fargen eller fjerne laget helt. Rediger en form Som Adobe Illustrator, gir Photoshop både et valg av sti ...

Oppdag Photoshops malerverktøy - dummies

Oppdag Photoshops malerverktøy - dummies

Ingenting i Photoshop CC gir deg mer presis kontroll over fargen i bildet ditt enn ved bruk av blyantpenningen verktøy med en 1-piks pensel. Husk at bildet ditt består av mange småfargede firkanter (piksler), og at fargen på de enkelte firkantene er det som gir utseendet til et tre eller et ...

Forbedre portretter i Photoshop CC - dummier

Forbedre portretter i Photoshop CC - dummier

Forbedre detaljer som å avklare motivets briller i Photoshop CC kan hjelpe bildene dine og portretter ser det mye bedre ut. Whitening tennene er et annet godt triks for å lyse opp bildene dine. Deklarende briller i Photoshop Eyeglasses kan være fotografens mareritt! Refleksjonene fra glass er vanligvis spekulative høydepunkter - det vil si områder av ren ...