Hjem Personlig finansiering Strukturert data i et stort datamiljø - dummies

Strukturert data i et stort datamiljø - dummies

Innholdsfortegnelse:

Video: Introduction to Data Highlighter 2024

Video: Introduction to Data Highlighter 2024
Anonim

Begrepet strukturert data refererer generelt til data som har en definert lengde og format for store data. Eksempler på strukturerte data inkluderer tall, datoer og grupper av ord og tall som heter strenger . De fleste eksperter er enige om at denne typen data står for om lag 20 prosent av dataene der ute. Strukturerte data er de dataene du sannsynligvis er vant til å håndtere. Den lagres vanligvis i en database.

Kilder til strukturerte store data

Selv om dette kan virke som vanlig som vanlig, tar strukturerte data i realiteten en ny rolle i verden med store data. Utviklingen av teknologi gir nye kilder til strukturerte data som blir produsert - ofte i sanntid og i store mengder. Datakildene er delt inn i to kategorier:

  • Datamaskin- eller maskingenerert: Maskingenerert data refererer generelt til data som er opprettet av en maskin uten menneskelig inngrep.

  • Menneskegenerert: Dette er data som mennesker, i samspill med datamaskiner, leverer.

Noen eksperter hevder at det finnes en tredje kategori som er en hybrid mellom maskin og menneske. Her er vi imidlertid opptatt av de to første kategoriene.

Maskingenererte strukturerte data kan omfatte følgende:

  • Sensordata: Eksempler inkluderer radiofrekvens ID-koder, smart meter, medisinske enheter og Global Positioning System-data. Bedrifter er interessert i dette for supply chain management og inventar kontroll.

  • webloggdata: Når servere, applikasjoner, nettverk og så videre opererer, fanger de alle slags data om deres aktivitet. Dette kan utgjøre store datamengder som kan være nyttige, for eksempel å håndtere avtaler på servicenivå eller for å forutsi sikkerhetsbrudd.

  • Salgsdata: Når kassereren svinger strekkoden til et produkt du kjøper, genereres alle dataene som er knyttet til produktet.

  • Finansdata: Mange finansielle systemer er nå programmatiske; de drives basert på forhåndsdefinerte regler som automatiserer prosesser. Stock-trading data er et godt eksempel på dette. Den inneholder strukturerte data som selskapssymbolet og dollarverdien. Noen av disse dataene er maskingenerert, og noen er menneskelig generert.

Eksempler på strukturerte menneskelige genererte data kan inneholde følgende:

  • Inndata: Dette er et hvilket som helst data som et menneske kan legge inn i en datamaskin, for eksempel navn, alder, inntekt, ikke-fri -form undersøkelsen svar, og så videre. Disse dataene kan være nyttige for å forstå grunnleggende kundeadferd.

  • Click-stream data: Data genereres hver gang du klikker en kobling på et nettsted. Disse dataene kan analyseres for å bestemme kundeadferd og kjøpsmønstre.

  • Gaming-relaterte data: Alle bevegelser du lager i et spill kan spilles inn. Dette kan være nyttig for å forstå hvordan sluttbrukerne beveger seg gjennom en spillportefølje.

Når sammen med millioner av andre brukere sender den samme informasjonen, er størrelsen astronomisk. I tillegg har mye av disse dataene en sanntidskomponent til den som kan være nyttig for å forstå mønstre som har potensial til å forutsi utfall.

Bunnlinjen er at denne typen informasjon kan være kraftig og kan benyttes til mange formål.

Relasjonelle databasers rolle i store data

Data utholdenhet refererer til hvordan en database beholder versjoner av seg selv når den endres. Den store granddaddy av vedvarende datalager er relationsdatabasebehandlingssystemet . I sin barndom brukte databehandlingsindustrien hva som nå anses primitive teknikker for persistens av data.

Relasjonsmodellen ble oppfunnet av Edgar Codd, en IBM-forsker, på 1970-tallet, og ble brukt av IBM, Oracle, Microsoft og andre. Det er fortsatt i stor bruk i dag og spiller en viktig rolle i utviklingen av store data. Forstå relasjonsdatabasen er viktig fordi andre typer databaser brukes med store data.

I en relasjonsmodell lagres dataene i en tabell. Denne databasen vil inneholde et skjema - det vil si en strukturell representasjon av det som finnes i databasen. For eksempel definerer skjemaet i en relasjonsdatabase tabellene, feltene i tabellene og forholdene mellom de to.

Dataene lagres i kolonner, en hver for hvert bestemt attributt. Dataene lagres også i raden. Den første tabellen lagrer produktinformasjon; den andre lagrer demografisk informasjon. Hver har ulike egenskaper. Hver tabell kan oppdateres med nye data, og data kan slettes, leses og oppdateres. Dette oppnås ofte i en relasjonsmodell ved hjelp av et strukturert søkspråk (SQL).

Et annet aspekt av relasjonsmodellen ved hjelp av SQL er at tabellene kan forespørres ved hjelp av en fellesnøkkel. Den fellesnøkkelen i tabellene er CustomerID.

Du kan sende inn en forespørsel, for eksempel for å bestemme kjønn av kunder som kjøpte et bestemt produkt. Det kan se slik ut:

Velg CustomerID, Stat, Kjønn, Produkt fra "Demografisk tabell", "Produkttabell" der Produkt = XXYY
Strukturert data i et stort datamiljø - dummies

Redaktørens valg

Hvem er St. Patrick og hvorfor feirer vi St. Patrick's Day? - dummies

Hvem er St. Patrick og hvorfor feirer vi St. Patrick's Day? - dummies

Hvert 17. mars tusenvis av mennesker danner deres grønneste garn, marsjerer i irske stolthistorier, spiser grønnkløverformet informasjonskapsler og quaff frosty krus av grønn øl til feiring av St. Patrick's Day. Men vet du virkelig hvem St. Patrick var og hvorfor han ble feiret? Patrick ble født i AD 387 like sør for ...

Hvem er St. Paul? - dummies

Hvem er St. Paul? - dummies

Kjent før hans konvertering til kristendommen som Saul av Tarsus, er Paulus sannsynligvis den mest nevnte i alle de nye testamente skrifter - 14 av de 27 bøkene i Det nye testamente er tilskrevet hans navn. Mens han skrev ingen evangelium, skrev han pastorale brev til tidlige kristne samfunn med en beskjed ...

Hvem er St. Philip? - dummies

Hvem er St. Philip? - dummies

Lite er kjent om St. Philip i katolicismen, annet enn han var sammen med de andre 11 apostlene til nadverden, for himmelfart og til pinsedag. Galilea (første århundre ad-ad 80) Patron: pastry kokker, jockeys og ryttere, Uruguay, Luxembourg Feastedag: 3. mai En galileer fra Bethsaida, Philip var sannsynligvis en disippel av John ...

Redaktørens valg

Hvordan du kontrollerer e-postmeldinger du mottar fra Ning-dummies

Hvordan du kontrollerer e-postmeldinger du mottar fra Ning-dummies

E-post er en av de blandede velsignelsene. Du må være takknemlig for det, men det kan være en skam når det er ute av kontroll. Heldigvis gir nettverk på Ning deg veldig fin kontroll over hvilke e-poster du mottar. For å begynne å administrere varsler, varsler og medlemsaktivitet, klikk på Innstillinger-koblingen øverst til høyre for ...

Hvordan du oppretter ditt Ning-nettverks vilkår for bruk - dummies

Hvordan du oppretter ditt Ning-nettverks vilkår for bruk - dummies

For å hjelpe administratorer og å stille opp retningslinjer for hva som er og hva som ikke er akseptabelt atferd av medlemmer, må du opprette bruksvilkår for nettverket ditt. Vilkårene for bruk du oppretter for nettverket ditt, bør ikke endre eller erstatte Nings brukervilkår. Dette er noe du godtar når du registrerer ...

Hvordan du kontrollerer dine Ning-personverninnstillinger - dummies

Hvordan du kontrollerer dine Ning-personverninnstillinger - dummies

Personvern er viktig på Ning, som på alle andre online samfunnet. Ning tilbyr deg en rekke måter å begrense informasjonen andre kan se, og du kan også kontrollere hvilken informasjon du legger til på din Ning-konto. På siden Min Innstillinger - Profil på Ning-kontoen din (som du får tilgang til ved å klikke på ...

Redaktørens valg

RDBMSs i et Big Data Environment - dummies

RDBMSs i et Big Data Environment - dummies

Store data blir et viktig element i hvordan organisasjonene bruker høy -volumdata med riktig hastighet for å løse spesifikke dataproblemer. Relasjonsdatabasebehandlingssystemer er viktige for dette høye volumet. Store data lever ikke isolert. For å være effektive må bedrifter ofte kombinere resultatene av ...

Seks leverandører med mellomvareprodukter for datalagring - dummies

Seks leverandører med mellomvareprodukter for datalagring - dummies

Det finnes flere leverandører som tilbyr data warehousing mellomvareprodukter du vil kanskje se på. Her er syv som er verdt å vurdere. Composite Software Composite Software gir produkter og teknologi for Enterprise Information Integration (EII). Ved å bruke Composite kan du få tilgang til og kombinere data fra forskjellige datakilder, inkludert pakkede applikasjoner som ...

Strukturert data i et stort datamiljø - dummies

Strukturert data i et stort datamiljø - dummies

Begrepet strukturert data refererer generelt til data som har en definert lengde og format for store data. Eksempler på strukturerte data inkluderer tall, datoer og grupper av ord og tall som kalles strenger. De fleste eksperter er enige om at denne typen data står for om lag 20 prosent av dataene der ute. Strukturert data ...