Innholdsfortegnelse:
- Stor datahistorikk: RDBMS og vedvarende data
- Stor datahistorikk: RDBMS og tabeller
- PostgreSQL, en open source relasjonsdatabase
Video: SQL vs NoSQL or MySQL vs MongoDB 2025
Store data blir et viktig element i hvordan organisasjoner bruker høyvolumsdata til riktig hastighet for å løse bestemte data problemer. Relasjonsdatabasebehandlingssystemer er viktige for dette høye volumet. Store data lever ikke isolert. For å være effektive må bedrifter ofte kombinere resultatene av stor dataanalyse med dataene som finnes i virksomheten.
Stor datahistorikk: RDBMS og vedvarende data
En av de viktigste tjenestene fra operative databaser (også kalt datalager ) er utholdenhet. Persistens garanterer at data lagret i en database ikke vil bli endret uten tillatelser, og at den vil bli tilgjengelig så lenge det er viktig for virksomheten. Hvilken god er en database hvis den ikke kan stole på å beskytte dataene du legger inn i den?
Gitt dette viktige kravet, må du da tenke på hva slags data du vil fortsette, hvordan kan du få tilgang til og oppdatere den, og hvordan kan du bruke den til å ta forretningsbeslutninger. På dette mest grunnleggende nivået er valg av databasemotorer avgjørende for din overordnede suksess med din store dataimplementering.
Selv om den underliggende teknologien har eksistert lenge, er mange av disse systemene i drift i dag, fordi bedriftene de støtter er svært avhengige av dataene. For å erstatte dem ville det være lurt å endre motorene til et fly på en transoceanisk flytur.
Stor datahistorikk: RDBMS og tabeller
Relasjonsdatabaser er bygd på ett eller flere relasjoner og er representert av tabeller. Disse tabellene er definert av sine kolonner, og dataene lagres i radene. Hovednøkkelen er ofte den første kolonnen i tabellen. Konsistensen av databasen og mye av dens verdi oppnås ved å "normalisere" dataene. Normaliserte data er konvertert fra eget format til et delt, avtalt format.
For eksempel i en database kan du ha "telefon" som XXX-XXX-XXXX mens du er i en annen, kan det være XXXXXXXXX. For å få en konsekvent visning av informasjonen, må feltet normaliseres til en annen form. Det finnes fem nivåer av standarder for normalisering. Valget av vanlig form er ofte henvist til databasedesigneren. Samlingen av tabeller, nøkler, elementer og så videre er kjent som databasen skjema.
Gjennom årene har det strukturerte søkspråket (SQL) utviklet seg i låsestrøm med RDBMS-teknologi og er den mest brukte mekanismen for å lage, spørre, vedlikeholde og operere relasjonsdatabaser.
I bedrifter både små og store, er de fleste av deres viktige operasjonsinformasjon sannsynligvis lagret i RDBMSs. Mange selskaper har forskjellige RDBMSer for ulike områder av deres virksomhet. Transaksjonsdata kan lagres i en leverandørs database, mens kundeinformasjon kan lagres i en annen.
Det er ikke sannsynlig at du vil bruke RDBMSs for kjernen i implementeringen, men du må stole på dataene lagret i RDBMSs for å skape det høyeste nivået av verdi for virksomheten med store data.
PostgreSQL, en open source relasjonsdatabase
Under din store dataimplementasjon kommer du sannsynligvis på PostgreSQL, en utbredt, åpen kildekode relasjonsdatabase. Flere faktorer bidrar til populariteten til PostgreSQL. Som en RDBMS med støtte for SQL-standarden, gjør det alt som forventes i et databaseprodukt, i tillegg til dets levetid og bred bruk har gjort det "kamptestet. "Det er også tilgjengelig på omtrent alle typer operativsystem, fra PCer til mainframes.
Å gi det grunnleggende og å gjøre det pålitelig er bare en del av historien. PostgreSQL støtter også mange funksjoner som bare finnes i dyre proprietære RDBMSer, inkludert følgende:
-
Mulighet til å håndtere "objekter" direkte i relasjonsskjemaet
-
Utenlandske nøkler (referanse nøkler fra ett bord til et annet)
-
Utløsere brukes til å starte en lagret prosedyre automatisk)
-
Komplekse spørringer (subqueries og tilknytning til diskrete tabeller)
-
Transaksjonell integritet
-
Multiversion samtidighetskontroll
PostgreSQLs virkelige kraft er dens utvidbarhet. Brukere og databaseprogrammerere kan legge til nye evner uten å påvirke den grunnleggende operasjonen eller påliteligheten til databasen. Mulige utvidelser inkluderer
-
Datatyper
-
Operatører
-
Funksjoner
-
Indekseringsmetoder
-
Prosessale språk
Dette høye tilpasningsnivået gjør PostgreSQL ønskelig når stive, proprietære produkter ikke vil få jobben gjort. Det er uendelig tett.
Endelig tillater PostgreSQL-lisensen endring og distribusjon i hvilken som helst form, åpen eller lukket kilde. Eventuelle endringer kan holdes private eller deles med samfunnet som du ønsker.
