Video: 05 SQL Server 2016 Enterprise Information Management (EIM) 2025
Omkring 1995 begynte leverandørene å posisjonere sin programvare som virtuelle datalagringsverktøy. Den grunnleggende forutsetningen var at det noen ganger ikke gir mening å kopiere og manipulere en haug med data, bare hvis noen trenger det. Hvorfor ikke få tilgang til data direkte fra kilden etter behov?
Ak, tilgang til data over et nettverk ved kilden har vist seg å være minst utfordrende for problemene ved å forsøke å levere en slags datalagring på stedet. De samme utfordringene som står overfor i et datalagringsmiljø (for eksempel å håndtere datakvalitet, bestemme hvilke typer transformasjoner som må skje, og velge hvordan man skal håndtere disse transformasjonene når ulike kilder er inkonsekvente) er fremdeles tilstede.
Bare fordi du kan få til data ved sin kilde (i nesten hvilken som helst database eller filstruktur) betyr det ikke at data gir den nødvendige forretningsinformasjonen når den er i dine hender.
For å løse disse datakvalitetsproblemene, har mange dataarkitekter begynt å utføre bunn-up data mart-konstruksjon for å utvikle et komponentbasert datalager. Snarere enn å ha en enkelt database der du mater alle data (opprette datalagret), håndterer en rekke komponenter hver enkelt et bestemt sett av funksjoner (for eksempel å svare på bestemte forretningsspørsmål) eller bestemte emner. Sammen inneholder disse dataarkmer (eller komponenter) et datalagringsmiljø.
Denne komponentbaserte, dynamiske tilgangsdataarkitekturen er grunnlaget for virtuell datalagring, og nærmere bestemt, hvilke Enterprise Information Integration (EII) servere tilbyr markedet.
Denne figuren viser et miljø der individuelle komponenter blir opprettet i datalagringsmiljøet i en nedre måte. I stedet for å kombinere komponentene i en stor database (og kopiere alle dataene på nytt), oppretter EII et datalagringsmiljø der brukerne kan få tilgang til hver komponents innhold fra et forretningsinformasjonsverktøy som de alle ble lagret sammen, selv om de ikke er.
Tenk på hvordan du bruker en nettleser på skrivebordet. Du klikker enten på en kobling eller skriver inn en bestemt nettadresse, og miljøet, som jobber bak kulissene, tar deg til riktig sted for innholdet du ba om. Forestill deg nå at Internett kjører mye raskere.
Når du går til forskjellige steder, får du ikke tilgang til annonser for den siste firehjulsdriften du har begått, sportspoeng, Dilbert-tegneserier, eller hva som helst annet du gjør på Internett.Du tar tilbake databiter som deretter kombineres og sendes tilbake til nettleseren din. Det er virtuell datalagring - det er akkurat som Internett!
Det er ikke lurt å bygge et virtuelt datalagringsmiljø for å få tilgang til kildedata direkte, i sitt eget format. Din utfordring er ikke å finne ut hvordan du går med på tversplattformdatabaser (kombinere IMS-data med DB2-data, for eksempel) og håndtere disse typer systemnivåtransformasjon, det sikrer at kvaliteten på dataene er høy og ikke krever Brukeren skal manuelt rense dataene.
Hver applikasjon bør derfor være lageraktivert og inneholde en datautgiver som er ansvarlig for alle mellomvaretjenestene (som utvinning og kvalitetssikring), som angitt i miljøets forretningsregler.
Datafortleggeren kunne tenkelig fungere nesten i sanntidsmodus, slik det måtte gjøres i en operativ datalager, eller det kan fungere i en periodisk (batch-orientert) modus hvis det ikke kreves øyeblikkelige oppdateringer. I denne situasjonen er datautgiveren et mini-middleware-produkt innebygd i applikasjonen (eller en tjeneste som er tilgjengelig av programmet).
Når du tenker på virtuell datalagring, erstatt spørsmålet "Kan jeg komme til dataene? "Med spørsmålet" Kan jeg komme til brukbare data? "Datautgiveren spiller en viktig rolle, og bør ikke overses.
Du kan heller ikke overse dataarkitekturen. Bare fordi du utvikler komponenter på en bunn-opp måte, og de blir tilgjengelige på plass, i stedet for å bli kopiert til en større datalagerdatabase, betyr ikke at du kan forsømme denne funksjonen.
Si at en komponent lagrer kundeidentifikasjoner som femsifrede tall etter at transformasjonen har oppstått, og inneholder kun kunder som har kjøpt kjøp de siste seks månedene. Og en annen komponent, som inneholder alle kunder som noensinne har kjøpt selskapets produkter, bruker alfanumeriske identifikatorer med syv tegn. I denne situasjonen kan det hende du har samme type feilmatchingsproblemer du ville hvis du fikk tilgang til data direkte fra kildene.
Selv om EII tillater forskjeller mellom komponentinnhold, må du forstå og administrere forskjellene slik at du ikke hindrer forretningsmessig oppgave.
