Innholdsfortegnelse:
- Hva er en utdragsfil?
- De er slags. Utdragsfiler, enten i 1970-tallet, 1980-tallet, 1990-tallet, eller fortsatt i bruk i dag eksisterer av de samme grunnleggende grunnene til at et fullverdig datalager eller datamuseum gjør: å levere informasjon til tross for en rekke barrierer, for eksempel hardt -for å forstå datastrukturer, "ikke rør produksjonssystemet" -reglene, og mangelen på fler-fil eller multi-database kryssreferanse.
Video: Week 9, continued 2025
Din organisasjon har overveldende gunstige muligheter for å ha minst ett sort-data warehouse - et rapporteringssystem som gir informasjonsmuligheter og noen ganger analytiske evner til en eller flere grupper av brukere.
Hva er en utdragsfil?
Brukerne bruker sannsynligvis termen utdragsfil for å beskrive denne typen miljø fordi den er fylt ut av utdrag av data fra produksjonssystemer, i stedet for at brukerne blir tvunget til å utføre sine forespørsler eller motta sine rapporter fra operasjonelle produksjonsdatabaser eller -filer. Fortsatt interessert i å spille oddsen? Her er noen flere eksempler på typer datamiljøer som kan beskrives som sortering av datalager:
-
Selv om de hentede dataene nesten alltid er plassert i en enkelt fil eller database, kombinerer en fletteprosess trolig utvunnet data fra mer enn én applikasjonskilde.
-
Bare utvalgte elementer, ikke alle elementer fra alle tabeller eller filer, fra hver datakilde, blir vanligvis hentet og kopiert til ekstraktfilen.
-
En slags datakvalitetssikringsprosess går vanligvis på hvert trinn i veien, fra det første ekstraktet for å laste dataene i ekstraktfilen.
-
Noen kraftbrukere kan sannsynligvis utføre spørringer eller lage statistiske programmer (for eksempel i SAS eller SPSS) mot dataene, men mange brukere vil ikke trolig røre dataene direkte. I stedet mottar de sannsynligvis regelmessige rapporter som genereres enten automatisk eller som svar på deres forespørsler.
Visst høres det ut som et datalager, ikke sant? Virkeligheten er at disse sortene av datalagre vanligvis serverer en svært liten befolkning og ikke er gjort på en standard måte for å støtte bedriftens bredere behov. Du kan også koble dem til wanna be data warehouses.
Her er dikotomi av de fleste organisasjoner tilgang til data:Dataanalyse "har ikke":
-
Organisasjoner og enkeltpersoner som har få (og mer sannsynlig ingen) evner til å gjøre typen av analyse som kan gi informasjondrevet beslutningstaking Dataanalyse "haves":
-
Organisasjoner og enkeltpersoner som kanskje ikke har et datalagring oppe, men gjør noe med data som de kommer fra et sted. I mange tilfeller passer det til deres forretningsbehov helt fint. Hvorfor er ikke utdragsfiler vurdert å være datalager?
De er slags. Utdragsfiler, enten i 1970-tallet, 1980-tallet, 1990-tallet, eller fortsatt i bruk i dag eksisterer av de samme grunnleggende grunnene til at et fullverdig datalager eller datamuseum gjør: å levere informasjon til tross for en rekke barrierer, for eksempel hardt -for å forstå datastrukturer, "ikke rør produksjonssystemet" -reglene, og mangelen på fler-fil eller multi-database kryssreferanse.
Noen data warehousing fortalere hevder at kombinere og rekonfigurere data bare med det formål å generere rapporter eller å utføre statistisk analyse, er knapt et datalag i moderne mening. Utdragsfilene er ikke utstyrt med flerdimensjonale eller forretningsmessige evner, for eksempel drill-down og data-svingning.
Hvis du skiller data warehouse-siden (hva som kreves for å samle, flytte og omkonfigurere data fra en eller flere kilder) fra virksomhetsinformasjonssiden (hva du gjør med dataene etter at du har den tilgjengelig), bildet blir mye klarere.
Utdrag filer, eller hva du vil kalle dem, er veldig mye en del av barrierebryterfilosofien til et datalager. Mange av hva brukerne refererer til som "utdragsfiler", er filbaserte systemer (i stedet for bygget på databaser), og de er sannsynligvis ikke fleksible nok til å støtte ad hoc-spørring og dimensjonsanalyse. Men i virkeligheten tjener disse miljøene formålet med lagring av data for senere bruk.
For mange brukere har forretningsanalysemuligheter, for eksempel drill-down og data-svingning, liten eller ingen bruk - i hvert fall ikke i sammenheng med deres nåværende jobbdefinisjoner. Brukerens jobber krever funksjonalitet som disse ekstraktfilene kan levere, samt de statiske rapporter og statistisk analyse som er utført med dataene.
Historiens moral: Ikke gå inn i en organisasjon som effektivt bruker data gjennom utdragsfiler og utdyre på underlagene for datalagring. Vær i stedet forsiktig med å foreslå en datalagringsløsning som kan ses som et steg bakover. Hvis du gjør denne typen forslag, er du inne for en lang, humpete tur.
