Innholdsfortegnelse:
- Regnearkrapporter sørger for ineffektive datamodeller
- Flate datafiler låne seg pent til datamodeller
- Tabelldatasett er perfekt for pivottabeldrevne datamodeller
Video: Data Modul - ein AHA!Video 2025
Som byggeplass for Excel-rapportene dine må dataene i datamodellene være strukturert på riktig måte. Ikke alle datasett er skapt like. Selv om enkelte datasett fungerer i et standard Excel-miljø, fungerer de kanskje ikke for datamodelleringsformål. Før du bygger datamodellen, må du kontrollere at kildedataene dine er riktig strukturert for dashboarding.
Risikoen for overforenkling, datasett som vanligvis brukes i Excel, kommer i tre grunnleggende former:
-
Regnearkrapporten
-
Den flate datafilen
-
Tabelldatasettet
Stempellinjen er at bare flate datafiler og tabulære datasett gir effektive datamodeller.
Regnearkrapporter sørger for ineffektive datamodeller
Regnearkrapporter viser svært formatert, oppsummert data og er ofte utformet som presentasjonsverktøy for ledelse eller ledende brukere. En typisk regnearkrapport gjør tilstrekkelig bruk av tomt rom for formatering, gjentar data for estetiske formål, og presenterer kun høyt nivåanalyse. Følgende figur illustrerer en regnearkrapport.
Selv om en regnearkrapport kan se bra ut, er det ikke en effektiv datamodell. Hvorfor? Den primære årsaken er at disse rapportene ikke gir deg adskillelse av data, analyse og presentasjon. Du er egentlig låst inn i en analyse.
Selv om du kunne lage diagrammer fra rapporten som vises, ville det være upraktisk å bruke noen analyser utenfor det som allerede er der. For eksempel, hvordan ville du beregne og presentere gjennomsnittet av alt sykkel salg ved hjelp av denne rapporten? Hvordan ville du beregne en liste over de ti beste markedene?
Med dette oppsettet blir du tvunget til svært manuelle prosesser som er vanskelige å vedlikeholde måned etter måned. Enhver analyse utenfor de høye nivåene som allerede er i rapporten, er grunnleggende i beste fall - selv med fancy formler. Videre, hva skjer når du må vise sykkel salg i måneden? Når datamodellen din krever analyse med data som ikke er i regnearkrapporten, må du søke etter et annet datasett.
Flate datafiler låne seg pent til datamodeller
En annen type filformat er en flatfil. Flatfiler er datalager plassert etter rad og kolonne. Hver rad tilsvarer et sett med dataelementer, eller en post. Hver kolonne er et -felt. Et felt svarer til et unikt dataelement i en plate. Følgende figur inneholder de samme dataene som forrige rapport, men uttrykt i et flatt datafilformat.
Merk at hvert datafelt har en kolonne, og hver kolonne tilsvarer ett dataelement. Videre er det ingen ekstra avstand, og hver rad (eller plate) tilsvarer et unikt sett med informasjon. Men nøkkelattributtet som gjør dette til en flatt fil, er at ingen enkeltfelt identifiserer en plate. Faktisk må du angi fire separate felt (Region, marked, virksomhetssegment og en måneds salgsbeløp) før du kunne identifisere posten unikt.
Flatfiler låne seg pent til datamodellering i Excel, fordi de kan være detaljerte nok til å holde dataene du trenger, og fremdeles bidrar til et bredt utvalg av analyser med enkle formler - SUM, AVERAGE, VLOOKUP og SUMIF, bare for å nevne noen.
Tabelldatasett er perfekt for pivottabeldrevne datamodeller
Mange effektive datamodeller drives primært av pivottabeller. Pivottabeller er Excels fremste analyseverktøy. For de som har brukt pivottabeller, vet du at de gir en utmerket måte å oppsummere og forme data til bruk ved å rapportere komponenter, for eksempel diagrammer og tabeller.
Tabell datasett er ideelle for pivottabell-drevne datamodeller. Følgende figur illustrerer et tabulært datasett. Vær oppmerksom på at den primære forskjellen mellom et tabulært datasett og en flat datafil er at i kolonnedatasettene ikke doble kolonnemerkene som faktiske data. For eksempel inneholder kolonnen Salgsperiode månedsidentifikatoren. Denne subtile forskjellen i strukturen er det som gjør tabellære datasett optimale datakilder for pivottabeller. Denne strukturen sikrer at viktige svingtabellfunksjoner, for eksempel sortering og gruppering, fungerer som de skal.
Attributtene til et tabulært datasett er som følger:
-
Den første raden i datasettet inneholder feltetiketter som beskriver informasjonen i hver kolonne.
-
Kolonnetikettene trekker ikke dobbeltpliktige som dataelementer som kan brukes som filtre eller spørrekriterier (for eksempel måneder, datoer, år, regioner eller markeder).
-
Det finnes ingen tomme rader eller kolonner - hver kolonne har en overskrift, og en verdi er i hver rad.
-
Hver kolonne representerer en unik kategori av data.
-
Hver rad representerer individuelle elementer i hver kolonne.
