Hjem Personlig finansiering Sikre kvaliteten på innkommende eksterne data - dummies

Sikre kvaliteten på innkommende eksterne data - dummies

Video: The Vietnam War: Reasons for Failure - Why the U.S. Lost 2024

Video: The Vietnam War: Reasons for Failure - Why the U.S. Lost 2024
Anonim

Når du designer et datalager og bestemmer hvilke eksterne data du trenger, plasserer du bare en bestilling (som å bestille klær eller en fruktkurv fra et nettsted). Når du begynner å motta data via en strøm, filoverføring eller på annen måte, er det jevnt seiling - eller er det?

Hva med kvaliteten på innkommende data? Du må absolutt bruke samme sett med kvalitetssikringsprosedyrer til eksternt oppgitte data som du gjør til data som kommer fra dine egne interne systemer. Bare fordi du kjøper informasjonen på det åpne markedet, garanterer du ikke at dataene er feilfrie.

Bruk QA-prosedyrer til hver innkommende gruppe data ved å følge disse trinnene:

  1. Finn ut om innkommende data har kontrollverdier som er lagt til filene.

    Noen eksempler på kontrollverdier er antall poster i hver fil, summen av hver tallkolonne (total salgsdoll for alle poster og totale enheter solgt for alle poster, for eksempel) og delsett av de totale kolonnverdiene (totalt antall salg og enheter etter stat, for eksempel).

    Hvis sjekkverdiene er oppgitt, må de lagres og brukes som en del av end-to-end-lastingsprosedyrene. Ingen bør offisielt oppdatere varehusets innhold til sjekken totalt er enig med beregningene du gjorde da du forberedte dataene for lasting.

  2. Hvis ingen kontrollverdier er oppgitt, be om dem.

    Selv om forespørselen kan ta noen sykluser (for noen få uker eller måneder, for eksempel) for å fylle, tar enhver datoperatør som er interessert i å tilby høyt kundeservice, denne typen forespørsel seriøst og forsøker å gjøre den forespurte kontrollinformasjonen tilgjengelig.

  3. Under lastingsprosedyrene filtrerer du hver rad.

    Kontroller at følgende betingelser er oppfylt:

    1. Keys (unike identifikatorer for hver post) er korrekte på tvers av all informasjon. For eksempel, hvis hver post i SalesMasterRecord-gruppen av data må ha nøyaktig 12 relaterte poster i SalesDetailRecord (en for hver måned), må du kontrollere at alle detaljrekordene er til stede ved å sammenligne rekordnøkkelverdier.

    2. Verdier er riktige. Produktsalg per måned, for eksempel, må være innenfor rimelige grenser for den typen produkt (for eksempel fly er forskjellig fra bolter).

    3. Manglende felt av informasjon (en sannsynlig - nesten uunngåelig - forekomst med eksternt oppgitte data) forvrenger ikke betydningen av innkommende data.

      Selv om fraværet av tilleggsdata (definert i henhold til forretningsreglene for din spesifikke bransje eller organisasjon) kanskje ikke er for alvorlig et problem, hvis halvparten av innkommende poster har et tomrom der UnitsSold, TotalSalesPrice, eller annen kritisk type informasjon skal være, er verdien av dataene best i tvil.

    4. Bruk de analytiske verktøyene som beskrevet i kapittel 10, spesielt i de tidlige stadiene for å skaffe eksterne data (for eksempel de første tre eller fire månedene) for å utføre datakvalitetsanalyse før brukerne bruker de samme verktøyene for å utføre forretninger analyse.

      Søk etter oddities, uregelmessigheter, unnvikende resultater, inkonsekvenser, tilsynelatende paradokser og alt annet som bare ser rart ut. Deretter drar du ned til dataens røtter for å se etter kilden til den rare.

      Husk at du sannsynligvis arbeider med mange millioner rader med innkommende data: I tillegg til at du ikke kan sjekke ut hver enkelt rad, kan det hende du har problemer med å sette opp filtrering og QA-kontrollkriterier for alle mulige forhold.

      Alle som noensinne har gjort noe med eksternt oppgitte kildedata, har kommet over alle slags merkelige inkonsekvenser og mangler data i den innkommende informasjonen. Ved å sette deg selv i stedet for brukerne og bruke de samme verktøyene de bruker, kan du sannsynligvis oppdage en ting eller to som du kan rette, noe som gjør datalagret ditt en mye bedre lagring av verdifull forretningsinformasjon.

Sikre kvaliteten på innkommende eksterne data - dummies

Redaktørens valg

Hvordan å stable og gruppereformer i Word 2013 - dummies

Hvordan å stable og gruppereformer i Word 2013 - dummies

Enkeltformer kan noen ganger være nyttige i en dokument, men den virkelige kraften til Word 2013's Shapes-funksjonen kan bli funnet ved å kombinere figurer for å lage mer komplekse tegninger og logoer. Du kan stable formene oppå hverandre og kontrollere rekkefølgen de vises i stakken. Når du har ...

Hvordan du angir punktavstand i Word 2013 - dummies

Hvordan du angir punktavstand i Word 2013 - dummies

Word 2013 lar deg legge til "luft" til plass før eller etter eller i midten av avsnittene dine. I midten av avsnittet har du linjeavstand. Før og etter avsnittet kommer punktavstand. Hvordan sette linjeavstanden Endre linjeavstanden legger til ekstra mellomrom mellom alle tekstlinjer ...

Slik starter du et nytt dokument i Word 2007 - dummies

Slik starter du et nytt dokument i Word 2007 - dummies

Starter et nytt dokument i Word 2007 er lett. Hvis du nettopp har startet Word 2007 og vil åpne et tomt dokument, kan du følge tre enkle trinn.

Redaktørens valg

Slik oppretter du en AWS Administrator User - Dummies

Slik oppretter du en AWS Administrator User - Dummies

Opprett Administrator-gruppen er det første trinnet for å sikre at din AWS (Amazon Web Services) -kontoen er fortsatt trygg. Det neste trinnet er å opprette en konto for deg selv og tilordne den til administratorgruppen, slik at du har full tilgang til de administrative funksjonene i din AWS-konto. Følgende trinn beskriver hvordan ...

Vurderer AWS-støttede plattformer - dummies

Vurderer AWS-støttede plattformer - dummies

Hvis du ikke har behandlet AWS eller skyen ennå, du kan være fristet til å tenke på plattformer som en bestemt kombinasjon av gjenstander. For eksempel, når du ser ditt eget lokale oppsett, har du en server som kjører et bestemt operativsystem og har et bestemt sett med maskinvareressurser. Systemet har en bestemt ...

Lage skuffer på Amazon Web Services - dummies

Lage skuffer på Amazon Web Services - dummies

Når du er den stolte eieren av Amazon Web Services (AWS ) konto, det er på tide å gjøre noe nyttig, som å lage en bøtte. Start med å sjekke ut dine S3-ressurser. For å gjøre det, klikk S3-lenken på startsiden for AWS Management Console, som vist her: Du er tatt til en side som lar deg administrere ...

Redaktørens valg

Slik bruker du Eye-Fi med Evernote-dummies

Slik bruker du Eye-Fi med Evernote-dummies

Et selskap kalt Eye-Fi gjør det mulig å Koble kameraet ditt med Evernote, selv uten å koble kameraet til datamaskinen. Følg disse trinnene for å bruke Eye-Fi: Følg instruksjonene som følger med Eye-Fi-kortet for å konfigurere en Eye-Fi-konto. Sett inn Eye-Fi-kortet i kameraet. Slå på kameraet ditt. ...

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hele poenget med å lagre nyttig informasjon er for å kunne finne den senere. Tagging i Evernote er fundamentalt lik for alle plattformer og er ekstremt nyttig når du dash om å prøve å skrive inn notater på hvilken enhet du bruker på den tiden. For å lage en tagg for et notat på en datamaskin eller ...