Hjem Personlig finansiering Sikre kvaliteten på innkommende eksterne data - dummies

Sikre kvaliteten på innkommende eksterne data - dummies

Video: The Vietnam War: Reasons for Failure - Why the U.S. Lost 2025

Video: The Vietnam War: Reasons for Failure - Why the U.S. Lost 2025
Anonim

Når du designer et datalager og bestemmer hvilke eksterne data du trenger, plasserer du bare en bestilling (som å bestille klær eller en fruktkurv fra et nettsted). Når du begynner å motta data via en strøm, filoverføring eller på annen måte, er det jevnt seiling - eller er det?

Hva med kvaliteten på innkommende data? Du må absolutt bruke samme sett med kvalitetssikringsprosedyrer til eksternt oppgitte data som du gjør til data som kommer fra dine egne interne systemer. Bare fordi du kjøper informasjonen på det åpne markedet, garanterer du ikke at dataene er feilfrie.

Bruk QA-prosedyrer til hver innkommende gruppe data ved å følge disse trinnene:

  1. Finn ut om innkommende data har kontrollverdier som er lagt til filene.

    Noen eksempler på kontrollverdier er antall poster i hver fil, summen av hver tallkolonne (total salgsdoll for alle poster og totale enheter solgt for alle poster, for eksempel) og delsett av de totale kolonnverdiene (totalt antall salg og enheter etter stat, for eksempel).

    Hvis sjekkverdiene er oppgitt, må de lagres og brukes som en del av end-to-end-lastingsprosedyrene. Ingen bør offisielt oppdatere varehusets innhold til sjekken totalt er enig med beregningene du gjorde da du forberedte dataene for lasting.

  2. Hvis ingen kontrollverdier er oppgitt, be om dem.

    Selv om forespørselen kan ta noen sykluser (for noen få uker eller måneder, for eksempel) for å fylle, tar enhver datoperatør som er interessert i å tilby høyt kundeservice, denne typen forespørsel seriøst og forsøker å gjøre den forespurte kontrollinformasjonen tilgjengelig.

  3. Under lastingsprosedyrene filtrerer du hver rad.

    Kontroller at følgende betingelser er oppfylt:

    1. Keys (unike identifikatorer for hver post) er korrekte på tvers av all informasjon. For eksempel, hvis hver post i SalesMasterRecord-gruppen av data må ha nøyaktig 12 relaterte poster i SalesDetailRecord (en for hver måned), må du kontrollere at alle detaljrekordene er til stede ved å sammenligne rekordnøkkelverdier.

    2. Verdier er riktige. Produktsalg per måned, for eksempel, må være innenfor rimelige grenser for den typen produkt (for eksempel fly er forskjellig fra bolter).

    3. Manglende felt av informasjon (en sannsynlig - nesten uunngåelig - forekomst med eksternt oppgitte data) forvrenger ikke betydningen av innkommende data.

      Selv om fraværet av tilleggsdata (definert i henhold til forretningsreglene for din spesifikke bransje eller organisasjon) kanskje ikke er for alvorlig et problem, hvis halvparten av innkommende poster har et tomrom der UnitsSold, TotalSalesPrice, eller annen kritisk type informasjon skal være, er verdien av dataene best i tvil.

    4. Bruk de analytiske verktøyene som beskrevet i kapittel 10, spesielt i de tidlige stadiene for å skaffe eksterne data (for eksempel de første tre eller fire månedene) for å utføre datakvalitetsanalyse før brukerne bruker de samme verktøyene for å utføre forretninger analyse.

      Søk etter oddities, uregelmessigheter, unnvikende resultater, inkonsekvenser, tilsynelatende paradokser og alt annet som bare ser rart ut. Deretter drar du ned til dataens røtter for å se etter kilden til den rare.

      Husk at du sannsynligvis arbeider med mange millioner rader med innkommende data: I tillegg til at du ikke kan sjekke ut hver enkelt rad, kan det hende du har problemer med å sette opp filtrering og QA-kontrollkriterier for alle mulige forhold.

      Alle som noensinne har gjort noe med eksternt oppgitte kildedata, har kommet over alle slags merkelige inkonsekvenser og mangler data i den innkommende informasjonen. Ved å sette deg selv i stedet for brukerne og bruke de samme verktøyene de bruker, kan du sannsynligvis oppdage en ting eller to som du kan rette, noe som gjør datalagret ditt en mye bedre lagring av verdifull forretningsinformasjon.

Sikre kvaliteten på innkommende eksterne data - dummies

Redaktørens valg

Hvordan du samler ressurser i Minecraft - dummies

Hvordan du samler ressurser i Minecraft - dummies

Du kan samle ressurser på flere måter for Minecraft-strukturen - noen er mer effektiv enn andre. Her finner du noen forskjellige måter å samle materialer på for din struktur. Du har et par forskjellige alternativer når det gjelder gruvedrift. Hver har sine fordeler og ulemper, så det er opp til ...

Hvordan bygge Minecraft-kretser og -maskiner med Minecart-spor - dummier

Hvordan bygge Minecraft-kretser og -maskiner med Minecart-spor - dummier

Minecart og skinner er Minecraft-funksjoner ofte brukt til å transportere spillere. Men de kan også utføre mange mekaniske egenskaper bedre enn de vanlige redstone-elementene. Minecarts er enheter som kan rulle raskt langs minecartskinner. De kan svinge, gå opp og ned skråninger, og til og med spore (selv om de lider mye ...

Hvordan bygge din første Minecraft Garden - dummies

Hvordan bygge din første Minecraft Garden - dummies

Se hvordan du oppretter en vakker hage i Minecraft ved å planlegge riktig layout, få en rekke unike planter, og organisere plass.

Redaktørens valg

Markedet ditt mobilnettsted til media - dummies

Markedet ditt mobilnettsted til media - dummies

IPhone og iPad er varme emner i media i disse dager. Når du er ferdig med å designe nettstedet ditt for disse nye medieenhetene, ikke glem å markedsføre dem til tradisjonelle medier. Tiltrekke medieoppmerksomhet til mobilwebområdet ditt er ikke i motsetning til å tiltrekke det til noen annen virksomhet. Trikset er å fortelle et godt ...

Gjør skannede dokumenter søkbare og redigerbare - dummies

Gjør skannede dokumenter søkbare og redigerbare - dummies

Når du skanner et dokument direkte til en PDF-fil, Acrobat fanger all tekst og grafikk på hver side som om de alle var bare ett stort grafisk bilde. Dette er bra så langt det går, bortsett fra at det ikke går veldig langt fordi du ikke kan redigere eller søke i PDF-dokumentet ...

Markedet med SMS-meldinger - dummies

Markedet med SMS-meldinger - dummies

Lengden på SMS- begrenset til 160 tegn, så reklamemeldingen din må være kort og søt. Disse meldingene kan inneholde lenker til nettsteder eller klikk for å ringe meldinger: Du klikker på SMS, slik at telefonen ringer. SMS-kampanjer er mye enklere å håndtere enn ...

Redaktørens valg

Rediger, endre farge eller fjern Photoshop Shape Layers - dummies

Rediger, endre farge eller fjern Photoshop Shape Layers - dummies

Bruk formlag i Photoshop Creative Suite 5 når målet med designet ditt er å integrere vektormodeller og pikseldata sømløst. Når du har opprettet et formlag, kan du redigere formen, endre fargen eller fjerne laget helt. Rediger en form Som Adobe Illustrator, gir Photoshop både et valg av sti ...

Oppdag Photoshops malerverktøy - dummies

Oppdag Photoshops malerverktøy - dummies

Ingenting i Photoshop CC gir deg mer presis kontroll over fargen i bildet ditt enn ved bruk av blyantpenningen verktøy med en 1-piks pensel. Husk at bildet ditt består av mange småfargede firkanter (piksler), og at fargen på de enkelte firkantene er det som gir utseendet til et tre eller et ...

Forbedre portretter i Photoshop CC - dummier

Forbedre portretter i Photoshop CC - dummier

Forbedre detaljer som å avklare motivets briller i Photoshop CC kan hjelpe bildene dine og portretter ser det mye bedre ut. Whitening tennene er et annet godt triks for å lyse opp bildene dine. Deklarende briller i Photoshop Eyeglasses kan være fotografens mareritt! Refleksjonene fra glass er vanligvis spekulative høydepunkter - det vil si områder av ren ...