Video: HP-programmer og drivere forklart 2025
Denne figuren viser et miljø hvor data hentes fra tre forskjellige datakilder for inkludering i et datalager, og hver av de tre kildene er på en annen plattform. På et tidspunkt i mellomvareprosessen må disse QA'd-ekstraktene kombineres for en kombinert kartlegging og transformasjonsprosess.
Kartleggings- og transformasjonstjenesten håndterer klassiske datalagringsproblemer. Anta at en datakilde lagrer kunder ved å bruke en fem tegn-ID, og en annen kilde bruker en sekssifret numerisk kundeidentifikator.
For å muliggjøre sammenligninger og annen databehandling, trenger du en felles metode for kundidentifikasjon: En av identifikasjonsordninger må konverteres til det andre, eller kanskje et tredje, nøytralt identifikasjonssystem, avhengig av miljøets egenskaper.
I tillegg til å håndtere ulykkesforstyrrelser på tversystem, kan flere transformasjoner omfatte
-
Datasammendrag: Et sammendrag kan utføres tidligere i prosessen før krysssystembevegelse, avhengig av særegenheter av ditt spesifikke datalagringsmiljø.
-
Selektiv inkludering av data: Du kan inkludere poster fra bare en datakilde, for eksempel hvis du får en sammenlignbar post fra et annet utdrag. Du vet ikke, før du konvergerer alle datakildens bidrag, hvordan selektive inkluderingsregler brukes.
-
Datakonvergens: Enkelte elementer fra en datakilde er kombinert med elementer fra en annen kilde for å lage en enhetlig post for hver kunde, produkt, kontrakt eller hvilken type data du har å håndtere med.
Hovedpoenget å huske om kartleggings- og transformasjonstjenesten er at du ved avslutningen skal ha et enhetlig sett med data som er klare til å lastes inn i datalageret - så snart du har fullført noen få trinn.
I komplekse datalagringsmiljøer vil du kanskje vurdere flere transformasjonsprosesser. Som vist i denne figuren, samler dataekstrakter seg på flere forskjellige nivåer av transformasjon før de beveger seg lenger ned mellom pipeline-pipen, slik at du kan bruke mer hestekrefter til transformasjonsprosessen ved å bruke flere servere tidlig i strømmen.
