Hjem Personlig finansiering Rollen til tradisjonell ETL i Big Data - dummies

Rollen til tradisjonell ETL i Big Data - dummies

Video: Regnskapsførers rolle som rådgiver 2025

Video: Regnskapsførers rolle som rådgiver 2025
Anonim

ETL-verktøy kombinerer tre viktige funksjoner (ekstrakt, transformer, last) som kreves for å få data fra ett stort datamiljø og legg det inn i et annet datamiljø. Tradisjonelt har ETL blitt brukt med batchbehandling i datalagringsmiljøer. Datavarehus gir bedriftsbrukere en måte å konsolidere informasjon for å analysere og rapportere om data som er relevante for deres forretningsfokus. ETL-verktøy brukes til å transformere data i formatet som kreves av datalager.

Transformasjonen gjøres faktisk i en mellomliggende posisjon før dataene lastes inn i datalageret. Mange programvareleverandører, inkludert IBM, Informatica, Pervasive, Talend og Pentaho, gir ETL-programvareverktøy.

ETL gir den underliggende infrastrukturen for integrasjon ved å utføre tre viktige funksjoner:

  • Utdrag: Les data fra kildedatabasen.

  • Transform: Konverter formatet til de ekstraherte dataene slik at de overholder kravene til måldatabasen. Transformasjon gjøres ved å bruke regler eller slå sammen data med andre data.

  • Last: Skriv data til måldatabasen.

ETL utvikler seg imidlertid for å støtte integrasjon over mye mer enn tradisjonelle datalager. ETL kan støtte integrasjon på tvers av transaksjonssystemer, operative datalager, BI-plattformer, MDM-hubber, skyen og Hadoop-plattformene. ETL-programvareleverandører utvider sine løsninger for å gi stor datautvinning, transformasjon og lasting mellom Hadoop og tradisjonelle datastyringsplattformer.

ETL og programvareverktøy for andre dataintegrasjonsprosesser som datarensing, profilering og revisjon av alt arbeid på ulike sider av dataene for å sikre at dataene blir ansett troverdige. ETL-verktøy integreres med datakvalitetsverktøy, og mange inkorporerer verktøy for data rensing, datakartlegging og identifisering av datastreng. Med ETL utvider du bare dataene du trenger for integrasjonen.

ETL-verktøy er nødvendig for å laste og konvertere strukturerte og ustrukturerte data til Hadoop. Avanserte ETL-verktøy kan lese og skrive flere filer parallelt fra og til Hadoop for å forenkle hvordan data slås sammen til en felles transformasjonsprosess. Noen løsninger inneholder biblioteker av forhåndsbyggede ETL-transformasjoner for både transaksjons- og samspillingsdataene som kjører på Hadoop eller en tradisjonell nettverksinfrastruktur.

Datatransformasjon er prosessen med å endre formatet på data slik at det kan brukes av forskjellige applikasjoner.Dette kan bety en endring fra formatet dataene lagres i, i formatet som kreves av programmet som skal bruke dataene. Denne prosessen inneholder også kartlegging instruksjoner slik at programmer blir fortalt hvordan de får de dataene de trenger for å behandle.

Prosessen med datatransformasjon blir gjort langt mer kompleks på grunn av den svimlende veksten i mengden av ustrukturerte data. En forretningsapplikasjon som en kundeforholdsstyring har spesifikke krav til hvordan data skal lagres. Dataene er sannsynligvis strukturert i de organiserte rader og kolonner i en relasjonsdatabase. Data er halvstrukturert eller ustrukturert hvis den ikke følger stive formatkrav.

Informasjonen i en e-postmelding anses for eksempel ustrukturert. Noen av selskapets viktigste opplysninger er i ustrukturerte og halvstrukturerte former som dokumenter, e-postmeldinger, komplekse meldingsformater, kundesupportinteraksjoner, transaksjoner og informasjon som kommer fra pakkede applikasjoner som ERP og CRM.

Datatransformasjonsverktøy er ikke designet for å fungere godt med ustrukturerte data. Som et resultat har bedrifter som trenger å inkorporere ustrukturert informasjon i sin beslutningsprosess for forretningsprosess, blitt møtt med en betydelig mengde manuell koding for å oppnå den nødvendige dataintegrasjonen.

I lys av veksten og betydningen av ustrukturerte data i beslutningsprosessen, begynner ETL-løsninger fra store leverandører å tilby standardiserte tilnærminger til å transformere ustrukturerte data slik at den lettere kan integreres med operasjonelle strukturerte data.

Rollen til tradisjonell ETL i Big Data - dummies

Redaktørens valg

10 Tips for visuelt analysere og presentere data i Excel - dummies

10 Tips for visuelt analysere og presentere data i Excel - dummies

Her er noen konkrete forslag om hvordan du med hell kan bruke diagrammer som dataanalyseværktøy i Excel, og hvordan du kan bruke diagrammer for å mer effektivt kommunisere resultatene av dataanalysen du gjør. Bruk riktig diagramtype Hva mange mennesker ikke skjønner er at du bare kan lage fem ...

10 Måter å forbedre Power Pivot Performance - dummies

10 Måter å forbedre Power Pivot Performance - dummies

Når du publiserer Power Pivot-rapporter på nettet, har du tenkt for å gi publikum den beste opplevelsen som er mulig. En stor del av denne erfaringen er å sikre at ytelsen er god. Ordet ytelse (som det gjelder applikasjoner og rapportering) er vanligvis synonymt med hastighet - eller hvor raskt et program utfører bestemte handlinger ...

Legger ekstra analyselagre til Excel-diagrammer - dummies

Legger ekstra analyselagre til Excel-diagrammer - dummies

Det er ikke uvanlig å bli bedt om å legge til Ekstra analyse til din visualisering som vanligvis ikke er plottet på et Excel-diagram. For eksempel viser dette diagramet salg for hvert kvartal, men klienten vil kanskje også se prosentveksten i samme kvartal. De fleste Excel-analytikere oppfyller dette behovet med faktiske tekstbokser. ...

Redaktørens valg

Reise fotografering kamera sammenligning diagram - dummies

Reise fotografering kamera sammenligning diagram - dummies

Fra smarte telefoner til punkt-og-skyte og digitale speilreflekskameraer, du har en mange fotograferingsvalg der ute. Bruk følgende diagram for å se hvilken type kamera som passer best for deg. Smartphone Point-and-shoot dSLR Bildesensor Kvalitet Lav til middels Medium Høy Vannbestandig (egnet for basseng) Sjeldne Få modeller Sjeldne Optiske Zoom Lav ...

Ta et makrofoto-dummies

Ta et makrofoto-dummies

Fotografi (makrofotografi) gir deg den som ser bildene dine, utsikt over verden ikke normalt sett av det blotte øye. De fleste kameraer, selv smarttelefoner, kan skyte ting med en rimelig nærhet med en viss grad av klarhet og fokus. Mens du reiser, finner du ting som skyter nærbilde, for eksempel hva du spiser til middag, en merkelig feil, ...

Forestille et Moving Object - dummies

Forestille et Moving Object - dummies

Når du ser et bilde, skjønner du selv hva som skjedde da det ble tatt. Noen bilder kan innebære bevegelse eller aktivitet. For eksempel kan du fokusere på en sykkel som beveger seg nedover gaten med bygningene bak den sløret. Dette er annerledes enn grunne dybdeskarphet, men fordi blenderåpningen ikke er det som skaper ...

Redaktørens valg

ACT-strategi for å multiplisere en horisontal matrise med en vertikal matrise - dummies

ACT-strategi for å multiplisere en horisontal matrise med en vertikal matrise - dummies

På ACT Matematisk test, du må sannsynligvis multiplisere par matriser som har enten en rad eller en kolonne. En enkel måte å formere en horisontal matrise med en vertikal matris er å sette opp et lite rutenett. Denne metoden lar deg fylle ut tallene for å få det riktige svaret. Matrix ...

ACT-strategi for å løse en matrise ved hjelp av en determinant-dummies

ACT-strategi for å løse en matrise ved hjelp av en determinant-dummies

Er en determinant en vanlig operasjon utført på en firkantet matrise. På ACT Math-testen er den eneste determinantformelen du trenger å være kjent med, for en 2 x 2-matrise. Her er formelen for determinanten av Merk at determinanten av en matrise bare er et tall, ikke en matrise. Å ...

ACT Trick for Quadratics: Slik finner du raskt en Parabola-dummies retning

ACT Trick for Quadratics: Slik finner du raskt en Parabola-dummies retning

For å spare tid når du graver en kvadratisk funksjon på ACT Math-testen, kan du raskt bestemme retningen for parabolen ved hjelp av et enkelt triks basert på koeffisienten a. Dette trikset vedrører tegnet på variabelen a (i uttrykket ax2): Når a er positivt, er grafen konkav opp. I ...