Video: Data Warehouse Tutorial For Beginners | Data Warehouse Concepts | Data Warehousing | Edureka 2025
Data som er samlet inn av store organisasjoner i dagligdags virksomhet, lagres vanligvis i databaser. Men databaseadministratorer kan ikke være villige til å gi data minearbejdere direkte tilgang til disse Datakilder og direkte tilgang er kanskje ikke det beste alternativet fra ditt synspunkt. Direkte tilgang til operativsystemer (brukes til rutinemessige bedriftsoperasjoner) kan være en dårlig ide fordi
-
Data miners bruker mye data. >
Du kan utilsiktet krenke en personvernlovgivning eller annen datahåndtering. krav om datatilgang ikke er riktig kontrollert. -
Operasjonelle databaser er ikke organisert for data mining. Du kan bruke mye tid på å kaste dataene du trenger, og er fortsatt ikke sikker på at du får det riktig.
-
Når du trenger data fra en operativ database (og du har riktig godkjenning for å bruke dataene), bør du diskutere dine behov med administratoren som er ansvarlig for dataene. Du må forklare nøyaktig hvilke data du trenger, formatet du trenger for data mining, og om du trenger dataene bare en gang eller på en kontinuerlig basis.
Den beste tilnærmingen til engangsforespørsler er ofte for administratoren å trekke ut dataene for deg og levere det i en tekstfil eller et annet akseptabelt format.
Løpende datatilgang er en annen sak. Administratoren vil kanskje ikke gi dataekstrakter om og om igjen, og gir deg direkte tilgang til forretningssystemer er risikabelt. En felles løsning er å opprette enanalytisk database.
Dette er en vanlig relasjonsdatabase som er skilt fra konvensjonelle forretningssystemer. Data blir rutinemessig (og automatisk) overført fra forretningssystemer til den analytiske databasen, og data miners kan når som helst få tilgang til det.
visning
(et lagret søk som kan forespørres som om det var en vanlig datatabell) med organisasjonen du trenger. Mange data-miningprodukter kan lese data fra databaser. Trinnene som kreves, varierer basert på Utforming av data mining søknaden
Struktur av kildedatabasen
-
Middleware, vanligvis kalt en
-
driver
-
( ODBC driver, JDBC driver
