Hvordan fungerer Business Intelligence med ustrukturerte data? - dummies
Anta at du bruker et ustrukturert, multimedieaktivert datalagringsmiljø for å gjøre komparativ analyse mellom tjenester som tilbys av firmaet ditt (en bank) og konkurrenters tilsvarende tilbud. Du kjører noen grunnleggende rapporter og noen spørsmål for å sjekke ut markedsandeler, porteføljeprestasjoner og andre tiltak. Eller, for mer avansert analyse, bruker du en bedrift ...
Hvordan Semantikk gjelder forretningsmessig intelligens - dummies
Spør deg selv og dine datalagringsprosjektgrupper dette spørsmålet: Hvordan vil du forberede seg på disse teknologiene? Fokuser på tre områder som du sannsynligvis allerede jobber med - ditt forretningsmessige semantiske lag, forretningsreguleringsadministrasjon, og muligens forenet spørringsdefinisjon. Business Intelligence Semantic Layer Management Hvis du graver dypt nok til prosessen din og ...
Hvordan du overbeviser dine baser om behovet for datalagring - dummier
Når du er legger et datalagringsprosjekt til toppledelsen (til og med administrerende direktør eller finansdirektør), jobber følgende to uttalelser i presentasjonen: "Vi har data over alt på en rekke forskjellige maskiner, og vi kan ærlig talt ikke komme til noe av det. Å, ja, mye av det er inkonsekvent også. "" Du vet ...
Horisontal versus vertikal datalagringsadministrasjon - dummies
Mest relasjonsdatabaseforvaltere er blitt bygget på en horisontal lagringsleder som plasserer all data i en database etter rad (eller post) når en transaksjon skjer. En databasetabell er representert som en kjede av databasesider som inneholder en eller flere dataarker. En horisontal lagringsbehandling gir rask online-transaksjonsbehandling (OLTP) ...
Identifiser data du trenger for datalagret ditt - dummies
Spør deg selv dette spørsmålet: Se på en komplett liste opp fra ditt firma av alle datakilder som vil gi data til lageret, hva mer trenger du som du ikke allerede har på listen - og hva kan du ikke komme et annet sted i selskapet for å gjøre forretningsbeslutninger? ...
Hvordan du katalogiserer eksisterende uttrekk filer - dummies
Når du begynner å vurdere hva du skal gjøre om utdragsfiler og andre typer slags data warehouse miljøer som eksisterer i din organisasjon, må du finne dem - som du kanskje synes vanskelig, med tanke på den hjemmekostede naturen til disse miljøene. Her er et hint: Følg rapportene. Gjennom gruppearbeid og individuelle møter, ...
Hvordan å være en smart shopper på datalagringskonferanser - dummies
Gjør ingen feil om det: Du kan få enorm verdi fra å delta på hvilken som helst type konferanse eller messe, inkludert de som er orientert mot datalagring. Leverandører tout og demonstrere sine nyeste produkter, får høre virkelige casestudier og historier om vellykkede data warehousing implementeringer, og du kan få unikt innblikk i up-and-coming problemer ...
Slik integrerer du Big Data - dummies
Bare å ha tilgang til store datakilder er ikke nok. Du må integrere disse kildene. Snart vil det være petabytes av data og hundrevis av tilgangsmekanismer for deg å velge mellom. Men hvilke strømmer og hvilke typer data trenger du? Forstå problemet du prøver å løse Identifiser ...
Slik sikrer du gyldigheten, veraciteten og volatiliteten til store data - dummier
Høyt volum, stort utvalg og høy hastighet er de viktigste egenskapene til store data. Men andre egenskaper ved store data er like viktige, spesielt når du bruker store data til operasjonelle prosesser. Dette andre settet med "V" egenskaper som er nøkkelen til operativisering av store data inkluderer Gyldighet: Er dataene korrekte og nøyaktige for ...
Hvordan du bruker skyen til store data - dummies
Klart, selve karakteren av skyen gjør det til et ideelt databehandling miljø for store data. Så hvordan kan du bruke store data sammen med skyen? Her er noen eksempler: IaaS i en offentlig sky: I dette scenariet vil du bruke en offentlig skyveleverandørs infrastruktur for dine store datatjenester fordi du ...
Hvordan du lager en stor dataimplementeringskart - dummier
Store dataimplementeringsplaner eller veikart , vil variere avhengig av dine forretningsmål, modenhet for datastyringsmiljøet og mengden risiko organisasjonen din kan absorbere. Så, start planleggingen din ved å ta hensyn til alle problemene som vil gi deg mulighet til å bestemme en implementeringsplan. Bedriftshastighet og ...
Implementere Data Mart - Quick-dummies
Uansett hvordan du bestemmer deg for å dele universet med mulig innhold i noen subset for data mart, husk at for å oppnå maksimal forretningsverdi fra data mart må du implementere det raskt. Her er de tre nøklene til rask implementering: Følg en iterativ, faset metodikk. Du bruker mesteparten av ...
Slik setter du arkitektonisk fundament for store data - dummier
Det er viktig å legge en sterk arkitektonisk grunnlag hvis du vil lykkes med store data. I tillegg til å støtte de funksjonelle kravene er det viktig å støtte den nødvendige ytelsen. Dine behov vil avhenge av arten av analysen du støtter. Du trenger riktig mengde beregningsevne ...
Hvordan du optimaliserer MapReduce-oppgaver - dummies
Bortsett fra optimalisering av den aktuelle applikasjonskoden med MapReduce for store dataprosjekter, kan du bruk noen optimaliseringsteknikker for å forbedre påliteligheten og ytelsen. De faller i tre kategorier: maskinvare / nettverkstopologi, synkronisering og filsystem. Stor datahjelp / nettverkstopologi Uavhengig av applikasjon, vil den raskeste maskinvaren og nettverkene trolig gi de raskeste kjøretidene ...
Identifiser dataene du trenger for dine store data - dummies
Ta oversikt over typen data du har å gjøre med i ditt store dataprosjekt. Mange organisasjoner erkjenner at mange internt genererte data ikke har vært vant til sitt fulle potensial tidligere. Ved å utnytte nye verktøy, får organisasjoner ny innsikt fra tidligere uutnyttede kilder til ustrukturerte data i ...
Slik bruker du MapReduce for Big Data - dummies
MapReduce er et programvareverkramme som er ideelt for store data fordi det gjør det mulig for utviklere å skrive programmer som kan behandle massive mengder ustrukturert data parallelt over en distribuert gruppe prosessorer. Kartfunksjonen for store data Kartfunksjonen har vært en del av mange funksjonelle programmeringsspråk i mange år. Kart ...
Lag 0 av Big Data Stack: Redundant Physical Infrastructure - dummies
På laveste nivå av den store datastakken er den fysiske infrastrukturen. Firmaet ditt kan allerede ha et datasenter eller investert i fysisk infrastruktur, så du vil finne en måte å bruke eksisterende eiendeler på. Store dataimplementeringer har svært spesifikke krav til alle elementer i referansearkitekturen, ...
Lag 2 av Big Data Stack: Operasjonsdatabaser - dummies
I kjernen til noen store datamiljø og lag 2 i den store datastakken, er databasemotorer som inneholder samlinger av dataelementer som er relevante for virksomheten din. Disse motorene må være raske, skalerbare og steinfaste. De er ikke alle opprettet like, og enkelte store datamiljøer vil bli bedre med ...
Lag 3 av Big Data Stack: Organisering av datatjenester og verktøy - dummies
Organisere datatjenester og verktøy, lag 3 av den store datastakken, ta opp, validere og samle ulike store dataelementer i kontekstuelt relevante samlinger. Fordi store data er enorme, har teknikker utviklet seg til å behandle dataene effektivt og sømløst. MapReduce er en mye brukt teknikk. Det er nok å si at mange av disse organisasjonene ...
Nøkkelparametere i et stort datamiljø - dummies
Uten tvil den enkleste Databasene NoSQL (ikke-bare-SQL) i et stort datamiljø er de som bruker nøkkelverdierparet (KVP) -modellen. KVP-databaser krever ikke et skjema (som RDBMSer) og gir god fleksibilitet og skalerbarhet. KVP-databaser tilbyr ikke ACID-egenskaper (Atomicity, Consistency, Isolation, Durability), og krever at implementere skal tenke på data ...
Møtes med datalagringsrepresentanter - dummies
Shopping for datalagringsprodukter kan inkludere møter med selskapets reps. Før en salgsrepresentant setter fot på kontoret eller starter en webkonferanse med deg, gjør du helt klart hva du forventer å dekke under det første eller to timers første møtet. Du bør gjøre minst følgende: Hør en presentasjon av ...
Lag 1 av Big Data Stack: Sikkerhetsinfrastruktur - dummies
Sikkerhets- og personvernskrav, lag 1 av den store datastakken, ligner kravene til konvensjonelle datamiljøer. Sikkerhetskravene må være nøye tilpasset spesifikke forretningsbehov. Noen store utfordringer oppstår når store data blir en del av strategien: Datatilgang: Brukertilgang til rå eller beregnede store data har ...
Lag 4 av Big Data Stack: Analytiske Data Warehouses - dummies
Datalageret, lag 4 av den store datastakken, og dets følgesvenn data mart, har lenge vært de primære teknikker som organisasjoner bruker til å optimalisere data for å hjelpe beslutningstakere. Data lagre og mars inneholder vanligvis normaliserte data samlet fra en rekke kilder og samlet for å lette analysen av virksomheten. Data ...
Administrere virtualisering for store data - dummies
Virtualisering skiller ressurser og tjenester fra det underliggende fysiske leveringsmiljøet, slik at du kan opprette mange virtuelle systemer innenfor et enkelt fysisk system. En av de viktigste årsakene til at selskapene har implementert virtualisering, er å forbedre ytelsen og effektiviteten i behandlingen av en variert blanding av arbeidsbelastninger. Den store datahypervisoren I et ideelt ...
Mellomvare for datalagring - dummies
Middleware er dataprogramvare som kobler til programvarekomponenter. I et datalagringsmiljø er mellomvaretjenestene settet av programmer og rutiner som gjør følgende: Trekk data fra kilden (eller kildene). Pass på at dataene er korrekte. Flytt dataene rundt miljøet fra plattform til plattform, etter behov. Håndter alt nødvendig ...
Masterdataadministrasjon (MDM) - dummies
De siste årene er ODS-stil tilbakemeldingssystemer definert for et bestemt formål - referansedata - har dukket opp. Alle systemer er pakket med referansedata. Disse dataene kan omfatte det settet med data du bruker til å beskrive scenen for en salgsmulighet (for eksempel en ledelse, en kvalifisert leder, en mulighet, en forventet mulighet og ...
Mellomprogramvare Tjenester: Datamapping og transformasjon - dummier
Denne figuren viser et miljø der data blir hentet fra tre forskjellige datakilder for inkludering i et datalager, og hver av de tre kildene er på en annen plattform. På et tidspunkt i mellomvareprosessen må disse QA'd-ekstraktene kombineres for en kombinert kartlegging og transformasjonsprosess. Den ...
Mellomvare Tjenester: Databevegelse og datainnlasting - dummier
I de fleste situasjoner, de to mellomvaretjenestene og utvinning og kvalitetssikring - finner sted på samme plattform (system) som datakilden ligger på. Hvis datalageret ditt vil bli vert på en annen plattform enn datakilden, må du imidlertid bruke en dataflyttingstjeneste for å aktivere system-til-systemet ...
Mellomprogramvare Tjenester: Datavalg og uttrekk - dummies <[SET:descriptionno]Det primære formål med datautvalg og -ekstraksjonstjenesten
Det primære formål med datautvalg og -ekstraksjonstjenesten
Mine store data med Hive-dummies
Hive er et batch-orientert datalagringslag som er bygd på kjerneelementene av Hadoop (HDFS og MapReduce) og er veldig nyttig i store data. Det gir brukere som kjenner SQL med en enkel SQL-lite implementering kalt HiveQL uten å ofre tilgang via mappere og reduksjonsverktøy. Med Hive kan du få det beste fra begge verdener: SQL-like tilgang ...
Flerdimensjonale databaser - dummies
Dette er ikke første gang i nyere historie at nye typer databaseprodukter har kommet fram og overvinne RDBMS ineffektivitet . Tilbake på 1980-tallet ble det identifisert en klasse applikasjoner der RDBMS-produkter hadde dårlig håndtering av datahåndteringsbehovene (spesielt genereringen av RDBMSs tilgjengelig på den tiden). Disse programmene krever alle brukerdefinerte datatyper som ...
Mellomvare Tjenester: Datakvalitetssikring - dummies
Du bør etablere to forskjellige kvalitetssikrings- (QA) tjenester i strømmen av middleware-tjenester. Du må utføre de første QA-oppgaver mot utdraget fra datakilden før du utfører flere mellomvaretjenester. Datakvalitetssikring: del I Prøv å fange (og rette) feil og problemer så tidlig i prosessen ...
Ikke-relasjonelle databaser i et stort datamiljø - dummier
Ikke-relasjonelle databaser stoler ikke på bordet / nøkkelmodellen endemisk til RDBMSs (relasjonsdatabasebehandlingssystemer). Kort sagt krever spesialitetsdata i den store datafjerm verden spesialitetstendens og data manipulasjonsteknikker. Selv om disse nye typene av databaser gir noen svar på dine store data utfordringer, er de ikke en eksplisitt billett til slutt ...
Sett Big Data to Use - dummies
Tekstanalyse kan brukes til å få innblikk i data. Så, hva om dataene er store data? Det vil bety at de ustrukturerte dataene som analyseres, er høyt volum, høy hastighet eller begge deler. Stor data og kundens stemme Optimalisering av kundeopplevelsen og bedre kundeoppbevaring er dominerende drivere for ...
Ni tegn på et vellykket datalagringsprosjekt - dummies
Bare fordi alle samles i selskapets kafeteria for kake og plaster veggene med gratulererende bannere betyr ikke at datalagerprosjektet ditt var en suksess. Dette kapitlet gir deg noen måter å fortelle at du var veldig vellykket. Den utøvende sponsoren sier, "Denne tingen fungerer - det virker virkelig! "Anta at en senior ...
Endre Business Intelligence-produkter til å håndtere store data - dummies
Håndterer store data, slik at de kan kreve noen modifikasjoner. De ble designet for å jobbe med svært strukturerte, velforståtte data, ofte lagret i et relasjonsdatabase og vist på skrivebordet eller datamaskinen. Denne tradisjonelle business intelligence-analysen brukes vanligvis på øyeblikksbilder av data heller ...
Andre typer Business Intelligence - dummies
Ak, den ryddige, organiserte modellen som har fire forskjellige typer business intelligence kategorier (spørring og rapportering, forretningsanalyse [OLAP], datautvinning, og instrumentpaneler og resultatkort) kan utvides for mer komplekse applikasjoner. For eksempel kan et OLAP- eller instrumentbrettverktøy ha GIS-funksjoner (eller det kan ikke. Som vist i ...
Bør du bruke verktøy eller tilpasset kode? - dummies
I de tidlige dagene med datalagring, håndterte de fleste organisasjoner mellomvare-tjenester gjennom tilpasset koding, i stedet for de få verktøyene som er tilgjengelige på det tidspunktet, som vist i dette eksemplet: En organisasjon skriver et program i en programmering språk som COBOL, eller kanskje i et miljø som SAS, for å håndtere dataekstrakterne ...