Hjem Personlig finansiering Data mining - dummies

Data mining - dummies

Innholdsfortegnelse:

Video: Data Mining: How You're Revealing More Than You Think 2024

Video: Data Mining: How You're Revealing More Than You Think 2024
Anonim

Kjernegenskapen om datautvinning, sammenlignet med spørring, rapportering eller OLAP, er at du kan få informasjon uten å måtte stille bestemte spørsmål.

Data mining tjener to primære roller i ditt forretningsmessige oppdrag:

  • "Fortell meg hva som kan skje" rolle: Data mining er den første rollen som er prediktiv, der du i utgangspunktet sier "Fortell meg hva kan skje. "Ved å bruke skjult kunnskap låst i datalageret, sannsynliggjøres sannsynligheten for fremtidige trender og hendelser og presenteres for deg.

  • I tillegg til mulige fremtidige hendelser og hendelser, prøver datautvinning også å trekke ut interessante opplysninger som du sikkert bør vite om, for eksempel et spesielt uvanlig sammenheng mellom salg av to forskjellige produkter og hvordan forholdet varierer etter plassering i butikkene dine. Selv om mange av disse interessante godbitene er sannsynlig å eksistere, hvilke spørsmål vil du spørre om du brukte et spørrings- eller OLAP-verktøy, og hvordan ville du tolke resultatene? Data mining hjelper deg i denne vanskelige oppgaven med å finne ut hvilke spørsmål du skal stille ved å gjøre mye av det grunne arbeidet for deg.

    Registrering av svindel

Bestemme effektiviteten av markedsføringsprogrammet

Valg av hvem fra en stor kundebase eller den generelle befolkningen, bør du målrette som en del av et markedsføringsprogram

  • Administrere kundens livssyklus, inkludert kundetilfredshetsoppdraget

  • Utføre avansert forretningsprosessmodellering og hva-om-scenarier

  • Tenk på hva som ligger bak hver av forretningsoppdragene i den forrige listen:

  • En stor mengde data

    En enda større antall kombinasjoner av ulike datamaterialer
  • Intensiv resultatanalyse, som vanligvis involverer komplekse algoritmer og avanserte statistiske teknikker

Nå tenk på hva du må gjøre hvis du bruker et rapporterings- eller OLAP-verktøy for å oppnå disse oppdragene. Du vil finne det praktisk talt umulig å utføre noen av de foregående oppdragene grundig hvis du måtte stille et spørsmål og få et resultat, stille et annet spørsmål og få et nytt resultat, og fortsett å gjenta disse trinnene.

  • Data mining og kunstig intelligens

  • Hvis du har vært i IT-feltet i minst et tiår, kan noen av de foregående vilkårene være svakt kjent.Lås opp skjult kunnskap? Prediktiv funksjonalitet? Vent litt - det er kunstig intelligens!

  • Fra de tidligste dagene av kommersiell databehandling har det vært stor interesse for å utvikle "tankemaskiner" som kan behandle store mengder data og ta beslutninger basert på denne analysen.

Interessen for kunstig intelligens (AI) rammet sin høyde i midten av 1980-tallet. På den tiden jobbet databaseleverandørene med å produsere kunnskapsbaserte styringssystemer (KBMSs); Andre leverandører kom ut med

ekspertsystemskall,

eller AI-baserte applikasjonsutviklingsrammer som brukte teknikker som forkjeding og tilbakeketting for å gi brukerne råd om beslutninger; og nevrale nettverk ble plassert som den neste store AI-utviklingen.

Interesse i AI gikk ned tidlig på 1990-tallet, da forventningene overgikk tilgjengelige muligheter og andre frenzier, for eksempel klient / server migrasjon og (selvfølgelig) datalagring, tok senterstadiet.

Nå er AI tilbake! Den høyest profilerte AI-teknikken som brukes i data mining er nevrale nettverk. Neuralnett var opprinnelig tenkt som en behandlingsmodell som ville etterligne måten menneskelig hjerne løser problemer ved hjelp av nevroner og høy parallell behandling for å gjøre mønsterløsning. Bruk av nevrale nettverksalgoritmer til områdene business intelligence som data mining håndterer (igjen, forutsigbar og "fortell meg noe interessant" oppdrag) ser ut til å være en naturlig kamp.

Selv om data mining / neurale nettverksspillet definitivt er verdt å sjekke inn, bør du gjøre det nøye. Du finner mange interessante og spennende teknologier som i hendene på de som ikke forstår algoritmene, sannsynligvis vil mislykkes.

Med riktig kunnskap og utdanning kan du imidlertid gjøre en fullstendig forpliktelse til å bringe denne typen behandling inn i forretningsinformasjonsrammen din som teknisk analyseparing for OLAP-fokusert forretningsanalyse.

Data mining og statistikk

Den mer modne delen av data mining er anvendelsen av avanserte statistiske teknikker mot de store datamengdene i datalagret ditt. Ulike verktøy bruker ulike typer statistiske teknikker, skreddersydd til de områdene de prøver å adressere.

Uten en statistisk bakgrunn, kan det hende du finner mye av data mining forvirrende. Du må gjøre mye arbeid for å trene algoritmer og bygge reglene for å sikre riktige resultater med større datasett. Hvis du forventer at du er komfortabel med dette konseptet, eller har en kollega som kan hjelpe, er det noen av de mer utbredte algoritmene:

Klassifikasjonsalgoritmer:

Forutsi en eller flere diskrete variabler, basert på den andre attributter i datasettet. Ved å bruke klassifikasjonsalgoritmer kan datautvinningsverktøyet se på store mengder data og informere deg om at for eksempel "Kunder som beholdes gjennom minst to generasjoner av produktkjøp har en tendens til å ha disse egenskapene: De har en inntekt på minst $ 75 000, og de eier sine egne hjem."

Regresjonsalgoritmer:

Forutsi en eller flere kontinuerlige variabler, for eksempel fortjeneste eller tap, basert på andre attributter i datasettet. Regresjonsalgoritmer drives av historisk informasjon presentert til data mining verktøyet "over tid," bedre kjent som

  • tidsserier informasjon.

  • Segmenteringsalgoritmer: Del data i grupper eller klynger av elementer som har lignende egenskaper. Forening algoritmer: Finn korrelasjoner mellom forskjellige attributter i et datasett. Den vanligste bruken av denne typen algoritme skaper foreningsregler, som du kan bruke i en markedskurvanalyse. Merk at for eksempel hvis en kunde kjøper en bestemt programvarepakke, har han eller hun 65 prosent sjanse til å kjøpe minst to produktspesifikke tilleggspakker innen to uker.

  • Sekvensanalysalgoritmer: Oppsummer hyppige sekvenser eller episoder i data, for eksempel en web-sti-strømning.

  • Det finnes mange flere metoder. Støv av den gamle statistikkboken og begynn å lese.

Data mining - dummies

Redaktørens valg

Hvordan å stable og gruppereformer i Word 2013 - dummies

Hvordan å stable og gruppereformer i Word 2013 - dummies

Enkeltformer kan noen ganger være nyttige i en dokument, men den virkelige kraften til Word 2013's Shapes-funksjonen kan bli funnet ved å kombinere figurer for å lage mer komplekse tegninger og logoer. Du kan stable formene oppå hverandre og kontrollere rekkefølgen de vises i stakken. Når du har ...

Hvordan du angir punktavstand i Word 2013 - dummies

Hvordan du angir punktavstand i Word 2013 - dummies

Word 2013 lar deg legge til "luft" til plass før eller etter eller i midten av avsnittene dine. I midten av avsnittet har du linjeavstand. Før og etter avsnittet kommer punktavstand. Hvordan sette linjeavstanden Endre linjeavstanden legger til ekstra mellomrom mellom alle tekstlinjer ...

Slik starter du et nytt dokument i Word 2007 - dummies

Slik starter du et nytt dokument i Word 2007 - dummies

Starter et nytt dokument i Word 2007 er lett. Hvis du nettopp har startet Word 2007 og vil åpne et tomt dokument, kan du følge tre enkle trinn.

Redaktørens valg

Slik oppretter du en AWS Administrator User - Dummies

Slik oppretter du en AWS Administrator User - Dummies

Opprett Administrator-gruppen er det første trinnet for å sikre at din AWS (Amazon Web Services) -kontoen er fortsatt trygg. Det neste trinnet er å opprette en konto for deg selv og tilordne den til administratorgruppen, slik at du har full tilgang til de administrative funksjonene i din AWS-konto. Følgende trinn beskriver hvordan ...

Vurderer AWS-støttede plattformer - dummies

Vurderer AWS-støttede plattformer - dummies

Hvis du ikke har behandlet AWS eller skyen ennå, du kan være fristet til å tenke på plattformer som en bestemt kombinasjon av gjenstander. For eksempel, når du ser ditt eget lokale oppsett, har du en server som kjører et bestemt operativsystem og har et bestemt sett med maskinvareressurser. Systemet har en bestemt ...

Lage skuffer på Amazon Web Services - dummies

Lage skuffer på Amazon Web Services - dummies

Når du er den stolte eieren av Amazon Web Services (AWS ) konto, det er på tide å gjøre noe nyttig, som å lage en bøtte. Start med å sjekke ut dine S3-ressurser. For å gjøre det, klikk S3-lenken på startsiden for AWS Management Console, som vist her: Du er tatt til en side som lar deg administrere ...

Redaktørens valg

Slik bruker du Eye-Fi med Evernote-dummies

Slik bruker du Eye-Fi med Evernote-dummies

Et selskap kalt Eye-Fi gjør det mulig å Koble kameraet ditt med Evernote, selv uten å koble kameraet til datamaskinen. Følg disse trinnene for å bruke Eye-Fi: Følg instruksjonene som følger med Eye-Fi-kortet for å konfigurere en Eye-Fi-konto. Sett inn Eye-Fi-kortet i kameraet. Slå på kameraet ditt. ...

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hele poenget med å lagre nyttig informasjon er for å kunne finne den senere. Tagging i Evernote er fundamentalt lik for alle plattformer og er ekstremt nyttig når du dash om å prøve å skrive inn notater på hvilken enhet du bruker på den tiden. For å lage en tagg for et notat på en datamaskin eller ...