Hjem Personlig finansiering Slik visualiserer du Prediktiv Analyse' Raw Data - Dummies

Slik visualiserer du Prediktiv Analyse' Raw Data - Dummies

Innholdsfortegnelse:

Video: Leap Motion SDK 2025

Video: Leap Motion SDK 2025
Anonim

Et bilde er verdt tusen ord - spesielt når du prøver å få et godt håndtak på dine prediktive analysedata. Ved forbehandlingstrinnet, mens du forbereder dataene dine, er det vanlig å visualisere hva du har i hånden før du fortsetter til neste trinn.

Du starter med å bruke et regneark som Microsoft Excel for å lage en datamatrise - som består av kandidatdata funksjoner (også kalt attributter ). Flere business intelligence-programvarepakker (for eksempel Tableau) kan gi deg en foreløpig oversikt over dataene du skal bruke analytikk på.

Slik bruker du tabellvisualiseringer for prediktiv analyse

Tabeller er den enkleste og mest grunnleggende bilderepresentasjonen av data. Tabeller (også kjent som regneark ) består av rader og kolonner - som korresponderer henholdsvis til objektene og deres attributter som er nevnt tidligere, for å utarbeide dataene dine. For eksempel, vurder online sosiale nettverk data. En dataobjekt kan representere en bruker. Attributter til en bruker (dataobjekt) kan være overskrifter av kolonner: Kjønn, postnummer eller fødselsdato.

Cellene i et bord representerer verdier. Visualisering i tabeller kan hjelpe deg med å enkelt oppdage manglende attributtverdier for dataobjekter.

Tabeller kan også gi fleksibiliteten til å legge til nye attributter som er kombinasjoner av andre attributter. For eksempel, i sosiale nettverk data, kan du legge til en annen kolonne kalt Age, som lett kan beregnes - som en avledet attributt - fra den eksisterende fødselsattributtet. Tabellene sosiale nettverk data viser en ny kolonne, Age, opprettet fra en annen eksisterende kolonne (fødselsdato).

Bardiagrammer bruker i prediktiv analyse

Bardiagrammer kan brukes til å oppdage pigger eller uregelmessigheter i dataene dine. Du kan bruke den for hvert attributt for å raskt vise minimums- og maksimumverdier. Bardiagrammer kan også brukes til å starte en diskusjon om hvordan du normaliserer dataene dine.

Normalisering er justeringen av noen- eller all-attributtverdier på en skala som gjør dataene mer brukbare. For eksempel kan du enkelt se at det er en feil i dataene: Alderlinjen på en plate er negativ. Den anomali er lettere avbildet av et strekdiagram enn ved en tabell med data.

Grunnleggende om kakediagrammer for prediktiv analyse

Kakediagrammer brukes hovedsakelig for å vise prosentandeler. De kan enkelt illustrere fordelingen av flere elementer, og markere den mest dominerende. Rå data for sosialt nettverk er representert i henhold til aldersattributtet.Legg merke til at diagrammet ikke bare viser en klar fordeling av menn mot kvinner, men også en sannsynlig feil: R som en verdi for kjønnstype muligens opprettet når dataene ble samlet inn.

Slik bruker du grafdiagrammer for prediktiv analyse

Grafteori gir et sett med kraftige algoritmer som kan analysere data strukturert og representert som en graf. I datavitenskap er en graf datastruktur, en måte å organisere data som representerer forhold mellom par av dataobjekter. En graf består av to hoveddeler:

  • Vertikaler, også kjent som noder

  • Kant, som forbinder par noder

Kantene kan rettes (tegnet som piler) og kan ha vekter. Du kan bestemme å plassere en kanten mellom to noder (sirkler) - i dette tilfellet medlemmene av det sosiale nettverk som er knyttet til andre medlemmer som venner:

Pilens retning indikerer hvem som "venner" som først, eller som starter interaksjoner mesteparten av tiden.

Grunnleggende om ordskyger for prediktiv analyse

Vurder en liste over ord eller begreper ordnet som en ordsky - en grafisk representasjon av alle ordene på listen, og viser størrelsen på hvert ord som proporsjonal til en beregning du angir. Hvis du for eksempel har et regneark med ord og hendelser, og du vil identifisere de viktigste ordene, kan du prøve et ordsky.

Ordskyger fungerer fordi de fleste organisasjoners data er tekst; Et vanlig eksempel er at Twitter bruker trending. Hvert sikt i denne representasjonen har en vekt som påvirker størrelsen som en indikator på dens relative betydning.

En måte å definere den vekten på, kan være hvor mange ganger et ord vises i datainnsamlingen. Jo oftere et ord dukker opp, jo tyngre er dets vekt - og jo større vises i skyen.

Slik bruker du flocking fugle representasjon for prediktiv analyse

Naturlig flocking oppførsel generelt er et selvorganiserende system der gjenstander (spesielt levende ting) har en tendens til å oppføre seg i henhold til (a) miljøet de tilhører og (b) deres svar på andre eksisterende objekter. Den flockende oppførselen til naturlige samfunn som biene, fluene, fuglene, fiskene og myrene - eller, for det saks skyld, folk - er også kjent som svarm intelligens .

Fugler følger naturlige regler når de oppfører seg som en flokk. Flock-mates er fugler plassert med en viss avstand fra hverandre; de fuglene anses som like. Hver fugl beveger seg i henhold til de tre hovedreglene som organiserer flocking.

  • Separasjon: Flockmates må ikke kollidere med hverandre.

  • Justering: Flock-mates å bevege seg i samme gjennomsnittlige retning som sine naboer.

  • Samhørighet: Flockmates beveger seg i henhold til den gjennomsnittlige posisjonen eller plasseringen av deres flockmates.

Modellering av de tre reglene kan gjøre det mulig for et analysesystem å simulere flocking atferd. Ved hjelp av den selvorganiserte naturlige oppførelsen av flocking fugler, kan du konvertere et greit regneark til en visualisering.Nøkkelen er å definere begrepet likhet som en del av dataene dine. Start med et par spørsmål:

  • Hva ligner to dataobjekter i dataene dine?

  • Hvilke attributter kan best kjøre likheten mellom to dataposter?

For eksempel, i sosiale nettverk data, representerer datapostene individuelle brukere; Attributtene som beskriver dem kan omfatte alder, postnummer, relasjonsstatus, venneliste, antall venner, vaner, hendelser

Slik visualiserer du Prediktiv Analyse' Raw Data - Dummies

Redaktørens valg

10 Tips for visuelt analysere og presentere data i Excel - dummies

10 Tips for visuelt analysere og presentere data i Excel - dummies

Her er noen konkrete forslag om hvordan du med hell kan bruke diagrammer som dataanalyseværktøy i Excel, og hvordan du kan bruke diagrammer for å mer effektivt kommunisere resultatene av dataanalysen du gjør. Bruk riktig diagramtype Hva mange mennesker ikke skjønner er at du bare kan lage fem ...

10 Måter å forbedre Power Pivot Performance - dummies

10 Måter å forbedre Power Pivot Performance - dummies

Når du publiserer Power Pivot-rapporter på nettet, har du tenkt for å gi publikum den beste opplevelsen som er mulig. En stor del av denne erfaringen er å sikre at ytelsen er god. Ordet ytelse (som det gjelder applikasjoner og rapportering) er vanligvis synonymt med hastighet - eller hvor raskt et program utfører bestemte handlinger ...

Legger ekstra analyselagre til Excel-diagrammer - dummies

Legger ekstra analyselagre til Excel-diagrammer - dummies

Det er ikke uvanlig å bli bedt om å legge til Ekstra analyse til din visualisering som vanligvis ikke er plottet på et Excel-diagram. For eksempel viser dette diagramet salg for hvert kvartal, men klienten vil kanskje også se prosentveksten i samme kvartal. De fleste Excel-analytikere oppfyller dette behovet med faktiske tekstbokser. ...

Redaktørens valg

Reise fotografering kamera sammenligning diagram - dummies

Reise fotografering kamera sammenligning diagram - dummies

Fra smarte telefoner til punkt-og-skyte og digitale speilreflekskameraer, du har en mange fotograferingsvalg der ute. Bruk følgende diagram for å se hvilken type kamera som passer best for deg. Smartphone Point-and-shoot dSLR Bildesensor Kvalitet Lav til middels Medium Høy Vannbestandig (egnet for basseng) Sjeldne Få modeller Sjeldne Optiske Zoom Lav ...

Ta et makrofoto-dummies

Ta et makrofoto-dummies

Fotografi (makrofotografi) gir deg den som ser bildene dine, utsikt over verden ikke normalt sett av det blotte øye. De fleste kameraer, selv smarttelefoner, kan skyte ting med en rimelig nærhet med en viss grad av klarhet og fokus. Mens du reiser, finner du ting som skyter nærbilde, for eksempel hva du spiser til middag, en merkelig feil, ...

Forestille et Moving Object - dummies

Forestille et Moving Object - dummies

Når du ser et bilde, skjønner du selv hva som skjedde da det ble tatt. Noen bilder kan innebære bevegelse eller aktivitet. For eksempel kan du fokusere på en sykkel som beveger seg nedover gaten med bygningene bak den sløret. Dette er annerledes enn grunne dybdeskarphet, men fordi blenderåpningen ikke er det som skaper ...

Redaktørens valg

ACT-strategi for å multiplisere en horisontal matrise med en vertikal matrise - dummies

ACT-strategi for å multiplisere en horisontal matrise med en vertikal matrise - dummies

På ACT Matematisk test, du må sannsynligvis multiplisere par matriser som har enten en rad eller en kolonne. En enkel måte å formere en horisontal matrise med en vertikal matris er å sette opp et lite rutenett. Denne metoden lar deg fylle ut tallene for å få det riktige svaret. Matrix ...

ACT-strategi for å løse en matrise ved hjelp av en determinant-dummies

ACT-strategi for å løse en matrise ved hjelp av en determinant-dummies

Er en determinant en vanlig operasjon utført på en firkantet matrise. På ACT Math-testen er den eneste determinantformelen du trenger å være kjent med, for en 2 x 2-matrise. Her er formelen for determinanten av Merk at determinanten av en matrise bare er et tall, ikke en matrise. Å ...

ACT Trick for Quadratics: Slik finner du raskt en Parabola-dummies retning

ACT Trick for Quadratics: Slik finner du raskt en Parabola-dummies retning

For å spare tid når du graver en kvadratisk funksjon på ACT Math-testen, kan du raskt bestemme retningen for parabolen ved hjelp av et enkelt triks basert på koeffisienten a. Dette trikset vedrører tegnet på variabelen a (i uttrykket ax2): Når a er positivt, er grafen konkav opp. I ...