Innholdsfortegnelse:
- Slik bruker du tabellvisualiseringer for prediktiv analyse
- Bardiagrammer bruker i prediktiv analyse
- Grunnleggende om kakediagrammer for prediktiv analyse
- Slik bruker du grafdiagrammer for prediktiv analyse
- Grunnleggende om ordskyger for prediktiv analyse
- Slik bruker du flocking fugle representasjon for prediktiv analyse
Video: Leap Motion SDK 2025
Et bilde er verdt tusen ord - spesielt når du prøver å få et godt håndtak på dine prediktive analysedata. Ved forbehandlingstrinnet, mens du forbereder dataene dine, er det vanlig å visualisere hva du har i hånden før du fortsetter til neste trinn.
Du starter med å bruke et regneark som Microsoft Excel for å lage en datamatrise - som består av kandidatdata funksjoner (også kalt attributter ). Flere business intelligence-programvarepakker (for eksempel Tableau) kan gi deg en foreløpig oversikt over dataene du skal bruke analytikk på.
Slik bruker du tabellvisualiseringer for prediktiv analyse
Tabeller er den enkleste og mest grunnleggende bilderepresentasjonen av data. Tabeller (også kjent som regneark ) består av rader og kolonner - som korresponderer henholdsvis til objektene og deres attributter som er nevnt tidligere, for å utarbeide dataene dine. For eksempel, vurder online sosiale nettverk data. En dataobjekt kan representere en bruker. Attributter til en bruker (dataobjekt) kan være overskrifter av kolonner: Kjønn, postnummer eller fødselsdato.
Cellene i et bord representerer verdier. Visualisering i tabeller kan hjelpe deg med å enkelt oppdage manglende attributtverdier for dataobjekter.
Tabeller kan også gi fleksibiliteten til å legge til nye attributter som er kombinasjoner av andre attributter. For eksempel, i sosiale nettverk data, kan du legge til en annen kolonne kalt Age, som lett kan beregnes - som en avledet attributt - fra den eksisterende fødselsattributtet. Tabellene sosiale nettverk data viser en ny kolonne, Age, opprettet fra en annen eksisterende kolonne (fødselsdato).
Bardiagrammer bruker i prediktiv analyse
Bardiagrammer kan brukes til å oppdage pigger eller uregelmessigheter i dataene dine. Du kan bruke den for hvert attributt for å raskt vise minimums- og maksimumverdier. Bardiagrammer kan også brukes til å starte en diskusjon om hvordan du normaliserer dataene dine.
Normalisering er justeringen av noen- eller all-attributtverdier på en skala som gjør dataene mer brukbare. For eksempel kan du enkelt se at det er en feil i dataene: Alderlinjen på en plate er negativ. Den anomali er lettere avbildet av et strekdiagram enn ved en tabell med data.
Grunnleggende om kakediagrammer for prediktiv analyse
Kakediagrammer brukes hovedsakelig for å vise prosentandeler. De kan enkelt illustrere fordelingen av flere elementer, og markere den mest dominerende. Rå data for sosialt nettverk er representert i henhold til aldersattributtet.Legg merke til at diagrammet ikke bare viser en klar fordeling av menn mot kvinner, men også en sannsynlig feil: R som en verdi for kjønnstype muligens opprettet når dataene ble samlet inn.
Slik bruker du grafdiagrammer for prediktiv analyse
Grafteori gir et sett med kraftige algoritmer som kan analysere data strukturert og representert som en graf. I datavitenskap er en graf datastruktur, en måte å organisere data som representerer forhold mellom par av dataobjekter. En graf består av to hoveddeler:
-
Vertikaler, også kjent som noder
-
Kant, som forbinder par noder
Kantene kan rettes (tegnet som piler) og kan ha vekter. Du kan bestemme å plassere en kanten mellom to noder (sirkler) - i dette tilfellet medlemmene av det sosiale nettverk som er knyttet til andre medlemmer som venner:
Pilens retning indikerer hvem som "venner" som først, eller som starter interaksjoner mesteparten av tiden.
Grunnleggende om ordskyger for prediktiv analyse
Vurder en liste over ord eller begreper ordnet som en ordsky - en grafisk representasjon av alle ordene på listen, og viser størrelsen på hvert ord som proporsjonal til en beregning du angir. Hvis du for eksempel har et regneark med ord og hendelser, og du vil identifisere de viktigste ordene, kan du prøve et ordsky.
Ordskyger fungerer fordi de fleste organisasjoners data er tekst; Et vanlig eksempel er at Twitter bruker trending. Hvert sikt i denne representasjonen har en vekt som påvirker størrelsen som en indikator på dens relative betydning.
En måte å definere den vekten på, kan være hvor mange ganger et ord vises i datainnsamlingen. Jo oftere et ord dukker opp, jo tyngre er dets vekt - og jo større vises i skyen.
Slik bruker du flocking fugle representasjon for prediktiv analyse
Naturlig flocking oppførsel generelt er et selvorganiserende system der gjenstander (spesielt levende ting) har en tendens til å oppføre seg i henhold til (a) miljøet de tilhører og (b) deres svar på andre eksisterende objekter. Den flockende oppførselen til naturlige samfunn som biene, fluene, fuglene, fiskene og myrene - eller, for det saks skyld, folk - er også kjent som svarm intelligens .
Fugler følger naturlige regler når de oppfører seg som en flokk. Flock-mates er fugler plassert med en viss avstand fra hverandre; de fuglene anses som like. Hver fugl beveger seg i henhold til de tre hovedreglene som organiserer flocking.
-
Separasjon: Flockmates må ikke kollidere med hverandre.
-
Justering: Flock-mates å bevege seg i samme gjennomsnittlige retning som sine naboer.
-
Samhørighet: Flockmates beveger seg i henhold til den gjennomsnittlige posisjonen eller plasseringen av deres flockmates.
Modellering av de tre reglene kan gjøre det mulig for et analysesystem å simulere flocking atferd. Ved hjelp av den selvorganiserte naturlige oppførelsen av flocking fugler, kan du konvertere et greit regneark til en visualisering.Nøkkelen er å definere begrepet likhet som en del av dataene dine. Start med et par spørsmål:
-
Hva ligner to dataobjekter i dataene dine?
-
Hvilke attributter kan best kjøre likheten mellom to dataposter?
For eksempel, i sosiale nettverk data, representerer datapostene individuelle brukere; Attributtene som beskriver dem kan omfatte alder, postnummer, relasjonsstatus, venneliste, antall venner, vaner, hendelser
