Hjem Personlig finansiering Bygger på Basic Scatterplots - dummies

Bygger på Basic Scatterplots - dummies

Video: Statistical Programming with R by Connor Harris 2025

Video: Statistical Programming with R by Connor Harris 2025
Anonim

Data miners benytter ofte spesielle funksjoner for å pakke mer informasjon til enkle diagrammer. Etiketter, overlegg og interaktivt utvalg er kjennetegn ved data mining applikasjoner, spesialfunksjoner som gjør at du kan være mer produktiv.

Kjørelengde minker etter hvert som hestekrefter øker, som vist i figuren nedenfor.

Kjørelengde øker med tiden, som du ser, en scatterplot av kjørelengde mot modellår. Det ville være nyttig å få disse to ideene til en graf.

Vanlige data-mining tilnærminger for å integrere mer enn to variabler i en graf inkluderer

  • Etiketter: Etiketter er verdier av en streng eller kategorisk variabel som er lagt over på scatterplot. Følgende figur viser en scatterplot merket med modellår på bilen.

    Datasett med mange poeng eller lange etiketter kan gjøre disse diagrammene ulæselige, skjønt! Løsningen er å bruke bare en prøve av dataene. Oppsett for denne typen prøvetaking er vist i følgende figur.

  • Overlays: Med overlays definerer verdier for en kategorisk variabel poengets form eller farge. Følgende figur viser oppsettet for en scatterplot til overleggsmodell år på kilometer-mot-hestekrefter scatterplot.

    Det eksporterte overlegget spredningsplott vises i følgende bilde. Det kan være lettere å lese fargeoverlegg enn punktoverlag. Oppsettet er vanligvis mye det samme.

En annen ting å huske på med scatterplots: Du kan ha flere poeng som faller på samme sted! Hvis det er tilfelle, kan du kanskje ikke fortelle et poeng for en sak fra et punkt for 100 tilfeller. Løsningen er å se etter et alternativ for å gjøre flere forekomster synlige. Se etter punktstørrelse eller jitter (flytter poeng litt av deres sanne steder for å gjøre dem alle synlige).

Interaktive scatterplots er gode tidsbesparende for data miners.

Si at du ser en interessant gruppe saker i en graf, og du vil undersøke bare de tilfellene. Hvis du ser på bare ett eller to poeng, kan du få informasjonen du vil ha ved å svinge, men det er ikke tilfredsstillende når du er interessert i mer enn noen få poeng.

Datavalgsverktøy i interaktive scatterplots gir deg mer kraft til å velge data. Følgende figur viser samme diagramoppsett, men med en gruppe poeng valgt ved å klikke og dra musen rundt dem. Dette er ikke bare en visuell funksjon.

Du kan eksportere de valgte punktene som et nytt datasett. Dette er veldig praktisk og raskt!

Hvis poengene du trenger ikke passer fint inn i et rektangulært utvalg, har du andre alternativer. Se Zoom / Velg-området. Du kan se en knapp med et rektangel for rektangulært valg og en annen med en rundform for valgfri form.

Her er et eksempel på fritaksvalg med data om nikotininnholdet i sigaretter solgt i forskjellige deler av verden. Denne scatterplot viser nikotin per sigarett for prøver fra de seks FN-regionene. (Dette er en uradisjonell bruk av en scatterplot, fordi regionen ikke er en kontinuerlig variabel, det er kategorisk. Data miners bruker ofte tradisjonelle verktøy på uradisjonelle måter.)

Poengene i en region faller ikke i en perfekt vertikal linje. Små skift (jitter) til venstre og høyre er laget for lesbarhet og utseende bare. Noen sigaretter har eksepsjonelt høye nivåer av nikotin, og du vil velge de tilfellene.

En rullegardinmeny tilbyr valgmuligheter. Polygon-valg lar deg markere et fritt formområde på scatterplot.

For å markere, klikk på grafen for å lage et utgangspunkt, og klikk deretter igjen og igjen rundt gruppen av poeng du vil ha til du har gjort formen du trenger.

Et høyreklikk indikerer at du har fullført valget; dette er synlig fra høydepunktet på grafen.

Bygger på Basic Scatterplots - dummies

Redaktørens valg

10 Tips for visuelt analysere og presentere data i Excel - dummies

10 Tips for visuelt analysere og presentere data i Excel - dummies

Her er noen konkrete forslag om hvordan du med hell kan bruke diagrammer som dataanalyseværktøy i Excel, og hvordan du kan bruke diagrammer for å mer effektivt kommunisere resultatene av dataanalysen du gjør. Bruk riktig diagramtype Hva mange mennesker ikke skjønner er at du bare kan lage fem ...

10 Måter å forbedre Power Pivot Performance - dummies

10 Måter å forbedre Power Pivot Performance - dummies

Når du publiserer Power Pivot-rapporter på nettet, har du tenkt for å gi publikum den beste opplevelsen som er mulig. En stor del av denne erfaringen er å sikre at ytelsen er god. Ordet ytelse (som det gjelder applikasjoner og rapportering) er vanligvis synonymt med hastighet - eller hvor raskt et program utfører bestemte handlinger ...

Legger ekstra analyselagre til Excel-diagrammer - dummies

Legger ekstra analyselagre til Excel-diagrammer - dummies

Det er ikke uvanlig å bli bedt om å legge til Ekstra analyse til din visualisering som vanligvis ikke er plottet på et Excel-diagram. For eksempel viser dette diagramet salg for hvert kvartal, men klienten vil kanskje også se prosentveksten i samme kvartal. De fleste Excel-analytikere oppfyller dette behovet med faktiske tekstbokser. ...

Redaktørens valg

Data Visualisering Storyboard: Dokumentasjon Key Performance Indicators (KPIs) - dummies

Data Visualisering Storyboard: Dokumentasjon Key Performance Indicators (KPIs) - dummies

Forstå nøkkelmålinger som publikum må vise, overvåke eller spore er det siste skrittet i utviklingen av historien din. Enkelt sagt er en nøkkelindikator (KPI) en kjerne-måling som knytter seg direkte til selskapets mål. Gjennomføre scoping-workshops Den beste måten å jobbe med publikum på for å dokumentere KPI-er er ...

Data Visualisering Storyboard: Dokumentasjonsmål - dummies

Data Visualisering Storyboard: Dokumentasjonsmål - dummies

Å Få en klar forståelse av målgruppens mål og eksisterende smertepunkter vil hjelpe du bestemmer hva du skal inkludere og - enda viktigere - hva som ikke skal inkluderes i storyboardet. Den enkleste måten å gjøre dette på, kan være å holde en liten planleggingsøkt som inkluderer executive sponsor (hvis det er en) og ...

Data Visualisering Storyboard: Identifisere målgruppen din - dummies

Data Visualisering Storyboard: Identifisere målgruppen din - dummies

Det første trinnet i å utvikle et klart storyboard for deg datavisualisering identifiserer publikum. Hvem du bygger data visualisering for å bestemme hvilken type storyboard du utvikler og hvilket nivå av data du viser. Den enkleste måten å klassifisere målgruppen din er å se på to enkle komponenter: forretningsområde ...

Redaktørens valg

ACT-strategi for å multiplisere en horisontal matrise med en vertikal matrise - dummies

ACT-strategi for å multiplisere en horisontal matrise med en vertikal matrise - dummies

På ACT Matematisk test, du må sannsynligvis multiplisere par matriser som har enten en rad eller en kolonne. En enkel måte å formere en horisontal matrise med en vertikal matris er å sette opp et lite rutenett. Denne metoden lar deg fylle ut tallene for å få det riktige svaret. Matrix ...

ACT-strategi for å løse en matrise ved hjelp av en determinant-dummies

ACT-strategi for å løse en matrise ved hjelp av en determinant-dummies

Er en determinant en vanlig operasjon utført på en firkantet matrise. På ACT Math-testen er den eneste determinantformelen du trenger å være kjent med, for en 2 x 2-matrise. Her er formelen for determinanten av Merk at determinanten av en matrise bare er et tall, ikke en matrise. Å ...

ACT Trick for Quadratics: Slik finner du raskt en Parabola-dummies retning

ACT Trick for Quadratics: Slik finner du raskt en Parabola-dummies retning

For å spare tid når du graver en kvadratisk funksjon på ACT Math-testen, kan du raskt bestemme retningen for parabolen ved hjelp av et enkelt triks basert på koeffisienten a. Dette trikset vedrører tegnet på variabelen a (i uttrykket ax2): Når a er positivt, er grafen konkav opp. I ...