Video: How to use a Casio Graphical Calculator to find Standard Deviation 2025
Det første trinnet mot prediktiv modellering er å knytte variabler til hverandre. Et enkelt, bemerkelsesverdig verktøy for det er scatterplot. Det er vant til å forholde seg til en kontinuerlig måling til en annen. Data miners strekker seg noen ganger reglene og bruker det med kategoriske variabler også.
Den horisontale ( x ) aksen til plottet representerer verdier av en variabel; Den vertikale aksen ( y ) representerer en andre variabel. Du har kanskje ikke en følelse av hvilken variabel er uavhengig, og som er avhengig av hvert par variabler.
Hvis du gjør det, bør den uavhengige variabelen være på den horisontale aksen. Hvert punkt på plottet representerer koordinatene, paret av verdier for de to variablene i en enkelt sak. (Disse parene kalles noen ganger xy par ).
Finn ditt scatterplot-verktøy og sett opp et grunnleggende scatterplot-verktøy ved å velge to variabler å bruke. Følgende figur viser dette verktøyet på menyen med oransje; Plasseringen for verktøyet varierer etter produkt.
Eksemplet i neste bilde viser et interaktivt display; scatterplot vises umiddelbart. I et annet verktøy trenger du kanskje flere trinn for å utføre og opprette diagrammet.
Scatterplot-eksemplet vedrører automatisk kjørelengde til motorhestekrefter. Lav hestekrefter er forbundet med høy kjørelengde, og jo høyere hestekrefter, desto lavere kjørelengde. Du kan enkelt se dette mønsteret i dataene. Du kan merke en form, ikke lineær, men noe buet. Dette kan gi tips om hvilke modelltyper du skal prøve senere.
Data mining applikasjoner har ofte noen interaktive funksjoner i grafdisplayer. For eksempel viser neste figur at sveve musen over et punkt avslører nøyaktige verdier for de to variablene for det punktet. Dette er lettere enn å prøve å lese verdiene fra aksene!
