Video: Statistical Programming with R by Connor Harris 2024
I motsetning til et stam-og-blad-plot er et scatterplot ment å vise forholdet mellom to variabler. Det kan være vanskelig å se om det er et forhold mellom to variabler bare ved å se på de rå dataene, men med et spredningsdiagram blir alle mønstre som finnes i dataene mye lettere å se.
Et spredningsdiagram består av en serie punkter; hvert punkt viser en enkelt verdi for to forskjellige variabler. For eksempel kan du konstruere et spredningsdiagram for å vise sammenhengen mellom et selskaps årlige inntekter og årlig fortjeneste. Hvis du prøver å forutsi fortjeneste basert på inntekter, vil X-aksen brukes til å vise årlige inntekter, og Y-aksen vil bli brukt til å vise årlig fortjeneste. Inntektene regnes derfor for å være den uavhengige variabelen, og overskudd anses å være den avhengige variabelen i dette forholdet.
På en scatterplot brukes X-aksen (det vil si den horisontale akse) til å vise uavhengige variabelen, og Y-aksen (den vertikale aksen) brukes til å vise variabelen avhengig .
I dette eksemplet viser hvert punkt på scatterplot inntekter og salg for et spesifisert år. Tabellen viser sammenhengen mellom årlige inntekter og årsresultat i et selskap i årene 2004-2014.
ÅrDu kan bruke et spredningsdiagram for å avgjøre om
De to variablene har en tendens til å bevege seg i samme retning.De to variablene har en tendens til å bevege seg i motsatt retning.
De to variablene er ikke relaterte til hverandre.
-
Hvis to variabler har en tendens til å bevege seg i samme retning, sies de å være
-
positivt korrelert;
-
hvis de pleier å bevege seg i motsatte retninger, sies de å være
negativt korrelert.Hvis to variabler ikke viser noen bestemt mønster, er de sagt å være ukorrelert. Denne figuren viser et spredningsdiagram for to variabler (X og Y) som er positivt korrelert. Scatterplot av to positivt korrelerte variabler. Spredningsdiagrammet viser at når X øker, er det en sterk tendens til at Y øker (men ikke nødvendigvis med samme mengde). Dette viser at X og Y er positivt korrelert.
Følgende figur viser det samme spredningsdiagrammet med en
trendlinje;ligningen av denne linjen er estimert med
regresjonsanalyse. Scatterplot av to positivt korrelerte variabler med en trendlinje. Trendlinjen viser hvor mye Y endres i gjennomsnitt, gitt en bestemt endring i X. En positivt skrå trendlinje indikerer at to variabler er positivt korrelert; På samme måte indikerer en negativt skrå trendlinje at to variabler er negativt korrelert. Hvis en trendlinje er flat (det vil si, har null-helling), indikerer dette at de to variablene ikke er relatert til hverandre. Den positivt skrånende trendlinjen viser at X og Y er positivt korrelert. Følgende figur viser et spredningsdiagram og trendlinjen for to variabler som er
negativtkorrelert.
Scatterplot av to negativt korrelerte variabler med en trendlinje. Spredningsdiagrammet viser at når X øker, har Y en tendens til å redusere; Treningslinjen har en negativ
skråning. Derfor er X og Ynegativt korrelert. Følgende figur viser et spredningsdiagram og trendlinjen for to variabler som er ukorrelert. Scatterplot av to ukorrelerte variabler med en trendlinje.
Spredningsdiagrammet viser at når X øker, øker Y noen ganger og avtar noen ganger. Det er ikke noe spesielt mønster for dataene. Poengene ser ut til å være tilfeldig spredt i hele diagrammet. Som et resultat er trendlinjen nesten flat, og dette viser at X og Y er ukorrelert.
For et eksempel på ekte verden viser denne figuren et spredningsdiagram av forholdet mellom prisen på Apple-lager og Standard og Poor's 500 børsindeks fra 1. januar 2013 til 31. desember 2013.Scatterplot av daglige priser på Apple lager og S & P 500. Indexet Standard og Poor's 500 (S & P 500) er et gjennomsnitt av prisene på de 500 største amerikanske aksjene. Verdien av denne indeksen gjenspeiler den generelle tilstanden til USAs økonomi. Plottet viser at det er en positiv sammenheng mellom prisen på Apple lager og S & P 500.