En autokorrelasjonsplot viser egenskapene til en type data kjent som en tidsserie. En tidsserie refererer til observasjoner av en enkelt variabel over en angitt tidshorisont. For eksempel er den daglige prisen på Microsoft-lager i løpet av 2013 en tidsserie.
Tverrsnittsdata refererer til observasjoner på mange variabler på et enkelt tidspunkt. For eksempel vil sluttkursene for de 30 aksjene som finnes i Dow Jones Industrial Average den 31. januar 2014 bli vurdert som tverrsnittsdata.
En autokorrelasjonsplott er utformet for å vise om elementene i en tidsserie er positivt korrelert, negativt korrelert eller uavhengig av hverandre. (Prefikset auto betyr "selv" - autokorrelasjon refererer spesielt til sammenhengen mellom elementene i en tidsserie.)
En autokorrelasjonsplott viser verdien av autokorrelasjonsfunksjonen (acf) på den vertikale aksen. Det kan variere fra -1 til 1.
Den horisontale aksen til et autokorrelasjonsplott viser størrelsen på lag mellom elementene i tidsseriene. For eksempel er autokorrelasjonen med lag 2 korrelasjonen mellom tidsserieelementene og de tilsvarende elementene som ble observert to tidsperioder tidligere.
Denne figuren viser et autokorrelasjonsplott for de daglige prisene på Apple-lager fra 1. januar 2013 til 31. desember 2013.
På grafen er det en vertikal linje (en "spike") som tilsvarer hvert lag. Høyden til hver spike viser verdien av autokorrelasjonsfunksjonen for lagret.
Autokorrelasjonen med lag null er alltid 1, fordi dette representerer autokorrelasjonen mellom hvert term og seg selv. Pris og pris med lag null er den samme variabelen.
Hver spike som stiger over eller faller under stiplede linjer, anses å være statistisk signifikant. (Kapittel 16 snakker om dette i detalj.) Dette betyr at spissen har en verdi som er vesentlig forskjellig fra null. Hvis en spike er vesentlig forskjellig fra null, er det tegn på autokorrelasjon. En spike som er nær null er bevis mot autokorrelasjon.
I dette eksemplet er toppene statistisk signifikante for lags opptil 24. Dette betyr at Apple-aksjekursene er høyt korrelerte med hverandre. Med andre ord, når prisen på Apple-bestanden stiger, har den en tendens til å fortsette å stige.Når prisen på Apple-bestanden faller, har den en tendens til å fortsette å falle. Denne figuren illustrerer dette.
Selv om de daglige prisene på Apple-aksjen er svært korrelerte, kan det ikke være daglig avkastning. Du beregner daglige avkastninger fra de daglige prisene som følger:
hvor
r t = Den kontinuerlig sammensatte avkastningen på tidspunktet t
P t = Prisen på tiden t
Pt -1 = Prisen til tiden t - 1 (en periode før t)
ln = Den naturlige logaritmen
Den naturlige logaritmen er logaritmen med base e, som er omtrent lik 2. 71828 ….
Denne figuren viser et autokorrelasjonsplott for den daglige avkastningen til Apple-aksjen fra 1. januar 2013 til 31. desember 2013.
Autokorrelasjonsplottet for daglig retur til Apple-lager viser at de fleste av pigger ikke er statistisk signifikante. Dette indikerer at avkastningen ikke er høyt korrelert, som vist her.
Grafikken viser at bortsett fra en stor nedgang, går avkastningen til Apple-lager mellom 1. januar, 2013 og 31. desember 2013 viser ikke noe spesielt mønster - de har en tendens til å svinge tilfeldig rundt null. Dette betyr at avkastningen er stort sett uavhengig av hverandre.
Du kan bruke et autokorrelasjonsplott for å avgjøre om elementene i en tidsserie er tilfeldig (det vil si uten tilknytning til hverandre). Dette er viktig fordi mange statistiske tester som involverer tidsserier, er basert på denne antagelsen.
Som du ser, er det mange forskjellige måter å visualisere dataene på. Et bilde er verdt tusen ord, som det sier. Og det gjelder helt sikkert i dataanalyse. Statistiske programvarepakker er vanligvis utstyrt med brukervennlige grafiske verktøy. Ved å utnytte dem, kan du raskt få innblikk i dataene dine at ingen mengde antall knase kan gi deg.
