Video: Tutorial Membuat Grafik Regresi dan Nilai Korelasi Dengan Menggunakan MINITAB 2025
Et histogram er en graf som representerer sannsynlighetsfordelingen av et datasett. Et histogram har en serie vertikale streker hvor hver linje representerer en enkelt verdi eller en rekke verdier for en variabel. Høydene til stolpene angir frekvensene eller sannsynlighetene for de forskjellige verdiene eller verdier.
For eksempel viser dette figuren et histogram av de daglige prisene på Apple-lager fra 1. januar 2013 til 31. desember 2013.
I følge dette histogrammet var de fleste prisene mellom $ 60 og $ 65; prisen var i dette området 81 ganger i løpet av året. Den nest mest observerte prisen var mellom $ 55 og $ 60; prisen landet i dette området 44 ganger i løpet av året. Det tredje hyppigst utvalg av priser var mellom $ 65 og $ 70, og det fjerde hyppigste utvalg av priser var mellom $ 70 og $ 75. Svært få priser var mellom $ 50 og $ 55, og de minste prisene som ble observert i løpet av året var mellom $ 80 og $ 85.
Basert på grafen var gjennomsnittlig og medianprisen nær $ 60 til $ 65-serien. Selve gjennomsnittet var $ 65. 67, og den faktiske medianen var 63 dollar. 65. Siden gjennomsnittet overstiger medianen, var prisfordelingen for 2013 positivt skjev. Dette indikerer at sannsynligheten for en ekstremt stor pris er noe større enn sannsynligheten for en ekstremt lav pris.
En fordeling er positivt skjev hvis gjennomsnittet er større enn medianen; det er negativt skjev hvis gjennomsnittet er mindre enn medianen. Fordelingen er symmetrisk om gjennomsnittet hvis gjennomsnittet er lik medianen. Hvor mye dataene er skjev, avhenger av hvor langt gjennomsnittet og medianen er forskjellig. Hvis de er svært nær, er det noen ganger praktisk å behandle fordelingen som symmetrisk.
Som et annet eksempel, viser dette figuren et histogram av de daglige prisene på S & P 500 aksjeindeksen fra 1. januar 2013 til 31. desember 2013.
Ifølge histogrammet i figur 12-10 var det mest observert utvalg av priser i løpet av året mellom $ 1 650 og $ 1, 700. Gjennomsnittet viste seg å være $ 1, 643. 80, og medianen var $ 1, 650. 41. I motsetning til Apple-lager var gjennomsnittet under medianen; Prisutdelingen for 2013 er negativt skjev. Dette indikerer at det var en litt større tendens til at Standard og Poor's 500 skulle handle under gjennomsnittet enn over gjennomsnittet i 2013.
En av de viktigste bruken av histogrammer er å avgjøre om et datasett følger en spesifisert sannsynlighetsfordeling.Selv om det finnes mange formelle statistiske tester for å bestemme hvilken sannsynlighetsfordeling et datasett følger, er det god praksis å visuelt inspisere dataene med en graf før de engasjerer seg i noen formelle statistiske tester.
Histogrammet til Apple-prisene gir sterkt bevis på at Apple-aksjekursene er ikke normalt fordelt. Den normale fordeling er symmetrisk om dens gjennomsnitt, mens Apple-aksjekursene er positivt skjev. Histogrammet på S & P-prisene gir sterkt bevis for at S & P 500 heller ikke er normalt fordelt fordi distribusjonen er negativt skjev.
Formelle statistiske tester vil være pålagt å vise at verken distribusjon er normal, men grafene er svært suggestive. Fordi mange statistiske tester er basert på antagelsen om normalitet, er det viktig å avgjøre om en distribusjon er virkelig normal før du bruker noen av disse testene.
