Innholdsfortegnelse:
- Boxplot (også kalt boks og whiskers )
- Betinget boxplot
- Parallelle koordinater
- Gevinstdiagrammer (også kalt akkumulative gevinster)
- Løftdiagrammer
Video: GeoGebra - 58 Derivasjon V 2025
Boxplot (også kalt boks og whiskers )
Histogrammer beskriver distribusjoner av kontinuerlige variabler, men har begrenset verdi for visning detaljer. En boxplot er et alternativ. Hjertet av bildet er en boks; Dette representerer halvparten av dataene, tatt i midten av sitt utvalg.
Senteret av boksen er medianverdien til variabelen, og boksenes nedre og øvre ende representerer henholdsvis 25 og 75 prosent. Whiskers strekker seg under og over boksen, som representerer rekkevidden av hoveddelen av dataene. Poeng utover whiskers er tatt for å være outliers, svært atypiske verdier (noen plottinger indikerer også ekstremer, som er uregelmessige blant utestengere).
Betinget boxplot
Boksplotter for flere grupper (for eksempel geografiske områder) kan plasseres side om side på en enkelt graf for enkel sammenligning.
Parallelle koordinater
Plottene viser verdier for flere variabler alle sammen på en enkelt plot, med verdiene for hvert tilfelle koblet til linjesegmenter. Vanlige kombinasjoner skiller seg ut fra resten. For eksempel viser figuren flere variabler knyttet til biler og drivstofforbruk.
Mange tilfeller deler bestemte verdier, nøyaktig eller omtrentlig, danner mørke mønstre fra de mange linjene som følger lignende baner over grafen. For eksempel danner tilfeller for biler med fire sylindere, lav forskyvning, høy kjørelengde og senke modellår et veldig mørkt og iøynefallende mønster.
Gevinstdiagrammer (også kalt akkumulative gevinster)
En gevinstdiagram viser hvor mye en prediktiv modell forbedrer resultatene over tilfeldig prøvetaking. Noen mennesker er mer sannsynlig å ta tiltak (kjøpe et produkt, stemme på en kandidat, bryte loven …) enn andre. Hvis du ikke vet noe om en gruppe mennesker, er det beste du kan si at det å kontakte halvparten av folket vil komme opp til halvparten av dem som vil handle.
Men en prediktiv modell kan fortelle deg hvilke personer som er de beste utsiktene, så du kan bruke modellen til å velge halvparten (eller 10 prosent eller 60 prosent osv.) Og få mer handling. Hvor mye mer?
I diagrammet kan du se en diagonal linje der verdiene x og y alltid er de samme; Dette representerer hva du vil få ved å velge potensielle kunder tilfeldig. Den andre linjen representerer modellen. Forskjellen i y -verdiene mellom modellen og tilfeldig utvalg viser hvor mye modellen forbedrer resultatet. Les modelllinjen plottet på diagrammet, og sammenlign det med linjen for tilfeldig prøvetaking.
Løftdiagrammer
Løftdiagrammer ligner meget på gevinster. Hovedforskjellen er at dataene er normalisert, slik at tilfeldig prøvetaking alltid representeres som en verdi på 1, og modellresultater vises i forhold til tilfeldig prøvetaking.
Du kan se flere forskjellige typer diagrammer som kalles løfteoversikt. Noen er kumulative, og andre er ikke. Noen kan til og med være gevinster diagrammer
