Video: Tommaso Ciampa vs. Keith Lee vs. Finn Bálor – No. 1 Contender’s Match: WWE NXT, Dec. 11, 2019 2025
Når du analyserer data for infographics, bør du være oppmerksom på at noen datapunkter, kjent som utelukker - ligger så langt utenfor normen som ta hensyn til seg selv. I de mest alvorlige tilfellene kan de til og med skje data og skape et misvisende bilde av emnet. Du må gjenkjenne når du har en outlier og deretter bestemme hva du skal gjøre med det.
Denne tabellen inneholder et enkelt eksempel for å demonstrere denne ideen. De to datasettene representerer studentens karakterer i åtte uker på to ukentlige eksamener; tallene er prosentandelen riktig på eksamen. Datasettet til venstre (den første eksamenen) inneholder ikke en outlier, men datasettet til høyre (den andre eksamenen) gjør det. Den ene outlier er vist med fet skrift.
Uke | Karakterer (ingen utjevner) | Grader (en outlier) |
---|---|---|
1 | 90% | 90% |
2 | 88% | 88% |
3 | 90% | 90% |
4 | 85% | 50% |
5 | 86% | 86% |
6 | 87% | 87% |
7 | 85% | 85% |
8 | 84% | 84% |
Gjennomsnittlig > 87% | 83% |
|
Hva gjør en datalogist i et slikt tilfelle? Her er noen alternativer:
Kaste ut outlier.
-
Hvis du bare bruker gjennomsnittet i grafikken og er bekymret for at det er misvisende, eliminerer du outlier som en aberrasjon og beregner deretter gjennomsnittet uten den uken, som vist på figuren.
Hvis du går med dette alternativet, må du legge til en fotnote som forklarer alt: i dette tilfellet slettes et datapunkt. Vær alltid så gjennomsiktig som mulig.
Vis dataene som er.
-
Uansett om du bare bruker gjennomsnittet i grafikken eller plotter alle dataene i et diagram, kan du alltid presentere dataene nøyaktig som det kom til deg, som vist i figuren nedenfor. I dette tilfellet bør du legge til en fotnote som ringer utlederen slik at leseren er fullt klar over det.
Konstruer en "linje med best passform. "
-
Dette alternativet gjelder bare hvis du skal lage et diagram som viser alle dataene. En linje med best egnethet - også kalt en lineær regresjon - er et visuelt gjennomsnitt av dataene dine: bokstavelig talt linjen som representerer dine spredte datapunkter best.
