Video: One seed at a time, protecting the future of food | Cary Fowler 2024
Før du utfører en hvilken som helst type statistisk analyse, er det viktig å forstå innholdet av dataene som analyseres. Du kan bruke EDA til å identifisere egenskapene til et datasett for å bestemme de mest hensiktsmessige statistiske metodene for å søke på dataene. Du kan undersøke flere typer egenskaper med EDA-teknikker, inkludert følgende:
-
Datasenteret
-
Spredningen mellom datamedlemmene
-
Datas skjevhet
-
Sannsynlighetsfordelingen dataene følger
-
Korrelasjonen mellom elementene i datasettet
-
Hvorvidt parametrene til dataene er konstante over tid < Tilstedeværelsen av avvikere i dataene
-
Et annet sentralt spørsmål EDA svar er "Går dataene i overensstemmelse med våre forutsetninger? "Å identifisere egenskapene til et datasett er svært viktig, fordi mange statistiske prosedyrer er følsomme for forutsetningene du gjør om dataene.