Video: Hvordan håndterer man en manglende forståelse fra omverdenen? 2024
Funksjonen cor () i R kan håndtere manglende dataverdier på flere måter. For det setter du argumentet til en av de mulige tekstverdiene. Verdien for bruksargumentet er spesielt viktig hvis du beregner korrelasjonene til variablene i en dataramme. Ved å sette dette argumentet til forskjellige verdier, kan du
-
Bruk alle observasjoner ved å sette use = 'everything' . Dette betyr at hvis det er noen NA-verdi i en av variablene, er den resulterende korrelasjonen også NA. Dette er standard.
-
Ekskluder alle observasjoner som har NA for minst én variabel. For dette angir du bruk = 'fullfør. obs'. Vær oppmerksom på at dette kun gir deg noen få observasjoner hvis manglende verdier spres gjennom hele databasen.
-
Ekskluder observasjoner med NA verdier for hvert par variabler du undersøker. For at du angir argumentet, bruk = 'parvis'. Dette sikrer at du kan beregne korrelasjonen for hvert par variabler uten å miste informasjon på grunn av manglende verdier i de andre variablene.
Faktisk kan du beregne ulike mål for korrelasjon. Som standard beregner R standard Pearson korrelasjonskoeffisienten. For data som ikke er normalt distribuert, kan du bruke cor () -funksjonen til å beregne Spearman rangkorrelasjonen, eller Kendalls tau. For dette må du angi metode argumentet til riktig verdi.