Video: Excel på norsk: Lage en unik liste fra en tabell 2024
For å finne ut hvilke data som kan bli fakturert når du arbeider i R, la oss se på datasettet mtcars. Dette innebygde datasettet beskriver drivstofforbruk og ti forskjellige designpunkter fra 32 biler fra 1970-tallet. Den inneholder totalt 11 variabler, men alle er numeriske.
Selv om du kan arbeide med datarammen som det er, kan noen variabler konverteres til en faktor fordi de har en begrenset mengde verdier.
Hvis du ikke vet hvor mange forskjellige verdier en variabel har, kan du få denne informasjonen i to enkle trinn:
-
Få de unike verdiene til variabelen ved å bruke unik () .
-
Få lengden på den resulterende vektoren ved å bruke lengde () .
Med funksjonen sapply () kan du gjøre dette for hele datarammen samtidig. Du bruker en anonym funksjon som kombinerer begge nevnte trinn på hele datarammen, slik som dette:
Du har 32 forskjellige observasjoner i datasettet, så ingen av variablene har bare unike verdier.
Når man skal behandle en variabel som en faktor, avhenger litt av situasjonen, men som regel må man unngå mer enn ti forskjellige nivåer i en faktor og prøve å ha minst fem verdier per nivå.