Video: The Third Industrial Revolution: A Radical New Sharing Economy 2025
En annen nyttig applikasjon for å subdate datarammer er å finne og fjerne rader med manglende data. R-funksjonen for å sjekke at dette er fullført. saker(). Du kan prøve dette på den innebygde datasettets luftkvalitet, en dataramme med en mengde manglende data: >> str (luftkvalitet)> fullført. tilfeller (luftkvalitet)
Resultatene av komplett. tilfeller () er en logisk vektor med verdien TRUE for rader som er komplette, og FALSE for rader som har noen NA-verdier. For å fjerne radene med manglende data fra luftkvalitet, prøv følgende:
Som alltid med R, er det mer enn én måte å oppnå målet på. I dette tilfellet kan du gjøre bruk av na. omit () for å utelate alle rader som inneholder NA-verdier: >> x <- na. uteluft (air quality)
Når du er sikker på at dataene dine er rene, kan du begynne å analysere det ved å legge til beregnede felt.
Hvis du bruker noen av disse metodene til å dele dataene dine eller rydde ut manglende verdier, husk å lagre resultatet i en ny gjenstand. R endrer ikke noe i den opprinnelige datarammen med mindre du eksplisitt overskriver den. Det er en god ting, fordi du ikke kan slå opp dataene dine ved et uhell.