Video: Curso Java 14 - Leer y Escribir Ficheros @JoseCodFacilito 2024
En av de enkleste og mest pålitelige måter å få data på i R er å bruke tekstfiler, spesielt CSV-filer (kommaseparerte verdier). CSV-filformatet bruker kommaer for å skille de forskjellige elementene i en linje, og hver linje av data er i sin egen linje i tekstfilen, noe som gjør CSV-filer ideelle for å representere tabelldata.
Den ekstra fordelen med CSV-filer er at nesten alle dataprogrammer støtter eksport av data til CSV-formatet. Dette er sikkert tilfelle for de fleste regnearkprogrammer, inkludert Microsoft Excel og OpenOffice Calc.
I de følgende eksemplene antar du at du har en CSV-fil lagret i en praktisk mappe i filsystemet ditt. For å konvertere et Excel-regneark til CSV-format, må du velge Arkiv → Lagre som, som gir deg muligheten til å lagre filen i en rekke formater.
Husk at en CSV-fil kun kan representere et enkelt regneark i et regneark. Endelig må du sørge for at du bruker øverste rad i regnearket (rad 1) for kolonneoverskriftene.
I R, bruker du lesen. csv () -funksjonen for å importere data i CSV-format. Denne funksjonen har en rekke argumenter, men det eneste viktige argumentet er fil, som spesifiserer plasseringen og filnavnet. Å lese en fil som heter elementer. csv ligger på f: bruk lese. csv () med fil. bane: >> elementer str (element) 'data. ramme ': 10 obs. av 9 variabler: $ Atomic. Nummer: int 1 2 3 4 5 6 7 8 9 10 $ Navn: Faktor m / 10 nivåer Beryllium, "Bor", …: 6 5 7 1 2 3 9 10 4 8 $ Symbol: Faktor m / 10 nivåer " B "," Be "," C "," F ", …: 5 6 7 2 1 3 8 10 4 9 $ Gruppe: int 1 18 1 2 13 14 15 16 17 18 $ Periode: int 1 1 2 2 2 2 2 2 2 2 $ Blokk: Faktor m / 2 nivåer "p", "s": 2 2 2 2 1 1 1 1 1 1 $ Stat. på. STP: Faktor m / 2 nivåer "Gass", "Solid": 1 1 2 2 2 2 1 1 1 1 $ Forekomst: Faktor m / 1 nivå "Primordial": 1 1 1 1 1 1 1 1 1 1 $ Beskrivelse: Faktor m / 6 nivåer "Alkalimetaller", …: 6 5 1 2 4 6 6 6 3 5
R importerer dataene inn i en dataramme. Som du kan se, har dette eksemplet ti observasjoner av ni variabler.
Dette standardalternativet for å konvertere strenger til faktorer når du bruker lese. bordet () kan være en kilde til stor forvirring. Du er ofte bedre i å importere data som inneholder strenger på en slik måte at strengene ikke konverteres, men forblir tegnvektorer.For å importere data som inneholder strenger, bruk argumentet stringsAsFactors = FALSE å lese. csv () eller les. tabell ():