read.csv() funkcija v jeziku R se uporablja za branje datotek z vrednostmi, ločenih z vejicami. Uvaža podatke v obliki a podatkovni okvir.
Sintaksa: read.csv(datoteka, glava, sep, dec) Parametri: mapa: pot do datoteke, ki vsebuje podatke za uvoz v R. glava: logična vrednost. Če je TRUE, read.csv() predpostavlja, da ima vaša datoteka naslovno vrstico, zato je vrstica 1 ime vsakega stolpca. Če temu ni tako, lahko dodate glavo argumenta = FALSE. sep: znak za ločilo polja dec: znak, uporabljen v datoteki za decimalne točke.
Spremenljivka podatkov bo vsebovala vsebino datoteke CSV, ko bomo uporabili funkcijo read.csv(), čeprav lahko uporabite drugo spremenljivko.
Funkcija read.csv() sprejema tudi številne neobvezne argumente, ki jih lahko uporabimo za spreminjanje postopka uvoza. lahko se odločimo, da prvo vrstico obravnavamo kot imena stolpcev, izberemo znak za ločilo in drugo. Za dodatne informacije o teh možnostih si oglejte dokumentacijo read.csv().
Zagotovite, da je datoteka v pravilnem formatu CSV s pravilnimi ločili in narekovaji, tako da metodi read.csv() podate pravilno pot do datoteke ali URL.
Primer 1: Branje datoteke iz iste mape
R
# R program to read a csv file> # Get content into a data frame> data <->read.csv>(>'CSVFileExample.csv'>,> >header =>FALSE>, sep =>' '>)> > # Printing content of Text File> print>(data)> |
>
>
Izhod:
V1 V2 V3 1 100 AB ab 2 200 CD cd 3 300 EF ef 4 400 GH gh 5 500 IJ ij>
Primer 2: Branje datotek iz različnih imenikov
R
# Simple R program to read csv file> x <->read.csv>(>' D://Datas//myfile.csv '>)> > # print x> print>(x)> |
>
>
Izhod:
X V1 V2 V3 1 1 100 a1 b1 2 2 200 a2 b2 3 3 300 a3 b3>
Primer 3: Branje datoteke CSV z drugačnim ločilom
R
npm čisti predpomnilnik
data <->read.csv>(>'path/to/your/file.csv'>, sep =>';'>)> |
>
>
Možnost sep je nastavljena na ; v tem primeru, kar pomeni, da datoteka CSV kot ločilo uporablja podpičje (;) namesto standardne vejice (,).
Primer 4: Obravnava prve vrstice kot imen stolpcev
R
data <->read.csv>(>'path/to/your/file.csv'>, header =>TRUE>)> |
>
>
Rajinikanth
Prva vrstica datoteke CSV se privzeto obravnava kot imena stolpcev, ker je argument glave nastavljen na TRUE. Če prva vrstica naše datoteke CSV ne vsebuje imen stolpcev, lahko uvozimo podatke brez njih, tako da nastavimo glavo = FALSE.
Primer 4: Določanje razredov stolpcev
R
data <->read.csv>(>'path/to/your/file.csv'>,> >colClasses =>c>(>'character'>,>'numeric'>,>'integer'>))> |
>
>
Za vsak stolpec v datoteki CSV lahko določimo razrede z možnostjo colClasses. Zaradi te ilustracije bo prvi stolpec interpretiran kot znak, drugi kot številka in tretji kot celo število. Ko želimo upravljati vrste podatkov posameznih stolpcev.
Primer 5: Preskakovanje vrstic in podajanje manjkajočih vrednosti
R
data <->read.csv>(>'path/to/your/file.csv'>, skip = 3, na.strings =>c>(>''>,>'NA'>))> |
>
>
Z uporabo argumenta za preskok lahko preskočimo določeno število vrstic na začetku datoteke CSV. Prve tri vrstice na tej sliki bodo izpuščene. Vrednosti, ki jih je treba obravnavati kot manjkajoče vrednosti (NA), so določene z an. argument nizov. Niz NA in prazni nizi so v tej situaciji prepoznani kot manjkajoče vrednosti.