logo

R – Podatkovni okvirji

Programski jezik R je odprtokodni programski jezik, ki se pogosto uporablja kot statistična programska oprema in orodje za analizo podatkov. Podatkovni okvirji v jeziku R so generični podatkovni objekti R, ki se uporabljajo za shranjevanje tabelaričnih podatkov.

Podatkovne okvire je mogoče razlagati tudi kot matrike, kjer je vsak stolpec a matrica so lahko različnih tipov podatkov. R DataFrame je sestavljen iz treh glavnih komponent, podatkov, vrstic in stolpcev.



Struktura podatkovnih okvirjev R

Kot lahko vidite na spodnji sliki, je podatkovni okvir strukturiran tako.

Podatki so predstavljeni v obliki tabele, kar olajša delo in razumevanje.

R - Podatkovni okvirjiGeeksforgeeks

R – Podatkovni okvirji



Ustvari podatkovni okvir v programskem jeziku R

Če želite ustvariti podatkovni okvir R, uporabite data.frame() funkcijo in nato v funkcijo posredujte vsakega od vektorjev, ki ste jih ustvarili kot argumente.

R






# R program to create dataframe> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # print the data frame> print>(friend.data)>

>

>

Izhod:

 friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

Pridobite strukturo podatkovnega okvira R

Strukturo podatkovnega okvirja R lahko dobimo z uporabo str() funkcija v R.

Lahko prikaže celo notranjo strukturo velikih seznamov, ki so ugnezdeni. Zagotavlja enovrstični izhod za osnovne objekte R, s čimer uporabnika seznani z objektom in njegovimi sestavnimi deli.

R




dekodiraj base64 javascript

# R program to get the> # structure of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using str()> print>(>str>(friend.data))>

>

>

Izhod:

'data.frame': 5 obs. of 2 variables:  $ friend_id : int 1 2 3 4 5  $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL>

Povzetek podatkov v podatkovnem okviru R

V podatkovnem okviru R lahko statistični povzetek in naravo podatkov pridobite z uporabo povzetek() funkcijo.

To je generična funkcija, ki se uporablja za izdelavo povzetkov rezultatov različnih funkcij prilagajanja modelom. Funkcija prikliče posebne metode, ki so odvisne od razreda prvega argumenta.

R




# R program to get the> # summary of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using summary()> print>(>summary>(friend.data))>

>

>

Izhod:

 friend_id friend_name   Min. :1 Length:5   1st Qu.:2 Class :character   Median :3 Mode :character   Mean :3   3rd Qu.:4   Max. :5>

Ekstrakt podatkov iz podatkovnega okvira v R

Ekstrahiranje podatkov iz podatkovnega okvira R pomeni dostop do njegovih vrstic ali stolpcev. Določen stolpec lahko ekstrahiramo iz podatkovnega okvira R z uporabo njegovega imena stolpca.

R




# R program to extract> # data from the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Extracting friend_name column> result <->data.frame>(friend.data$friend_name)> print>(result)>

>

>

Izhod:

 friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni>

Razširite podatkovni okvir v jeziku R

Podatkovni okvir v R je mogoče razširiti z dodajanjem novih stolpcev in vrstic v že obstoječi podatkovni okvir R.

R




# R program to expand> # the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Expanding data frame> friend.data$location <->c>(>'Kolkata'>,>'Delhi'>,> >'Bangalore'>,>'Hyderabad'>,> >'Chennai'>)> resultant <- friend.data> # print the modified data frame> print>(resultant)>

>

>

Izhod:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

V R je mogoče izvajati različne vrste operacij na podatkovnem okviru, kot je dostop do vrstic in stolpcev, izbiranje podnabora podatkovnega okvira, urejanje podatkovnih okvirjev, brisanje vrstic in stolpcev v podatkovnem okvirju itd.

Prosimo, glejte Operacije DataFrame v R poznati vse vrste operacij, ki jih je mogoče izvajati na podatkovnem okviru.

Dostopajte do elementov v podatkovnem okviru R

Iz podatkovnega okvira lahko izberemo in dostopamo do katerega koli elementa z uporabo single$>, oklepaji[ ] or>dvojni oklepaj[[]]>za dostop do stolpcev iz podatkovnega okvira.

R


anonimna funkcija java



# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[>'friend_name'>]]> # Access Items using $> friend.data$friend_id>

>

>

Izhod:

 friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni'   Access Items using $ [1] 1 2 3 4 5>

Število vrstic in stolpcev

Z uporabo funkcije dim lahko ugotovimo, koliko vrstic in stolpcev je parsant v našem podatkovnem okviru.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # find out the number of rows and clumns> dim>(friend.data)>

>

do in while zanka v Javi
>

Izhod:

[1] 5 2>

Dodajte vrstice in stolpce v podatkovni okvir R

Vrstice in stolpce lahko preprosto dodate v R DataFrame. Vstavljanje pomaga pri razširitvi že obstoječega okvira DataFrame, ne da bi potrebovali novega.

Poglejmo, kako dodati vrstice in stolpce v DataFrame? s primerom:

Dodajte vrstice v podatkovni okvir R

Če želite dodati vrstice v podatkovni okvir, lahko uporabite vgrajeno funkcijo rbind().

Naslednji primer prikazuje delovanje rbind() v R Data Frame.

R




# Creating a dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new row for a new product> New_Product <->c>(104,>'Sunglasses'>, 39.99, 40)> Products <->rbind>(Products, New_Product)> # Print the updated dataframe after adding the new product> cat>(>' Updated dataframe after adding a new product: '>)> print>(Products)>

>

>

Izhod:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new product:   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40>

Dodajte stolpce v podatkovni okvir R

Če želite dodati stolpce v podatkovni okvir, lahko uporabite vgrajeno funkcijo cbind().

Naslednji primer prikazuje delovanje cbind() v R Data Frame .

R




# Existing dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new column for 'Discount' to the dataframe> Discount <->c>(5, 10, 8)># New column values for discount> Products <->cbind>(Products, Discount)> # Rename the added column> colnames>(Products)[>ncol>(Products)] <->'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat>(>' Updated dataframe after adding a new column 'Discount': '>)> print>(Products)>

>

>

Izhod:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new column 'Discount':   Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8>

Odstranite vrstice in stolpce

Podatkovni okvir v R odstrani stolpce in vrstice iz že obstoječega podatkovnega okvira R.

Odstrani vrstico v R DataFrame

R




library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove a row with friend_id = 3> data <->subset>(data, friend_id != 3)> data>

>

>

Izhod:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai   # Remove a row with friend_id = 3   friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

V zgornji kodi smo najprej ustvarili podatkovni okvir, imenovan podatke s tremi stolpci: friend_id , ime_prijatelja , in lokacijo . Če želite odstraniti vrstico z friend_id enako 3, smo uporabili podnabor() funkcijo in določil stanje friend_id != 3 . S tem je bila odstranjena vrstica z friend_id enako 3.

Odstrani stolpec v R DataFrame

R




library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove the 'location' column> data <->select>(data, -location)> data>

>

>

Izhod:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Odstranite stolpec 'lokacija' friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

Za odstranitev lokacijo stolpec smo uporabili izberite () funkcijo in določeno -lokacija . The znak pomeni, da želimo odstraniti lokacijo stolpec. Nastali podatkovni okvir podatke bo imel samo dva stolpca: friend_id in ime_prijatelja .

Združevanje podatkovnih okvirjev v R

Podatkovne okvire lahko v R združite na dva načina. Lahko jih združite navpično ali vodoravno.

Oglejmo si oba primera s primerom:

Združite podatkovni okvir R navpično

Če želite navpično združiti 2 podatkovna okvira, lahko uporabite funkcijo rbind(). Ta funkcija deluje pri kombinaciji dveh ali več podatkovnih okvirov.

R


parameter v lupinskem skriptu



# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Name =>c>(>'Charlie'>,>'David'>),> >Age =>c>(28, 35),> >Score =>c>(90, 85)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using rbind()> combined_df <->rbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

>

Izhod:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Name Age Score 1 Charlie 28 90 2 David 35 85  Combined Dataframe:   Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85>

Združite podatkovni okvir R vodoravno:

Če želite vodoravno združiti 2 podatkovna okvira, lahko uporabite funkcijo cbind(). Ta funkcija deluje pri kombinaciji dveh ali več podatkovnih okvirov.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Height =>c>(160, 175),> >Weight =>c>(55, 70)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using cbind()> combined_df <->cbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

>

Izhod:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Height Weight 1 160 55 2 175 70  Combined Dataframe:   Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70>

Preberite tudi:

  • R – Predmeti
  • Podatkovne strukture v programiranju R

V tem članku smo obravnavali R podatkovni okvirji, in vse osnovne operacije, kot so ustvarjanje, dostop, povzetek, dodajanje in odstranjevanje. Namen tega članka je, da se seznanite s podatkovnimi okviri v R, da jih boste lahko uporabili v svojih projektih.

Upam, da vam bo to pomagalo pri razumevanju koncepta podatkovnih okvirjev v R in da boste zlahka implementirali podatkovni okvir R v svoje projekte.