logo

Združevanje pand

Pandas je sposoben kombinirati objekte Series, DataFrame in Panel prek različnih vrst nastavljene logike za indekse in funkcionalnost relacijske algebre.

The concat() funkcija je odgovorna za izvajanje operacije veriženja vzdolž osi v DataFrame.

Sintaksa:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Parametri:

    objs:Je zaporedje ali preslikava serij ali objektov DataFrame.
    Če podamo dikt v DataFrame, bodo razvrščeni ključi uporabljeni kot argument keys in vrednosti bodo v tem primeru izbrane. Če so prisotni kakršni koli ne-predmeti, bo izpuščen, razen če so vsi nič, in v tem primeru je ValueError bo dvignjen.os:To je os, vzdolž katere se povezuje.pridruži se:Odgovoren za ravnanje z indeksi na drugi osi.spojne_osi:Seznam predmetov indeksa. Namesto izvajanja logike notranjega ali zunanjega niza se za drugo os (n-1) uporabljajo posebni indeksi.ignore_index:bool, privzeta vrednost False
    Ne uporablja vrednosti indeksa na verižni osi, če je res. Nastala os bo označena kot 0, ..., n - 1.

Vračila

Niz je vrnjen, ko združimo vse nize vzdolž osi (os=0). V primeru, če objs vsebuje vsaj en DataFrame, vrne DataFrame.

Primer1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Izhod

 0 p 1 q 0 r 1 s dtype: object 

Primer2: V zgornjem primeru lahko ponastavimo obstoječi indeks z uporabo ignore_index parameter. Spodnja koda prikazuje delovanje ignore_index .

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Izhod

statična funkcija v Javi
 0 p 1 q 2 r 3 s dtype: object 

Primer 3: Dodamo lahko hierarhični indeks na najbolj oddaljeni ravni podatkov z uporabo ključi parameter.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Izhod

 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Primer 4: Indeksne ključe lahko označimo z uporabo imena parameter. Spodnja koda prikazuje delovanje parametra imen.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Izhod

matrični seznam java
 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Združevanje z uporabo append

Metoda dodajanja je opredeljena kot uporabna bližnjica za združevanje serije in podatkovnega okvira.

primer:

 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Izhod

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88