logo

Načini filtriranja Pandas DataFrame po vrednostih stolpcev

Filtriranje Pandas DataFrame z vrednostmi stolpcev je običajna operacija med izvajanjem informacij v Pythonu. Za dosego tega lahko uporabite različne metode in tehnike. Tu so številni načini za filtriranje Pandas DataFrame prek vrednosti stolpcev.

V tej objavi bomo videli različne načine filtriranja Pandas Dataframe po vrednostih stolpcev. Najprej ustvarimo podatkovni okvir:



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Izhod:

Dataframe

Izbiranje vrstic Pandas Dataframe na podlagi določene vrednosti stolpca z uporabo operatorja '>', '=', '=', '<=', '!='.

Primer 1: Izbiranje vseh vrstic iz danega okvira podatkov, v katerih je »odstotek« večji od 75 z [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Izhod:

izhodni podatkovni okvir

Primer 2: Izbiranje vseh vrstic iz podanega okvira podatkov, v katerih je »odstotek« večji od 70, mesto [] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Izhod:

izhodni podatkovni okvir-1

Izbiranje tistih vrstic Pandas Dataframe, katerih vrednost stolpca je prisotna na seznamu z uporabo ti() metoda podatkovnega okvira.

Primer 1: Izbiranje vseh vrstic iz danega podatkovnega okvira, v katerem je prisoten »Stream«, na seznamu možnosti z uporabo [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Izhod:

izhodni podatkovni okvir-2

Primer 2: Izbiranje vseh vrstic iz danega podatkovnega okvira, v katerem je prisoten »Stream«, na seznamu možnosti z uporabo mesto [] .

Python




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Izhod:

izhodni podatkovni okvir-3

Izbiranje vrstic Pandas Dataframe na podlagi pogojev več stolpcev z uporabo operatorja '&'.

Primer1: Z uporabo [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Izhod:

izhodni podatkovni okvir-4

Primer 2: Z uporabo mesto [] .

Python3




poskusi blok catch v javi

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Izhod:

izhodni podatkovni okvir-5