Funkcija unique() odstrani vse podvojene vrednosti v stolpcu in vrne eno samo vrednost za več enakih vrednosti. V tem članku bomo razpravljali o tem, kako lahko pridobimo edinstvene vrednosti iz stolpca v Pandas DataFrame .
Ustvarjanje okvira podatkov Pandas s podvojenimi elementi
Ustvarite vzorčni podatkovni okvir Pandas s slovarjem seznamov, recimo imena stolpcev A, B, C, D in E s podvojenimi elementi.
kdaj se začne q2
Python3
# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> |
>
>

Pridobite edinstvene vrednosti iz stolpca v Pandas DataFrame
Spodaj je nekaj primerov, s katerimi lahko dobimo edinstvene vrednosti stolpca v tem podatkovnem okviru.
- Pridobite edinstvene vrednosti stolpca 'B'.
- Pridobite edinstvene vrednosti stolpca »E«.
- Pridobite število edinstvenih vrednosti v stolpcu
- Uporaba set() za odstranitev podvojenih vrednosti iz stolpca
- Uporaba metod pandas.concat() in Unique().
- Uporaba Series.drop_duplicates()
Pridobite edinstvene vrednosti stolpca 'B'.
V tem primeru pridobimo in natisnemo edinstvene vrednosti iz stolpca »B« z uporabo unique()> metoda. Dobljene edinstvene vrednosti so['B1', 'B2', 'B3', 'B4']>.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()> |
opozorilno polje javascript
>
>
Izhod
array(['B1', 'B2', 'B3', 'B4'], dtype=object)>
Pridobite edinstvene vrednosti pand v stolpcu 'E'.
V tem primeru ustvarimo pandas DataFrame iz slovarja in nato pridobimo edinstvene vrednosti iz stolpca »E« z uporabounique()>metoda. Dobljene edinstvene vrednosti so['E1']>.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()> |
>
>
Izhod
array(['E1'], dtype=object)>
Pridobite število edinstvenih vrednosti v stolpcu
V tem primeru ustvarimo pandas DataFrame iz slovarja ter nato izračunamo in natisnemo število edinstvenih vrednosti v stolpcu »C«, razen vrednosti NaN. Rezultat je 3, kar pomeni, da so v stolpcu »C« tri edinstvene vrednosti.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)> |
>
tiskanje iz jave
>
Izhod
3>
Odstranite podvojene vrednosti iz stolpca z uporabo set()
V tem primeru ustvarimo pandas DataFrame iz slovarja in nato uporabimo set()>funkcijo za ekstrahiranje edinstvenih vrednosti iz stolpca 'C' in odpravo dvojnikov. Nastali niz,{'C1', 'C2', 'C3'}>, predstavlja edinstvene vrednosti v stolpcu „C“.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)> |
>
>
Izhod
{'C1', 'C2', 'C3'}> Uporaba metod pandas.concat() in Unique().
V tem primeru ustvarimo pandas DataFrame iz slovarja in nato združimo edinstvene vrednosti iz vseh stolpcev z uporabo pd.concat()> . Nastala matrika NumPy, ko je natisnjena, prikaže vse edinstvene vrednosti od stolpcev 'A' do 'E'.
blokiraj oglase youtube na androidu
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)> |
>
>
Izhod
['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>
Uporaba Series.drop_duplicates()
V tem primeru ustvarimo pandas DataFrame iz slovarja in odstranimo dvojnike iz stolpcev 'A' in 'D' z uporabo drop_duplicates()>metoda . Dobljen DataFrame, ko je natisnjen, prikaže edinstvene vrednosti v stolpcih 'A' in 'D', z vrednostmi NaN, kjer so bili dvojniki odstranjeni iz 'D'.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)> |
>
omrežja in vrste omrežij
>
Izhod
A B C D E 0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>