Serijo Pandas lahko definiramo kot enodimenzionalno polje, ki lahko shrani različne tipe podatkov. Seznam, tuple in slovar lahko preprosto pretvorimo v serije z uporabo ' serije ' metoda. Oznake vrstic serije se imenujejo indeks. Niz ne more vsebovati več stolpcev. Ima naslednji parameter:
Ustvarjanje serije:
Serijo lahko ustvarimo na dva načina:
- Ustvarite prazno serijo
- Ustvarite niz z uporabo vnosov.
Ustvarite prazno serijo:
V Pandas lahko enostavno ustvarimo prazno serijo, kar pomeni, da ne bo imela nobene vrednosti.
Sintaksa, ki se uporablja za ustvarjanje prazne serije:
= pandas.Series()
Spodnji primer ustvari objekt tipa Empty Series, ki nima vrednosti in ima privzeti podatkovni tip, tj. float64 .
Primer
import pandas as pd x = pd.Series() print (x)
Izhod
bajtov v string python
Series([], dtype: float64)
Ustvarjanje serije z uporabo vnosov:
Serije lahko ustvarimo z uporabo različnih vnosov:
- Array
- Dict
- Skalarna vrednost
Ustvarjanje serije iz polja:
Preden ustvarimo serijo, moramo najprej uvoziti numpy modul in nato uporabite funkcijo array() v programu. Če so podatki ndarray, mora biti posredovani indeks enake dolžine.
Če ne posredujemo indeksa, je privzeto indeks od obseg (n) se posreduje, kjer n definira dolžino niza, tj. [0,1,2,.... obseg(len(niz))-1 ].
Primer
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Izhod
1 milijon v številkah
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Ustvari serijo iz dict
Serijo lahko ustvarimo tudi iz dict. Če je slovarski objekt posredovan kot vhod in indeks ni podan, se slovarski ključi vzamejo v razvrščenem vrstnem redu za izdelavo indeksa .
Če je indeks posredovan, bodo vrednosti, ki ustrezajo določeni oznaki v indeksu, izvlečene iz slovar .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Izhod
x 0.0 y 1.0 z 2.0 dtype: float64
Ustvari niz s skalarjem:
Če vzamemo skalarne vrednosti, je treba navesti indeks. Skalarna vrednost bo ponovljena za ujemanje z dolžino indeksa.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Izhod
0 4 1 4 2 4 3 4 dtype: int64
Dostop do podatkov iz serije s položajem:
Ko ustvarite objekt vrste Series, lahko dostopate do njegovih indeksov, podatkov in celo posameznih elementov.
primer java do while
Do podatkov v seriji je mogoče dostopati podobno kot v ndarray.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Izhod
1
Atributi predmetov serije
Atribut serije je definiran kot katera koli informacija, povezana z objektom serije, kot je velikost, vrsta podatkov. itd. Spodaj je nekaj atributov, ki jih lahko uporabite za pridobitev informacij o objektu serije:
Lastnosti | Opis |
---|---|
Series.index | Določa indeks serije. |
serija.oblika | Vrne torko oblike podatkov. |
Series.dtype | Vrne podatkovni tip podatkov. |
serija.velikost | Vrne velikost podatkov. |
Serija.prazna | Vrne True, če je objekt serije prazen, sicer vrne false. |
serija.hasnans | Vrne True, če obstajajo vrednosti NaN, sicer vrne false. |
Series.nbytes | Vrne število bajtov v podatkih. |
Serija sem | Vrne število dimenzij v podatkih. |
Series.itemsize | Vrne velikost podatkovnega tipa predmeta. |
Pridobivanje indeksne matrike in podatkovne matrike serijskega objekta
Z uporabo atributov indeks in vrednosti lahko pridobimo indeksno polje in podatkovno polje obstoječega objekta serije.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Izhod
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Pridobivanje vrst (dtype) in velikosti vrste (itemsize)
Atribut dtype lahko uporabite s serijskim objektom kot dtype za pridobivanje podatkovnega tipa posameznega elementa serijskega objekta, lahko uporabite itemsize atribut za prikaz števila bajtov, dodeljenih vsaki podatkovni postavki.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Izhod
kmp algoritem
int64 8 float64 8
Pridobivanje oblike
Oblika predmeta serije določa skupno število elementov, vključno z manjkajočimi ali praznimi vrednostmi (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Izhod
(4,) (3,)
Pridobivanje dimenzije, velikosti in števila bajtov:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Izhod
1 1 4 3 32 24
Preverjanje praznine in prisotnosti NaN
Če želite preveriti, ali je predmet Series prazen, lahko uporabite prazen atribut . Podobno, če želite preveriti, ali predmet serije vsebuje nekatere vrednosti NaN ali ne, lahko uporabite hassan atribut.
np.naključno.rand
Primer
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Izhod
False False True True False False 4 3 3 3
Funkcije serije
V seriji se uporabljajo naslednje funkcije:
Funkcije | Opis |
---|---|
Pandas Series.map() | Preslikaj vrednosti iz dveh nizov, ki imata skupen stolpec. |
Pandas Series.std() | Izračunajte standardno odstopanje danega nabora števil, DataFrame, stolpca in vrstic. |
Pandas Series.to_frame() | Pretvorite predmet serije v podatkovni okvir. |
Pandas Series.value_counts() | Vrne niz, ki vsebuje število edinstvenih vrednosti. |