logo

Serija Python Pandas

Serijo Pandas lahko definiramo kot enodimenzionalno polje, ki lahko shrani različne tipe podatkov. Seznam, tuple in slovar lahko preprosto pretvorimo v serije z uporabo ' serije ' metoda. Oznake vrstic serije se imenujejo indeks. Niz ne more vsebovati več stolpcev. Ima naslednji parameter:

    podatki:Lahko je kateri koli seznam, slovar ali skalarna vrednost.kazalo:Vrednost indeksa mora biti edinstvena in jo je mogoče zgostiti. Biti mora enake dolžine kot podatki. Če ne posredujemo nobenega indeksa, privzeto np.razporedi(n) bo uporabljen.dtype:Nanaša se na vrsto podatkov serije.kopirati:Uporablja se za kopiranje podatkov.

Ustvarjanje serije:

Serijo lahko ustvarimo na dva načina:

  1. Ustvarite prazno serijo
  2. Ustvarite niz z uporabo vnosov.

Ustvarite prazno serijo:

V Pandas lahko enostavno ustvarimo prazno serijo, kar pomeni, da ne bo imela nobene vrednosti.

Sintaksa, ki se uporablja za ustvarjanje prazne serije:

 = pandas.Series() 

Spodnji primer ustvari objekt tipa Empty Series, ki nima vrednosti in ima privzeti podatkovni tip, tj. float64 .

Primer

 import pandas as pd x = pd.Series() print (x) 

Izhod

bajtov v string python
 Series([], dtype: float64) 

Ustvarjanje serije z uporabo vnosov:

Serije lahko ustvarimo z uporabo različnih vnosov:

  • Array
  • Dict
  • Skalarna vrednost

Ustvarjanje serije iz polja:

Preden ustvarimo serijo, moramo najprej uvoziti numpy modul in nato uporabite funkcijo array() v programu. Če so podatki ndarray, mora biti posredovani indeks enake dolžine.

Če ne posredujemo indeksa, je privzeto indeks od obseg (n) se posreduje, kjer n definira dolžino niza, tj. [0,1,2,.... obseg(len(niz))-1 ].

Primer

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Izhod

1 milijon v številkah
 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Ustvari serijo iz dict

Serijo lahko ustvarimo tudi iz dict. Če je slovarski objekt posredovan kot vhod in indeks ni podan, se slovarski ključi vzamejo v razvrščenem vrstnem redu za izdelavo indeksa .

Če je indeks posredovan, bodo vrednosti, ki ustrezajo določeni oznaki v indeksu, izvlečene iz slovar .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Izhod

 x 0.0 y 1.0 z 2.0 dtype: float64 

Ustvari niz s skalarjem:

Če vzamemo skalarne vrednosti, je treba navesti indeks. Skalarna vrednost bo ponovljena za ujemanje z dolžino indeksa.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Izhod

 0 4 1 4 2 4 3 4 dtype: int64 

Dostop do podatkov iz serije s položajem:

Ko ustvarite objekt vrste Series, lahko dostopate do njegovih indeksov, podatkov in celo posameznih elementov.

primer java do while

Do podatkov v seriji je mogoče dostopati podobno kot v ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Izhod

 1 

Atributi predmetov serije

Atribut serije je definiran kot katera koli informacija, povezana z objektom serije, kot je velikost, vrsta podatkov. itd. Spodaj je nekaj atributov, ki jih lahko uporabite za pridobitev informacij o objektu serije:

Lastnosti Opis
Series.index Določa indeks serije.
serija.oblika Vrne torko oblike podatkov.
Series.dtype Vrne podatkovni tip podatkov.
serija.velikost Vrne velikost podatkov.
Serija.prazna Vrne True, če je objekt serije prazen, sicer vrne false.
serija.hasnans Vrne True, če obstajajo vrednosti NaN, sicer vrne false.
Series.nbytes Vrne število bajtov v podatkih.
Serija sem Vrne število dimenzij v podatkih.
Series.itemsize Vrne velikost podatkovnega tipa predmeta.

Pridobivanje indeksne matrike in podatkovne matrike serijskega objekta

Z uporabo atributov indeks in vrednosti lahko pridobimo indeksno polje in podatkovno polje obstoječega objekta serije.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Izhod

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Pridobivanje vrst (dtype) in velikosti vrste (itemsize)

Atribut dtype lahko uporabite s serijskim objektom kot dtype za pridobivanje podatkovnega tipa posameznega elementa serijskega objekta, lahko uporabite itemsize atribut za prikaz števila bajtov, dodeljenih vsaki podatkovni postavki.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Izhod

kmp algoritem
 int64 8 float64 8 

Pridobivanje oblike

Oblika predmeta serije določa skupno število elementov, vključno z manjkajočimi ali praznimi vrednostmi (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Izhod

 (4,) (3,) 

Pridobivanje dimenzije, velikosti in števila bajtov:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Izhod

 1 1 4 3 32 24 

Preverjanje praznine in prisotnosti NaN

Če želite preveriti, ali je predmet Series prazen, lahko uporabite prazen atribut . Podobno, če želite preveriti, ali predmet serije vsebuje nekatere vrednosti NaN ali ne, lahko uporabite hassan atribut.

np.naključno.rand

Primer

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Izhod

 False False True True False False 4 3 3 3 

Funkcije serije

V seriji se uporabljajo naslednje funkcije:

Funkcije Opis
Pandas Series.map() Preslikaj vrednosti iz dveh nizov, ki imata skupen stolpec.
Pandas Series.std() Izračunajte standardno odstopanje danega nabora števil, DataFrame, stolpca in vrstic.
Pandas Series.to_frame() Pretvorite predmet serije v podatkovni okvir.
Pandas Series.value_counts() Vrne niz, ki vsebuje število edinstvenih vrednosti.