Pandas DataFrame je dvodimenzionalna označena podatkovna struktura, kot je tabela z vrsticami in stolpci. Velikost in vrednosti DataFrame so spremenljive, kar pomeni, da jih je mogoče spreminjati.
DataFrame se večinoma uporablja pri analizi in obdelavi podatkov. Omogoča vam shranjevanje podatkov v obliki tabele, kot je baza podatkov SQL, MS Excel ali Google Preglednice, kar olajša izvajanje aritmetičnih operacij s podatki.
Je najpogosteje uporabljen predmet Panda. The Funkcija DataFrame(). se uporablja za ustvarjanje DataFrame v Pandas. Pandas DataFrame lahko ustvarite tudi na več načinov.
Sintaksa Pandas Dataframe().
pandas.DataFrame(podatki, indeks, stolpci)
kaj je awt
Parametri:
- podatke : To je niz podatkov, iz katerega je treba ustvariti DataFrame. Lahko je seznam, slovar, skalarna vrednost, serije in nizi itd.
- kazalo : Ni obvezno, privzeto se indeks DataFrame začne od 0 in konča pri zadnji podatkovni vrednosti (n-1). Izrecno določa oznako vrstice.
- stolpce : Ta parameter se uporablja za zagotavljanje imen stolpcev v DataFrame. Če ime stolpca ni privzeto določeno, bo imelo vrednost od 0 do n-1.
Vrne:
- Objekt DataFrame
Zdaj, ko smo razpravljali o funkciji DataFrame(), si poglejmo različne načine za ustvarjanje DataFrame:
Različni načini ustvarjanja podatkovnega okvirja v Pythonu
Obstaja več načinov za ustvarjanje a Pandas Dataframe v Python . DataFrame lahko ustvarite z naslednjimi metodami:
- Ustvarite Pandas DataFrame s funkcijo DataFrame().
- Ustvari Pandas DataFrame s seznama seznamov
- Ustvarite Pandas DataFrame iz slovarja ndarray/list
- Ustvari Pandas DataFrame s seznama slovarjev
- Ustvarite Pandas DataFrame iz slovarja serije
- Ustvarjanje DataFrame s funkcijo zip().
- Ustvarjanje DataFrame z eksplicitnim dokazovanjem oznake indeksa
Ustvarite prazen DataFrame z metodo DataFrame().
DataFrame v Pythonu je mogoče ustvariti s funkcijo DataFrame() programa Knjižnica pande . Samo pokličite funkcijo s konstruktorjem DataFrame, da ustvarite DataFrame.
Primer : Ustvarjanje praznega DataFrame s funkcijo DataFrame() v Pythonu
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Izhod:
Empty DataFrame Columns: [] Index: []>
Ustvari DataFrame iz seznamov seznamov
Če želite ustvariti Pandas DataFrame iz a seznam seznamov, lahko uporabite funkcijo pd.DataFrame(). Ta funkcija sprejme seznam seznamov kot vhod in ustvari DataFrame z enakim številom vrstic in stolpcev kot vhodni seznam.
Primer : Ustvarjanje DataFrame iz seznamov seznamov z uporabo metode DataFrame().
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
generator naključnih števil v c
>
>
Izhod:
Name Age 0 tom 10 1 nick 15 2 juli 14>
Ustvari DataFrame iz slovarja ndArray/Lists
Če želite ustvariti DataFrame iz a slovar od ndarrays /lists, morajo biti vse matrike enake dolžine. Če je indeks posredovan, mora biti indeks dolžine enak dolžini nizov.
Če ni posredovan noben indeks, bo indeks privzeto obseg(n), kjer je n dolžina matrike.
Primer : Ustvarjanje DataFrame iz slovarja ndarray/lists
Python3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
>
Izhod:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Opomba: Med ustvarjanjem DataFrame z uporabo slovarja bodo ključi slovarja privzeto imena stolpcev. Imena stolpcev lahko podamo tudi izrecno s parametrom stolpca.
Ustvari DataFrame s seznama slovarjev
Pandas DataFrame je mogoče ustvariti s podajanjem seznami slovarjev kot vhodni podatek. Privzeto bodo slovarski ključi vzeti kot stolpci.
Python3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
>
Izhod:
a b c 0 1 2 3 1 10 20 30>
Drug primer je ustvarjanje Pandas DataFrame s posredovanjem seznamov slovarjev in indeksi vrstic .
Python3
pozdravljen svet java
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Izhod:
b c a first 2 3 NaN second 20 30 10.0>
Ustvari DataFrame iz slovarja serije
Če želite ustvariti DataFrame iz slovarja serije , lahko posredujete slovar, da oblikujete DataFrame. Rezultantni indeks je zveza vseh nizov prejetih indeksiranih.
primer: Ustvarjanje DataFrame iz slovarja serij.
Python3
Madhuri je rekla daj no
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Izhod:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Ustvarite DataFrame s funkcijo zip().
Dva seznama je mogoče združiti z uporabo funkcijo zip(). . Zdaj ustvarite Pandas DataFrame s klicem funkcije pd.DataFrame().
primer: Ustvarjanje DataFrame s funkcijo zip().
Python3
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
Izhod:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Ustvarite DataFrame tako, da eksplicitno dokažete oznako indeksa
Če želite ustvariti DataFrame z eksplicitnim podajanjem oznake indeksa, lahko uporabite parameter indeksa konstruktorja pd.DataFrame(). Indeksni parameter vzame kot vhod seznam indeksnih oznak in DataFrame bo te oznake uporabil za vrstice DataFrame.
primer: Ustvarjanje DataFrame z eksplicitnim dokazovanjem oznake indeksa
Python3
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
terminal kali linux
>
Izhod:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Zaključek
Python Pandas DataFrame je podoben tabeli z vrsticami in stolpci. Je dvodimenzionalna podatkovna struktura in je zelo uporabna za analizo in obdelavo podatkov.
V tej vadnici smo razpravljali o več načinih ustvarjanja Pandas DataFrame. S to vadnico se boste lahko spopadli s katero koli zapleteno zahtevo pri ustvarjanju DataFrame.