Python je odličen jezik za analizo podatkov, predvsem zaradi fantastičnega ekosistema podatkovno osredotočenih paketov Python. Pande je eden od teh paketov, ki močno olajša uvoz in analizo podatkov. Ustvarjanje a Pandas Dataframe je mogoče doseči na več načinov. Poglejmo, kako lahko ustvarimo Pandas DataFrame iz seznamov.
j e s t
Ustvarjanje Pandas DataFrames iz seznamov
Pretvarjanje seznamov v DataFrames je ključnega pomena pri analizi podatkov, saj vam omogoča enostavno izvajanje sofisticiranih podatkovnih manipulacij in analiz.
Tukaj bomo razpravljali o različnih načinih za ustvarjanje Pandas Dataframe s seznamov:
- Ustvari podatkovni okvir s seznama z uporabo Constructerja
- Ustvari DataFrame s seznama z uporabo slovarja
- Ustvari DataFrame s seznama z uporabo zip()
- Ustvarite DataFrame s seznama tako, da spremenite vrsto podatkov
- Ustvari DataFrame s seznama z uporabo večdimenzionalnega seznama
- Ustvari DataFrame s seznama z imeni indeksov in stolpcev
Ustvari podatkovni okvir s seznama z uporabo Constructerja
Če želite pretvoriti seznam v Pandas DataFrame, lahko uporabitepd.DataFrame()>konstruktor. Ta funkcija sprejme seznam kot vhod in ustvari DataFrame z enakim številom vrstic in stolpcev kot vhodni seznam.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list df = pd.DataFrame(lst) print(df)>
Izhod:
0 0 Geeks 1 For 2 Geeks 3 is 4 portal 5 for 6 Geeks>
Ustvari DataFrame s seznama z uporabo slovarja
Če želite uporabiti sezname v slovarju za ustvarjanje Pandas DataFrame, ustvarimo slovar seznamov in nato posredujemo slovarpd.DataFrame()>konstruktor. Po želji lahko določimo imena stolpcev za DataFrame tako, da posredujemo seznam nizov vcolumns>parameter zapd.DataFrame()>konstruktor.
# importing pandas as pd import pandas as pd # list of name, degree, score nme = ['aparna', 'pankaj', 'sudhir', 'Geeku'] deg = ['MBA', 'BCA', 'M.Tech', 'MBA'] scr = [90, 40, 80, 98] # dictionary of lists dict = {'name': nme, 'degree': deg, 'score': scr} df = pd.DataFrame(dict) print(df)> Izhod:
name degree score 0 aparna MBA 90 1 pankaj BCA 40 2 sudhir M.Tech 80 3 Geeku MBA 98>
Ustvari DataFrame iz seznama z uporabo zip()
Če želite ustvariti Pandas DataFrame iz seznamov z uporabo zip(). Uporabimo lahko tudizip()>funkcijo za stiskanje več seznamov, da ustvarite DataFrame z več stolpci.
Python
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # list of int lst2 = [11, 22, 33, 44, 55, 66, 77] # Calling DataFrame constructor after zipping # both lists, with columns specified df = pd.DataFrame(list(zip(lst, lst2)), columns =['Name', 'val']) print(df)>
Izhod:
Name val 0 Geeks 11 1 For 22 2 Geeks 33 3 is 44 4 portal 55 5 for 66 6 Geeks 77>
Ustvarite DataFrame s seznama tako, da spremenite vrsto podatkov
Če želite ustvariti Pandas DataFrame z uporabo večdimenzionalnega seznama z navedenimi imeni stolpcev in dtypes. Z določitvijo dtypes lahko zagotovimo, da je DataFrame ustvarjen s pravilnimi tipi podatkov.
Python import pandas as pd # List1 lst = [['tom', 'reacher', 25], ['krish', 'pete', 30], ['nick', 'wilson', 26], ['juli', 'williams', 22]] # Create DataFrame df = pd.DataFrame(lst, columns=['FName', 'LName', 'Age']) # Convert 'Age' column to float df['Age'] = df['Age'].astype(float) print(df)>
Izhod:
FName LName Age 0 tom reacher 25.0 1 krish pete 30.0 2 nick wilson 26.0 3 juli williams 22.0>
Ustvari DataFrame iz seznama z uporabo večdimenzionalnega seznama
Če želite ustvariti DataFrame z uporabo večdimenzionalnega seznama, lahko uporabitepd.DataFrame()>konstruktor. Thepd.DataFrame()>konstruktor vzame seznam seznamov kot vhod in ustvari DataFrame z enakim številom vrstic in stolpcev kot vhodni seznam.
# import pandas as pd import pandas as pd # List1 lst = [['tom', 25], ['krish', 30], ['nick', 26], ['juli', 22]] df = pd.DataFrame(lst, columns =['Name', 'Age']) print(df)>
Izhod:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Ustvari DataFrame s seznama z imeni indeksov in stolpcev
Če želite ustvariti DataFrame s seznamom z imeni indeksov in stolpcev, lahko uporabitepd.DataFrame()>konstruktor zindex>incolumns>parametri.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list # with indices and columns specified df = pd.DataFrame(lst, index =['a', 'b', 'c', 'd', 'e', 'f', 'g'], columns =['Names']) print(df)>
Izhod:
Names a Geeks b For c Geeks d is e portal f for g Geeks>