Dodajanje novih stolpcev obstoječemu DataFrame je temeljna naloga pri analizi podatkov z uporabo Pande . Omogoča vam, da svoje podatke obogatite z dodatnimi informacijami in olajšate nadaljnje analize in manipulacije. Ta članek bo raziskal različne metode za dodajanje novih stolpcev, vključno s preprosto dodelitvijo,insert()>metoda,assign()>metoda. Pogovorimo se o dodajanju novih stolpcev obstoječemu Pandas DataFrame.
Kaj je Pandas DataFrame?
A Pandas DataFrame je dvodimenzionalna, velikostno spremenljiva, potencialno heterogena tabelarična podatkovna struktura z označenimi osmi (vrstice in stolpci). Je temeljna podatkovna struktura v ekosistemu podatkovne znanosti Python in zagotavlja zmogljiv način za delo s tabelarnimi podatki.
Tukaj je nekaj ključnih funkcij Pandas DataFrame:
- Predstavitev podatkov: Shranjuje podatke v obliki tabele z vrsticami in stolpci.
- Heterogeni tipi podatkov: Lahko vsebuje različne tipe podatkov v različnih stolpcih (npr. cela števila, plavajoče vrednosti, nize, logične vrednosti).
- Označevanje: Vsaka vrstica in stolpec ima oznako (imena indeksa in stolpca).
- Spremenljiv: Omogoča manipulacijo in spreminjanje podatkov.
- Močne operacije: Zagotavlja različne funkcije in metode za analizo podatkov, manipulacijo in raziskovanje.
- Razširljivo: Lahko se prilagodi in razširi z dodatnimi funkcijami prek knjižnic in uporabniško definiranih funkcij.
Obstaja več načinov za dodajanje novega stolpca obstoječemu DataFrame v Pandas in Python :
- Ustvarjanje vzorčnega podatkovnega okvira
- Z uporabo Dataframe.insert() metoda
- Z uporabo Dataframe.assign() metoda
- Uporaba slovarja
- Uporaba seznama
- Uporaba .place()
- Dodajanje več kot enega stolpca v obstoječi podatkovni okvir
Ustvarjanje vzorčnega podatkovnega okvira
Tukaj ustvarjamo vzorčni podatkovni okvir:
Python3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> print>(df)> |
>
>
Izhod:
Name Height Qualification 0 Jai 5.1 Msc 1 Princi 6.2 MA 2 Gaurav 5.1 Msc 3 Anuj 5.2 Msc>
Upoštevajte, da se mora dolžina vašega seznama ujemati z dolžino stolpca indeksa, sicer bo prikazana napaka.
Dodajte nov stolpec obstoječemu okvirju Datframe z uporabo DataFrame.insert()
Omogoča svobodo dodajanja stolpca na poljubnem položaju in ne le na koncu. Ponuja tudi različne možnosti za vstavljanje vrednosti stolpcev.
Python3
import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(>2>,>'Age'>, [>21>,>23>,>24>,>21>],>True>)> # Observe the result> print>(df)> |
>
>
Izhod:
Name Height Age Qualification 0 Jai 5.1 21 Msc 1 Princi 6.2 23 MA 2 Gaurav 5.1 24 Msc 3 Anuj 5.2 21 Msc>
Dodajanje stolpcev v Pandas DataFrame z uporabo Dataframe.assign()
Ta metoda bo ustvarila nov podatkovni okvir z novim stolpcem, dodanim staremu podatkovnemu okvirju.
Python3
import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2>=> df.assign(address>=>[>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>])> print>(df2)> |
>
>
Izhod:
Name Height Qualification address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Pandas Dodaj stolpec v DataFrame s pomočjo slovarja
Uporabimo lahko a Slovar Python da dodate nov stolpec v pandas DataFrame. Uporabite obstoječi stolpec kot ključne vrednosti in njihove ustrezne vrednosti bodo vrednosti za nov stolpec.
Python3
java array sort
# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address>=> {>'Delhi'>:>'Jai'>,>'Bangalore'>:>'Princi'>,> >'Patna'>:>'Gaurav'>,>'Chennai'>:>'Anuj'>}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Provide 'Address' as the column name> df[>'Address'>]>=> address> # Observe the output> print>(df)> |
>
>
Izhod:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Dodajanje novega stolpca v Pandas DataFrame z uporabo seznama
V tem primeru Pande dodajo nove stolpce s seznama Naslov na obstoječi Pandas DataFrame z uporabo slovarja in seznama.
Python3
# Declare a list that is to be converted into a column> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Using 'Address' as the column name> # and equating it to the list> df[>'Address'>]>=> address> print>(df)> |
>
>
Izhod:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Dodajte nov stolpec obstoječemu Pandas DataFrame z uporabo Dataframe.loc()
V tem primeru ustvari Pandas DataFrame z imenomdf>s stolpci Ime, Višina in Kvalifikacija ter doda nov stolpec Naslov z uporaboloc>atribut.
Python3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> # Create the list of new column values> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Add the new column using loc> df.loc[:,>'Address'>]>=> address> print>(df)> |
>
>
Izhod:
Name Height Qualification Address 0 Jai 5.1 Msc Delhi 1 Princi 6.2 MA Bangalore 2 Gaurav 5.1 Msc Chennai 3 Anuj 5.2 Msc Patna>
Dodajanje več kot enega stolpca v obstoječi podatkovni okvir
V tem primeru razširi obstoječi Pandas DataFramedf>z dvema novima stolpcema, Starost in Stanje, z uporabo ustreznih seznamov podatkov.
Python3
import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>],> >'Address'>: [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]}> df>=> pd.DataFrame(data)> # Define new data for additional columns> age>=> [>22>,>25>,>23>,>24>]> state>=> [>'NCT'>,>'Karnataka'>,>'Tamil Nadu'>,>'Bihar'>]> # Add multiple columns using dictionary assignment> new_data>=> {>'Age'>: age,>'State'>: state }> df>=> df.assign(>*>*>new_data)> print>(df)> |
>
>
Izhod:
Name Height Qualification Address Age State 0 Jai 5.1 Msc Delhi 22 NCT 1 Princi 6.2 MA Bangalore 25 Karnataka 2 Gaurav 5.1 Msc Chennai 23 Tamil Nadu 3 Anuj 5.2 Msc Patna 24 Bihar>
Zaključek
Razumevanje, kako dodati nove stolpce v DataFrames, je bistveno za raziskovanje podatkov in manipulacijo v Pandas. Izbira ustrezne metode je odvisna od specifičnega konteksta in želenega rezultata. Z obvladovanjem teh tehnik lahko učinkovito manipulirate s svojimi podatki, jih analizirate in pridobite dragocene vpoglede.