Pandas knjižnica Python je zelo uporabna za manipulacijo matematičnih podatkov in se pogosto uporablja na področju strojnega učenja. Vsebuje številne metode za njegovo pravilno delovanje. mesto() in iloc() so ena od teh metod. Ti se uporabljajo pri rezanju podatkov iz Pandas DataFrame . Pomagajo pri priročni izbiri podatkov iz DataFrame in Python . Uporabljajo se pri filtriranju podatkov glede na nekatere pogoje.
Razlika med loc() in iloc() v Pandas DataFrame
Tukaj bomo videli razliko med funkcijama loc() in iloc() v Pandas DataFrame. Da bi videli in primerjali razliko med tema dvema, bomo ustvarili vzorčni podatkovni okvir, ki ga bomo uporabili v celotnem odstavku. Delovanje obeh metod je razloženo v vzorčnem naboru podatkov o avtomobilih.
python3
poslušaj vrata
# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)> |
>
>
Izhod
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Funkcija Python loc().
The funkcijo loc(). je metoda izbire podatkov na podlagi oznake, kar pomeni, da moramo posredovati ime vrstice ali stolpca, ki ga želimo izbrati. Ta metoda vključuje zadnji element obsega, ki je bil v njej posredovan, za razliko od iloc(). loc() lahko sprejme logične podatke za razliko od iloc(). Številne operacije je mogoče izvesti z uporabo metode loc(), na primer
Primer 1: Izbiranje podatkov glede na nekatere pogoje
V tem primeru koda uporabljaloc>funkcija za izbiro in prikaz vrstic iz DataFrame, kjer je znamka 'Maruti' in kilometrina večja od 25, ki prikazuje ustrezne informacije o avtomobilih Maruti z veliko prevoženimi kilometri.
python3
regex java
# selecting cars with brand 'Maruti' and Mileage>25>>> => 'Maruti'>) & (data.Mileage>>25>)])> |
>
>
Izhod
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>
Primer 2: Izbiranje obsega vrstic iz DataFrame
V tem primeru koda uporabljaloc>funkcija za ekstrahiranje in prikaz vrstic z indeksi v razponu od 2 do 5 (vključno) iz DataFrame, ki zagotavlja informacije o določenem obsegu avtomobilov v naboru podatkov.
python3
# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])> |
nizovne funkcije v Javi
>
>
Izhod
Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>
Primer 3: Posodabljanje vrednosti katerega koli stolpca
V tem primeru koda uporabljaloc>funkcijo za posodobitev vrednosti 'Kilometrina' na 22 za avtomobile v DataFrame, kjer je leto izdelave pred 2015. Nato se prikaže spremenjen DataFrame, ki odraža spremembe v stolpcu Mileage.
python3
# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)> |
>
>
Izhod
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Python funkcija iloc().
The iloc(). je izbirna metoda, ki temelji na indeksu, kar pomeni, da moramo v metodi posredovati celoštevilski indeks, da izberemo določeno vrstico/stolpec. Ta metoda ne vključuje zadnjega elementa obsega, ki je bil v njej posredovan, za razliko od loc(). iloc() ne sprejema logičnih podatkov za razliko od loc(). Operacije, izvedene z uporabo iloc(), so:
Primer 1: Izbiranje vrstic z uporabo celoštevilskih indeksov
V tem primeru koda uporabljailoc>funkcija za ekstrahiranje in prikaz določenih vrstic z indeksi 0, 2, 4 in 7 iz DataFrame, ki prikazuje informacije o izbranih avtomobilih v naboru podatkov.
python3
pretvorba int v niz
# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])> |
>
>
Izhod
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>
Primer 2: Istočasno izbiranje obsega stolpcev in vrstic
V tem primeru koda uporabljailoc>funkcija za ekstrahiranje in prikaz podnabora DataFrame, vključno z vrsticami od 1 do 4 in stolpci od 2 do 4. To zagotavlja informacije o določenem obsegu avtomobilov in njihovih ustreznih atributih v naboru podatkov.
python3
mysql vstavite v
# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])> |
>
>
Izhod
Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>