logo

Metoda Pandas DataFrame corr().

Pande dataframe.corr() se uporablja za iskanje parne korelacije vseh stolpcev v Pandas Dataframe v Pythonu. Kaj NaN vrednosti so samodejno izključene. Če želite prezreti vse neštevilske vrednosti, uporabite parameter numeric_only = True. V tem članku bomo spoznali metodo DataFrame.corr(). Python .

Sintaksa metode Pandas DataFrame corr().

Sintaksa: DataFrame.corr(self, method='pearson', min_periods=1, numeric_only = False)



Parametri:

  • metoda:
    • pearson: standardni korelacijski koeficient
    • kendall: korelacijski koeficient Kendall Tau
    • spearman: korelacija ranga spearman
  • min_obdobja: Najmanjše število opazovanj, potrebnih na par stolpcev za veljaven rezultat. Trenutno na voljo samo za korelacijo Pearson in spearman
  • numeric_only : ali naj se upravlja samo s številskimi vrednostmi ali ne. Privzeto je nastavljen na False.

Vrne: count :y : DataFrame

Metoda korelacije podatkov Pandas corr().

Dobra korelacija je odvisna od uporabe, vendar lahko z gotovostjo rečemo, da imate vsaj 0,6 (ali -0,6), da jo imenujemo dobra korelacija. Preprost primer, ki prikazuje, kako deluje korelacija Python .



Python3






import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

statična funkcija v Javi

>

>

Izhod

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Ustvarjanje vzorčnega podatkovnega okvira

Tiskanje prvih 10 vrstic Dataframe.

Opomba: Korelacija spremenljivke s samo seboj je 1. Za povezavo do datoteke CSV, uporabljene v kodi, kliknite tukaj

Python3




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

>

>

Izhod

Korelacije podatkov Pandas

Primeri metode Python Pandas DataFrame corr().

Poiščite korelacijo med stolpci z uporabo pearsonove metode

Tu uporabljamo funkcijo corr(), da poiščemo korelacijo med stolpci v Dataframeu z uporabo metode Pearson. V Dataframeu imamo samo štiri številske stolpce. Izhodni podatkovni okvir je mogoče razlagati kot za katero koli celico, korelacija spremenljivke vrstice s spremenljivko stolpca je vrednost celice. Kot smo že omenili, je korelacija spremenljivke s samo seboj 1. Zato so vse diagonalne vrednosti 1,00.

Python3




# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

>

java programiranje praštevil
>

Izhod

Korelacije podatkov Pandas

Poiščite korelacijo med stolpci z uporabo Kendallove metode

Uporabite funkcijo Pandas df.corr(), da poiščete korelacijo med stolpci v Dataframeu z metodo 'kendall'. Izhodni podatkovni okvir je mogoče razlagati kot za katero koli celico, korelacija spremenljivke vrstice s spremenljivko stolpca je vrednost celice. Kot smo že omenili, je korelacija spremenljivke s samo seboj 1. Zato so vse diagonalne vrednosti 1,00.

Python3




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

>

>

Izhod

dataframe.corr