METODA PANDAS DATAFRAME CORR() - TECHCODEVIEW.COM

Pande dataframe.corr() se uporablja za iskanje parne korelacije vseh stolpcev v Pandas Dataframe v Pythonu. Kaj NaN vrednosti so samodejno izključene. Če želite prezreti vse neštevilske vrednosti, uporabite parameter numeric_only = True. V tem članku bomo spoznali metodo DataFrame.corr(). Python .

Sintaksa metode Pandas DataFrame corr().

Sintaksa: DataFrame.corr(self, method='pearson', min_periods=1, numeric_only = False)

Parametri:

metoda:

pearson: standardni korelacijski koeficient

kendall: korelacijski koeficient Kendall Tau

spearman: korelacija ranga spearman

min_obdobja: Najmanjše število opazovanj, potrebnih na par stolpcev za veljaven rezultat. Trenutno na voljo samo za korelacijo Pearson in spearman

numeric_only : ali naj se upravlja samo s številskimi vrednostmi ali ne. Privzeto je nastavljen na False.

Vrne: count :y : DataFrame

Metoda korelacije podatkov Pandas corr().

Dobra korelacija je odvisna od uporabe, vendar lahko z gotovostjo rečemo, da imate vsaj 0,6 (ali -0,6), da jo imenujemo dobra korelacija. Preprost primer, ki prikazuje, kako deluje korelacija Python .

Python3

import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

statična funkcija v Javi

Izhod

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Ustvarjanje vzorčnega podatkovnega okvira

Tiskanje prvih 10 vrstic Dataframe.

Opomba: Korelacija spremenljivke s samo seboj je 1. Za povezavo do datoteke CSV, uporabljene v kodi, kliknite tukaj

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

Izhod

Korelacije podatkov Pandas

Primeri metode Python Pandas DataFrame corr().

Poiščite korelacijo med stolpci z uporabo pearsonove metode

Tu uporabljamo funkcijo corr(), da poiščemo korelacijo med stolpci v Dataframeu z uporabo metode Pearson. V Dataframeu imamo samo štiri številske stolpce. Izhodni podatkovni okvir je mogoče razlagati kot za katero koli celico, korelacija spremenljivke vrstice s spremenljivko stolpca je vrednost celice. Kot smo že omenili, je korelacija spremenljivke s samo seboj 1. Zato so vse diagonalne vrednosti 1,00.

Python3

# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

java programiranje praštevil

Izhod

Korelacije podatkov Pandas

Poiščite korelacijo med stolpci z uporabo Kendallove metode

Uporabite funkcijo Pandas df.corr(), da poiščete korelacijo med stolpci v Dataframeu z metodo 'kendall'. Izhodni podatkovni okvir je mogoče razlagati kot za katero koli celico, korelacija spremenljivke vrstice s spremenljivko stolpca je vrednost celice. Kot smo že omenili, je korelacija spremenljivke s samo seboj 1. Zato so vse diagonalne vrednosti 1,00.

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

Izhod

dataframe.corr

TechCodeview

Metoda Pandas DataFrame corr().

Sintaksa metode Pandas DataFrame corr().

Metoda korelacije podatkov Pandas corr().

Python3

Ustvarjanje vzorčnega podatkovnega okvira

Python3

Primeri metode Python Pandas DataFrame corr().

Poiščite korelacijo med stolpci z uporabo pearsonove metode

Python3

Poiščite korelacijo med stolpci z uporabo Kendallove metode

Python3