Python
 Computer >> コンピューター >  >> プログラミング >> Python

PandasDataFrameの2つの数値列間の相関


pandas.DataFrame.corrを使用できます NULL値を除いて、列のペアワイズ相関を計算します。相関係数は、2つの変数間の線形関連の強さを示します。係数の範囲は-1から1です。

Pandasデータフレームの2つの数値列間の相関を取得するには、次の手順を実行できます-

  • 図のサイズを設定し、サブプロット間およびサブプロットの周囲のパディングを調整します。
  • 2次元、サイズ変更可能、潜在的に異種の表形式データのPandasデータフレームを作成します。
  • 2つの列の値を比較し、col1.corr(col2)を使用して相関係数を計算します。
  • コンソールに相関係数を印刷します。
  • 図を表示するには、 show()を使用します メソッド。

import pandas as pd
from matplotlib import pyplot as plt

plt.rcParams["figure.figsize"] = [7.00, 3.50]
plt.rcParams["figure.autolayout"] = True

df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]})

col1 = df['lab']
col2 = df['value']

plt.plot(col1, col2)

print("The correlation coefficient is: ", col1.corr(col2))

plt.show()

出力

次の出力が生成されます

The correlation coefficient is: 1.0

PandasDataFrameの2つの数値列間の相関 PandasDataFrameの2つの数値列間の相関

ここで、相関係数は1.0であり、完全な相関を示しています。したがって、すべての点が直線に沿っているため、直線になります。


  1. Python-Pandasデータフレームから複数の列を選択します

    以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") 複数の列レコードを選択するには、角かっこを使用します。括弧内の列に言及し、データセット全体から複数の列をフェッチします- dataFrame[['Reg_Price','Units']] 例 以下はコードです- import pa

  2. Python Pandas-DataFrameに複数のデータ列をプロットしますか?

    複数の列をプロットするには、棒グラフをプロットします。 plot()を使用します メソッドと種類を設定します バーへのパラメータ 棒グラフ用。まず、必要なライブラリをインポートしましょう- import pandas as pd import matplotlib.pyplot as mp 以下は、チームレコードのデータです- data = [["Australia", 2500, 2021],["Bangladesh", 1000, 2021],["England", 2000, 2021],["India"