Pythonでの相関関係の調査
相関は、2つの変数間の関係を測定するための統計用語です。関係が文字列である場合、ある変数の変化が別の変数の変化を予測可能なパターンで反映していることを意味し、変数は相関していると言います。さらに、第1の変数の変動は、第2の変数に正または負の変動を引き起こす可能性がある。したがって、それらは正または負の相関関係にあると言われます。理想的には、相関係数の値は-1から+1の間で変化します。
- 値が+1またはそれに近い場合、変数は正の相関関係にあると言います。そして、それらは同時に同じ方向に変化します。
- 値が-1またはそれに近い場合、変数は負の相関関係にあると言います。そして、それらは同時に反対方向に変化します。
- 値が0またはそれに近い場合、変数は相関していないと言います。
相関係数を測定する方法はいくつかあります。これらは、numpyまたはscipy.statsの関数として使用できます。以下に、それらがどのように使用されるかを示します。
スピアマンの相関係数の使用
スピアマンの相関は、線形に関連する変数間の関係の程度を測定することです。これは、scipy.statsパッケージが結果を生成するために使用する式に基づいています。これは、相関関係を見つけるために最も広く使用されている式です。
以下の例では、numpy.randon()関数を使用して値が生成される2つの変数を使用します。次に、spearmanr()を適用して、最終結果を取得します。
例
from numpy.random import randn from numpy.random import seed from scipy.stats import spearmanr seed(1) data_input1 = 20 * randn(1000) + 100 data_input2 = data_input1 + (10 * randn(1000) + 50) correlation = spearmanr(data_input1, data_input2) print(correlation)
出力
上記のコードを実行すると、次の結果が得られます-
SpearmanrResult(correlation=0.8724050484050484, pvalue=1.58425746359e-312)
ピアソンの相関を使用する
ピアソンの相関は、線形に関連する変数間の関係の程度を測定するもう1つの方法です。これは、scipy.statsパッケージが結果を生成するために使用する式に基づいています。
以下の例では、numpy.randon()関数を使用して値が生成される2つの変数を使用します。次に、pearsonr()を適用して、最終結果を取得します。
例
from numpy.random import randn from numpy.random import seed from scipy.stats import pearsonr seed(1) data1 = 20 * randn(1000) + 100 data2 = data1 + (10 * randn(1000) + 50) correlation, _ = pearsonr(data1, data2) print('Pearsons correlation: %.3f' % correlation)
出力
上記のコードを実行すると、次の結果が得られます-
Pearsons correlation: 0.888
-
Pythonの名前空間とスコープ
Pythonでは、変数、関数、ライブラリ、モジュールなどを扱います。使用する変数の名前が、別の変数の名前として、または別の関数や別のメソッドの名前としてすでに存在している可能性があります。このようなシナリオでは、これらすべての名前がPythonプログラムによってどのように管理されているかを知る必要があります。これが名前空間の概念です。 以下は名前空間の3つのカテゴリです ローカル名前空間:プログラムによって宣言された関数と変数のすべての名前は、この名前空間に保持されます。この名前空間は、プログラムが実行されている限り存在します。 グローバル名前空間:この名前空間は、Pytho
-
Pythonでの相関と回帰
相関とは、2つのデータセット間の依存関係を含むいくつかの統計的関係を指します。線形回帰は、従属変数と1つ以上の独立変数の間の関係を確立するための線形アプローチです。単一の独立変数は線形回帰と呼ばれ、複数の独立変数は重回帰と呼ばれます。 相関 依存する現象の簡単な例としては、親と子孫の外見の相関関係、製品の価格と供給量の相関関係などがあります。seabornpythonライブラリで利用可能なアイリスデータセットの例を取り上げます。その中で、3種のアヤメの花のがく片と花びらの長さと幅の相関関係を確立しようとしています。見つかった相関関係に基づいて、ある種を別の種から簡単に区別する強力なモデルを作