Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-PandasDataFrameの列の分散を計算します


列値の分散を計算するには、var()メソッドを使用します。まず、必要なパンダライブラリをインポートします-

import pandas as pd

2つの列を持つDataFrameを作成します-

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Units": [100, 150, 110, 80, 110, 90]
   }
)

var()関数を使用して「単位」列の値の分散を見つける-

print"Variance of Units column from DataFrame1 = ",dataFrame1['Units'].var()

同様に、2番目の から分散を計算しました。 DataFrame。

以下は完全なコードです-

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Units": [100, 150, 110, 80, 110, 90]
   }
)

print"DataFrame1 ...\n",dataFrame1

# Finding Variance of "Units" column values
print"Variance of Units column from DataFrame1 = ",dataFrame1['Units'].var()

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Product": ['TV', 'PenDrive', 'HeadPhone', 'EarPhone', 'HDD', 'SSD'],
      "Price": [8000, 500, 3000, 1500, 3000, 4000]
   }
)

print"\nDataFrame2 ...\n",dataFrame2

# Finding Variance of "Price" column values
print"Variance of Price column from DataFrame2 = ",dataFrame2['Price'].var()

出力

これにより、次の出力が生成されます-

DataFrame1 ...
       Car   Units
0      BMW    100
1    Lexus    150
2     Audi    110
3    Tesla     80
4  Bentley    110
5   Jaguar     90
Variance of Units column from DataFrame1 = 586.666666667

DataFrame2 ...
    Price   Product
0   8000    TV
1   500     PenDrive
2   3000    HeadPhone
3   1500    EarPhone
4   3000    HDD
5   4000    SSD
Variance of Price column from DataFrame2 = 6766666.66667

  1. PythonPandas-DataFrameの列をクエリします

    Pandas DataFrameの列をクエリするには、query()を使用します。レコードをフィルタリングするためにクエリを実行しています。まず、PandasDataFrameを作成しましょう dataFrame = pd.DataFrame({"Product": ["SmartTV", "PenDrive", "Speaker", "Earphone"],"Opening_Stock": [300, 700, 1200, 1500],"Closing_Stock

  2. Pandas Pythonでデータフレームの特定の列の合計を取得するにはどうすればよいですか?

    特定の列の合計を取得する必要がある場合があります。ここで「合計」関数を使用できます。 合計を計算する必要がある列は、値として合計関数に渡すことができます。列のインデックスを渡して合計を求めることもできます。 同じのデモンストレーションを見てみましょう- 例 import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 1