Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-PandasDataFrameの列の標準偏差を計算します


標準偏差を計算するには、Pandasのstd()メソッドを使用します。まず、必要なパンダライブラリをインポートします-

import pandas as pd

次に、2つの列を持つDataFrameを作成します-

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Units": [100, 150, 110, 80, 110, 90] }
)

std()-

を使用して「単位」列の値の標準偏差を見つける
print"Standard Deviation of Units column from DataFrame1 = ",dataFrame1['Units'].std()

同様に、2番目の からの標準偏差を計算しました。 DataFrame。

以下は完全なコードです-

#
# Python - Calculate the Standard Deviation of column values of a Pandas DataFrame
#

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Units": [100, 150, 110, 80, 110, 90]
   }
)

print"DataFrame1 ...\n",dataFrame1

# Finding Standard Deviation of "Units" column values
print"Standard Deviation of Units column from DataFrame1 = ",dataFrame1['Units'].std()

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Product": ['TV', 'PenDrive', 'HeadPhone', 'EarPhone', 'HDD', 'SSD'],
      "Price": [8000, 500, 3000, 1500, 3000, 4000]
   }
)

print"\nDataFrame2 ...\n",dataFrame2

# Finding Standard Deviation of "Price" column values
print"Standard Deviation of Price column from DataFrame2 = ",dataFrame2['Price'].std()

出力

これにより、次の出力が生成されます-

DataFrame1 ...
       Car   Units
0      BMW    100
1    Lexus    150
2     Audi    110
3    Tesla     80
4  Bentley    110
5   Jaguar     90
Standard Deviation of Units column from DataFrame1 = 24.2212028328

DataFrame2 ...
    Price   Product
0   8000         TV
1   500    PenDrive
2   3000  HeadPhone
3   1500   EarPhone
4   3000        HDD
5   4000        SSD
Standard Deviation of Price column from DataFrame2 = 2601.28173535

  1. Pandas Pythonでデータフレーム内の特定の列の標準偏差を見つける方法は?

    標準偏差は、データセット内の値がどのように分散しているかを示します。また、データセット内の値がデータセット内の列の算術平均からどれだけ離れているかも示します。 場合によっては、本質的に数値である特定の列の標準偏差を取得する必要があります。ここでstd()関数を使用できます。平均を計算する必要のある列にデータフレームのインデックスを付けることができ、ドット演算子を使用して平均関数を呼び出すことができます。 列のインデックスを渡して、標準偏差を見つけることもできます。 同じのデモンストレーションを見てみましょう- 例 import pandas as pd my_data = {'N

  2. Pandas Pythonでデータフレームの特定の列の合計を取得するにはどうすればよいですか?

    特定の列の合計を取得する必要がある場合があります。ここで「合計」関数を使用できます。 合計を計算する必要がある列は、値として合計関数に渡すことができます。列のインデックスを渡して合計を求めることもできます。 同じのデモンストレーションを見てみましょう- 例 import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 1