Python
 Computer >> コンピューター >  >> プログラミング >> Python

ローリング平均を見つける– Python Pandas


ローリング平均を見つけるために、Pandasのapply()関数を使用します。まず、必要なライブラリをインポートしましょう-

import pandas as pd

2列のDataFrameを作成します。 1つはint列です-

dataFrame = pd.DataFrame(
   {
      "Car": ['Tesla', 'Mercedes', 'Tesla', 'Mustang', 'Mercedes', 'Mustang'],
      "Reg_Price": [5000, 1500, 6500, 8000, 9000, 6000]

   }
)

GroupByを使用してグループ化し、apply()-

を使用してローリング平均を見つけます。
dataFrame.groupby("Car")["Reg_Price"].apply(
lambda x: x.rolling(center=False, window=2).mean())

以下はコードです-

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Car": ['Tesla', 'Mercedes', 'Tesla', 'Mustang', 'Mercedes', 'Mustang'],
      "Reg_Price": [5000, 1500, 6500, 8000, 9000, 6000]
   }
)

print"DataFrame ...\n",dataFrame

print"\nRolling Mean...\n",dataFrame.groupby("Car")["Reg_Price"].apply(
lambda x: x.rolling(center=False, window=2).mean())

出力

これにより、次の出力が生成されます-

DataFrame ...
        Car   Reg_Price
0     Tesla       5000
1  Mercedes       1500
2     Tesla       6500
3   Mustang       8000
4  Mercedes       9000
5   Mustang       6000

Rolling Mean...
0       NaN
1       NaN
2    5750.0
3       NaN
4    5250.0
5    7000.0
Name: Reg_Price, dtype: float64

  1. PythonPandas-TimedeltaIndexのコンポーネントのデータフレームを返します

    TimedeltaIndexのコンポーネントのデータフレームを返すには、 TimedeltaIndex.componentsを使用します プロパティ。 まず、必要なライブラリをインポートします- import pandas as pd TimeDeltaIndexオブジェクトを作成します。 dataパラメータも使用してtimedeltaのようなデータを設定しました- tdIndex = pd.TimedeltaIndex(data =['10 day 5h 2 min 35s 3us 10ns', '+22:39:19.999999', '2 day

  2. Python-パンダのデータフレームをCSVファイルに書き込む方法

    pandasデータフレームをPythonでCSVファイルに書き込むには、 to_csv()を使用します 方法。まず、リストの辞書を作成しましょう- # dictionary of lists d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'],'Date_of_purchase': ['2020-10-10', '2020-10-12', '