Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-Pandasデータフレームの列のグループ化


Pandasデータフレームの列をグループ化するには、groupby()を使用します。まず、Pandasデータフレームを作成しましょう-

dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Audi", "Mercedes", "Audi", "Lexus", "Mercedes", "Lexus", "Mercedes"],
      "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

車の列に従ってグループ化しましょう-

res = dataFrame.groupby("Car")

グループ化した後、関数を使用して、グループ化された車の名前の平均登録価格(Reg_Price)を見つけます-

res.mean()

これは、列Carに従って登録価格の平均を計算します。

以下はコードです-

import pandas as pd

# dataframe with one of the columns as Reg_Price
dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Audi", "Mercedes", "Audi", "Lexus", "Mercedes", "Lexus", "Mercedes"],
      "Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
   }
)

print"DataFrame...\n",dataFrame

# grouped according to Car
res = dataFrame.groupby("Car")

print"\nMean of Registration Price grouped according to Car names...\n",res.mean()

出力

これにより、次の出力が生成されます-

DataFrame...
      Car    Reg_Price
0     Audi        1000
1    Lexus        1400
2     Audi        1100
3 Mercedes         900
4     Audi        1700
5    Lexus        1800
6 Mercedes        1300
7    Lexus        1150
8 Mercedes        1350
Mean of Registration Price grouped according to Car names...
           Reg_Price
    Car
    Audi   1266.666667
   Lexus   1450.000000
Mercedes   1183.333333

  1. Python-PandasDataFrameのサブセットを選択する方法

    以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") サブセットを選択するには、角かっこを使用します。括弧内の列に言及し、データセット全体から単一の列をフェッチします- dataFrame['Car'] 例 以下はコードです- import pandas as pd # Load data fr

  2. Python Pandas-DataFrameに複数のデータ列をプロットしますか?

    複数の列をプロットするには、棒グラフをプロットします。 plot()を使用します メソッドと種類を設定します バーへのパラメータ 棒グラフ用。まず、必要なライブラリをインポートしましょう- import pandas as pd import matplotlib.pyplot as mp 以下は、チームレコードのデータです- data = [["Australia", 2500, 2021],["Bangladesh", 1000, 2021],["England", 2000, 2021],["India"