Python
 Computer >> コンピューター >  >> プログラミング >> Python

パンダのマルチインデックスでgroupbyを行う方法は?


マルチインデックスデータフレームは、複数のインデックスを持つデータフレームです。以下がデスクトップに保存されているcsvであるとしましょう-

パンダのマルチインデックスでgroupbyを行う方法は?

まず、パンダライブラリをインポートし、上記のCSVファイルを読み取ります-

パンダをpddf=pd.read_csv( "C:/Users/amit_/Desktop/sales.csv")print(df)
としてインポートします

データフレームの「Car」列と「Place」列をインデックスとして形成します-

 df =df.set_index(['Car'、'Place'])

DataFrameは、「Car」列と「Place」列をインデックスとして持つマルチインデックスのDataFrameになりました。

それでは、多重指数データフレームでgroupbyを使用しましょう:

 res =df.groupby(level =['Car'])['UnitsSold']。mean()print(res)

以下はコードです-

 import pandas as pddf =pd.read_csv( "C:/Users/amit_/Desktop/sales.csv")print(df)#set Car and Place columns of the DataFrame as indexdf =df.set_index(['Car '、' Place'])#sortingdf.sort_index()#groupby on multiindex dataframres =df.groupby(level =['Car'])[' UnitsSold']。mean()print(res)

出力

これにより、次の出力が生成されます-

 Car Place Sold0 BMW Delhi 951 Mercedes Hyderabad 802 Lamborgini Chandigarh 803 Audi Bangalore 754 Mercedes Hyderabad 905 Porsche Mumbai 906 RollsRoyce Mumbai 957 BMW Delhi 50CarAudi 75.8BMW 72.5Lamborgini 80.0Mercedes 85.0Porsche 90.0RollsRolls pre> 
  1. 日付パンダデータフレームごとに集計してプロットする方法は?

    日付パンダデータフレームごとに集計してプロットするには、次の手順を実行できます- ステップ 図のサイズを設定し、サブプロット間およびサブプロットの周囲のパディングを調整します。 データフレームdfを作成します 、2次元、サイズ変更可能、潜在的に異種の表形式データ。 日付パンダデータフレームごとに集計された値を取得します。 dfをプロットします (ステップ3) kind =barを使用 。 図を表示するには、 show()を使用します メソッド。 例 import numpy as np import pandas as pd from matplotlib

  2. Python-PandasDataFrameのサブセットを選択する方法

    以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") サブセットを選択するには、角かっこを使用します。括弧内の列に言及し、データセット全体から単一の列をフェッチします- dataFrame['Car'] 例 以下はコードです- import pandas as pd # Load data fr