Pandas GroupBy –各組み合わせの発生をカウントします
列をグループ化し、Pandasでの各組み合わせの発生をカウントするには、DataFrame.groupby()とsize()を使用します。 groupby()メソッドは、DataFrameをグループに分割します。
最初に、エイリアスpd-
を使用してpandasライブラリをインポートしましょう。import pandas as pd
リストのデータを初期化する-
# initializing the data mylist = {'Car': ['BMW', 'Mercedes', 'Lamborgini', 'Audi', 'Mercedes', 'Porche', 'RollsRoyce', 'BMW'], 'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Bangalore', 'Hyderabad', 'Mumbai', 'Mumbai','Delhi'], 'Sold': [95, 80, 80, 75, 90, 90, 95, 50 ]}
次に、DataFrameを作成します-
# DataFrame dataFrame = pd.DataFrame(mylist, columns=['Car', 'Place', 'Sold'])
ここで、groupby()を使用して、size()-
で発生をカウントします。print("Counting the occurrences...") res = dataFrame.groupby(['Car', 'Place']).size()
以下は、各組み合わせの発生をカウントするコードです-
例
# importing library import pandas as pd # initializing the data mylist = {'Car': ['BMW', 'Mercedes', 'Lamborgini', 'Audi', 'Mercedes', 'Porsche', 'RollsRoyce', 'BMW'], 'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Bangalore', 'Hyderabad', 'Mumbai', 'Mumbai','Delhi'], 'Sold': [95, 80, 80, 75, 90, 90, 95, 50 ]} # DataFrame dataFrame = pd.DataFrame(mylist, columns=['Car', 'Place', 'Sold']) print(dataFrame) print("Counting the occurrences...") res = dataFrame.groupby(['Car', 'Place']).size() # Displaying the occurrences print(res)
出力
これにより、次の出力が生成されます-
Car Place Sold 0 BMW Delhi 95 1 Mercedes Hyderabad 80 2 Lamborgini Chandigarh 80 3 Audi Bangalore 75 4 Mercedes Hyderabad 90 5 Porsche Mumbai 90 6 RollsRoyce Mumbai 95 7 BMW Delhi 50 Counting the occurrences... Car Place Audi Bangalore 1 BMW Delhi 2 Lamborgini Chandigarh 1 Mercedes Hyderabad 2 Porsche Mumbai 1 RollsRoyce Mumbai 1 dtype: int64
-
パンダのマルチインデックスでgroupbyを行う方法は?
マルチインデックスデータフレームは、複数のインデックスを持つデータフレームです。以下がデスクトップに保存されているcsvであるとしましょう- まず、パンダライブラリをインポートし、上記のCSVファイルを読み取ります- パンダをpddf=pd.read_csv( C:/Users/amit_/Desktop/sales.csv)print(df)としてインポートします データフレームの「Car」列と「Place」列をインデックスとして形成します- df =df.set_index([Car、Place]) DataFrameは、「Car」列と「Place」列をインデックスとして持つ
-
Python Pandas DataFrameで各グループの最大のものを選択するにはどうすればよいですか?
はじめに データ分析中に実行する最も基本的で一般的な操作の1つは、グループ内のいくつかの列の最大値を含む行を選択することです。この投稿では、DataFrame内の各グループの最大のものを見つける方法を紹介します。 問題.. 最初にタスクを理解しましょう。映画のデータセットが与えられ、人気に基づいて毎年最も人気のある映画をリストするように要求されたと仮定します。 その方法.. 1.データの準備。 グーグルはデータセットでいっぱいです。私はよくkaggle.comを使用して、データ分析に必要なデータセットを取得します。 kaggle.comにログインして、映画を検索してください。映画のデー