Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pandas GroupBy –各組み合わせの発生をカウントします


列をグループ化し、Pandasでの各組み合わせの発生をカウントするには、DataFrame.groupby()とsize()を使用します。 groupby()メソッドは、DataFrameをグループに分割します。

最初に、エイリアスpd-

を使用してpandasライブラリをインポートしましょう。
import pandas as pd

リストのデータを初期化する-

# initializing the data
mylist = {'Car': ['BMW', 'Mercedes', 'Lamborgini', 'Audi', 'Mercedes', 'Porche', 'RollsRoyce', 'BMW'], 'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Bangalore', 'Hyderabad', 'Mumbai', 'Mumbai','Delhi'],
'Sold': [95, 80, 80, 75, 90, 90, 95, 50 ]}

次に、DataFrameを作成します-

# DataFrame
dataFrame = pd.DataFrame(mylist, columns=['Car', 'Place', 'Sold'])

ここで、groupby()を使用して、size()-

で発生をカウントします。
print("Counting the occurrences...")
res = dataFrame.groupby(['Car', 'Place']).size()

以下は、各組み合わせの発生をカウントするコードです-

# importing library
import pandas as pd

# initializing the data
mylist = {'Car': ['BMW', 'Mercedes', 'Lamborgini', 'Audi', 'Mercedes', 'Porsche', 'RollsRoyce', 'BMW'],
'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Bangalore', 'Hyderabad', 'Mumbai', 'Mumbai','Delhi'],
'Sold': [95, 80, 80, 75, 90, 90, 95, 50 ]}

# DataFrame
dataFrame = pd.DataFrame(mylist, columns=['Car', 'Place', 'Sold'])

print(dataFrame)

print("Counting the occurrences...")
res = dataFrame.groupby(['Car', 'Place']).size()

# Displaying the occurrences
print(res)

出力

これにより、次の出力が生成されます-

          Car           Place       Sold
0         BMW           Delhi         95
1    Mercedes       Hyderabad         80
2  Lamborgini      Chandigarh         80
3        Audi       Bangalore         75
4    Mercedes       Hyderabad         90
5     Porsche          Mumbai         90
6  RollsRoyce          Mumbai         95
7         BMW           Delhi         50
Counting the occurrences...
Car         Place
Audi        Bangalore     1
BMW         Delhi         2
Lamborgini  Chandigarh    1
Mercedes    Hyderabad     2
Porsche     Mumbai        1
RollsRoyce  Mumbai        1
dtype: int64

  1. パンダのマルチインデックスでgroupbyを行う方法は?

    マルチインデックスデータフレームは、複数のインデックスを持つデータフレームです。以下がデスクトップに保存されているcsvであるとしましょう- まず、パンダライブラリをインポートし、上記のCSVファイルを読み取ります- パンダをpddf=pd.read_csv( C:/Users/amit_/Desktop/sales.csv)print(df)としてインポートします データフレームの「Car」列と「Place」列をインデックスとして形成します- df =df.set_index([Car、Place]) DataFrameは、「Car」列と「Place」列をインデックスとして持つ

  2. Python Pandas DataFrameで各グループの最大のものを選択するにはどうすればよいですか?

    はじめに データ分析中に実行する最も基本的で一般的な操作の1つは、グループ内のいくつかの列の最大値を含む行を選択することです。この投稿では、DataFrame内の各グループの最大のものを見つける方法を紹介します。 問題.. 最初にタスクを理解しましょう。映画のデータセットが与えられ、人気に基づいて毎年最も人気のある映画をリストするように要求されたと仮定します。 その方法.. 1.データの準備。 グーグルはデータセットでいっぱいです。私はよくkaggle.comを使用して、データ分析に必要なデータセットを取得します。 kaggle.comにログインして、映画を検索してください。映画のデー