Python
 Computer >> コンピューター >  >> プログラミング >> Python

PythonPandas-各グループの行数を数えます


group.size()を使用して、各グループの行数をカウントします。必要なライブラリをインポートする-

import pandas as pd

データフレームを作成する-

dataFrame = pd.DataFrame({'Product Category': ['Computer', 'Mobile Phone', 'Electronics', 'Electronics', 'Computer', 'Mobile Phone'],'Quantity': [10, 50, 10, 20, 25, 50],'Product Name': ['Keyboard', 'Charger', 'SmartTV', 'Camera', 'Graphic Card', 'Earphone']
})

列でグループ化-

dataFrame.groupby(["Product Category", "Quantity"])

次に、グループサイズをカウントして、各グループの行数を取得します。

以下は完全なコードです-

import pandas as pd

# create a dataframe
dataFrame = pd.DataFrame({'Product Category': ['Computer', 'Mobile Phone', 'Electronics', 'Electronics', 'Computer', 'Mobile Phone'],'Quantity': [10, 50, 10, 20, 25, 50],'Product Name': ['Keyboard', 'Charger', 'SmartTV', 'Camera', 'Graphic Card', 'Earphone']
})

# dataframe
print"Dataframe...\n",dataFrame

# grouping columns
new_group = dataFrame.groupby(["Product Category", "Quantity"])

# group size
new_group = new_group.size()

# dataframe
print"\nUpdated Dataframe...\n",new_group

出力

これにより、次の出力が生成されます-

Dataframe...
   Product Category   Product Name   Quantity
0          Computer       Keyboard         10
1      Mobile Phone        Charger         50
2       Electronics        SmartTV         10
3       Electronics         Camera         20
4          Computer   Graphic Card         25
5      Mobile Phone       Earphone         50

Updated Dataframe...
Product Category   Quantity
Computer           10        1
                   25        1
Electronics        10        1
                   20        1
Mobile Phone       50        2
dtype: int64

  1. Python-Pandasデータフレームの列のNaNオカレンスをカウントする方法は?

    列内のNaNの出現をカウントするには、isna()を使用します。 sum()を使用して値を加算し、カウントを見つけます。 まず、必要なライブラリをそれぞれのエイリアスとともにインポートしましょう- import pandas as pd import numpy as np DataFrameを作成します。 「Units_Sold」列のNumpynp.infを使用してNaN値を設定しました- dataFrame = pd.DataFrame({"Car": ['BMW', 'Lexus', 'Tesla', 'Mu

  2. Python-PandasDataFrameからnull行を削除する方法

    Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-