Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonパンダ–観察結果を数える


観測値をカウントするには、最初にgroupby()を使用し、次に結果に対してcount()を使用します。まず、必要なライブラリをインポートします-

dataFrame = pd.DataFrame({'Product Name': ['Keyboard', 'Charger', 'SmartTV', 'Camera', 'Graphic Card', 'Earphone'],'Product Category': ['Computer', 'Mobile Phone', 'Electronics','Electronics', 'Computer', 'Mobile Phone'],'Quantity': [10, 50, 10, 20, 25, 50]})

重複する値で列をグループ化-

group = dataFrame.groupby("Product Category")

カウントを取得-

group.count()

以下はコードです-

import pandas as pd

# create a dataframe
dataFrame = pd.DataFrame({'Product Name': ['Keyboard', 'Charger', 'SmartTV', 'Camera', 'Graphic Card', 'Earphone'],'Product Category': ['Computer', 'Mobile Phone', 'Electronics','Electronics', 'Computer', 'Mobile Phone'],'Quantity': [10, 50, 10, 20, 25, 50]})

# dataframe
print"Dataframe...\n",dataFrame

# count the observations
group = dataFrame.groupby("Product Category")

print"\nResultant DataFrame...\n",group.count()

出力

これにより、次の出力が生成されます-

Dataframe...
   Product Category   Product Name   Quantity
0          Computer       Keyboard        10
1      Mobile Phone        Charger        50
2       Electronics        SmartTV        10
3       Electronics         Camera        20
4          Computer   Graphic Card        25
5      Mobile Phone       Earphone        50

Resultant DataFrame...
                   Product Name   Quantity
Product Category
Computer                     2           2
Electronics                  2           2
Mobile Phone                 2           2

  1. データセットをプロットして下降トレンドを表示– Python Pandas

    時系列分析によって表示される下向きのパターンは、私たちがダウントレンドと呼んでいるものです。次がデータセット、つまりSalesRecords2.csvであるとします。 まず、必要なライブラリをインポートします- import pandas as pd import matplotlib.pyplot as plt CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesRecords2.csv") 日時オブジェクトへの列のキャスト- da

  2. データセットをプロットして上昇傾向を表示– Python Pandas

    時系列分析によって表示される上向きのパターンは、私たちが上昇傾向と呼んでいるものです。次がデータセット、つまりSalesRecords.csvであるとします。 まず、必要なライブラリをインポートします- import pandas as pd import matplotlib.pyplot as plt CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesRecords.csv") 日時オブジェクトへの列のキャスト- dataFram