Python
 Computer >> コンピューター >  >> プログラミング >> Python

値をグループ化する方法は、PandasDataFrameに依存します


値をグループ化するには、Pandas DataFrameのgroupby()、size()、およびunstack()メソッドを使用します。最初に、3列のDataFrameを作成します-

dataFrame = pd.DataFrame({
   'Product Category': ['Computer', 'Mobile Phone', 'Electronics', 'Electronics', 'Computer', 'Mobile Phone'],'Product Name': ['Keyboard', 'Charger', 'SmartTV', 'Camera', 'Graphic Card', 'Earphone'],'Quantity': [10, 50, 10, 20, 25, 50]})

現在、groupby値はgroupby()メソッドでカウントされます。カウントには、size()とunstack()を使用します。 unstack()は、新しいレベルの列ラベルを提供します-

dataFrame = dataFrame.groupby(['Product Category', 'Product Name', 'Quantity']).size().unstack(fill_value=0)

以下は完全なコードです-

import pandas as pd

# create a dataframe with 3 columns
dataFrame = pd.DataFrame({
   'Product Category': ['Computer', 'Mobile Phone', 'Electronics', 'Electronics', 'Computer', 'Mobile Phone'],'Product Name': ['Keyboard', 'Charger', 'SmartTV', 'Camera', 'Graphic Card', 'Earphone'],'Quantity': [10, 50, 10, 20, 25, 50]})

# dataframe
print"Dataframe...\n",dataFrame

# count and unstack
dataFrame = dataFrame.groupby(['Product Category', 'Product Name', 'Quantity']).size().unstack(fill_value=0)

print"\nResultant DataFrame...\n",dataFrame

出力

これにより、次の出力が生成されます-

Dataframe...
   Product Category   Product Name   Quantity
0         Computer       Keyboard         10
1     Mobile Phone        Charger         50
2      Electronics        SmartTV         10
3      Electronics         Camera         20
4         Computer   Graphic Card         25
5     Mobile Phone       Earphone         50

Resultant DataFrame...
Quantity                          10   20   25   50
Product Category   Product Name
Computer           Graphic Card   0    0    1    0
                   Keyboard       1    0    0    0
Electronics        Camera         0    1    0    0
                   SmartTV        1    0    0    0
Mobile Phone       Charger        0    0    0    1
                   Earphone       0    0    0    1

  1. Python-PandasDataFrameからnull行を削除する方法

    Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-

  2. MatplotlibでPandasデータフレームプロットのDPIを変更するにはどうすればよいですか?

    Pandas DataFrameプロットのDPIを変更するには、 rcParamsを使用できます。 1インチあたりのドット数を設定します。 ステップ 図のサイズを設定し、サブプロット間およびサブプロットの周囲のパディングを調整します。 DPI値を.rcParams[figure.dpi] =120に設定します Pandasデータフレームを作成してプロットを作成します。 データフレームをプロットします。 図を表示するには、 show()を使用します メソッド。 例 import pandas as pd from matplotlib import pyplot as plt plt.r