値をグループ化する方法は、PandasDataFrameに依存します
値をグループ化するには、Pandas DataFrameのgroupby()、size()、およびunstack()メソッドを使用します。最初に、3列のDataFrameを作成します-
dataFrame = pd.DataFrame({ 'Product Category': ['Computer', 'Mobile Phone', 'Electronics', 'Electronics', 'Computer', 'Mobile Phone'],'Product Name': ['Keyboard', 'Charger', 'SmartTV', 'Camera', 'Graphic Card', 'Earphone'],'Quantity': [10, 50, 10, 20, 25, 50]})
現在、groupby値はgroupby()メソッドでカウントされます。カウントには、size()とunstack()を使用します。 unstack()は、新しいレベルの列ラベルを提供します-
dataFrame = dataFrame.groupby(['Product Category', 'Product Name', 'Quantity']).size().unstack(fill_value=0)
例
以下は完全なコードです-
import pandas as pd # create a dataframe with 3 columns dataFrame = pd.DataFrame({ 'Product Category': ['Computer', 'Mobile Phone', 'Electronics', 'Electronics', 'Computer', 'Mobile Phone'],'Product Name': ['Keyboard', 'Charger', 'SmartTV', 'Camera', 'Graphic Card', 'Earphone'],'Quantity': [10, 50, 10, 20, 25, 50]}) # dataframe print"Dataframe...\n",dataFrame # count and unstack dataFrame = dataFrame.groupby(['Product Category', 'Product Name', 'Quantity']).size().unstack(fill_value=0) print"\nResultant DataFrame...\n",dataFrame
出力
これにより、次の出力が生成されます-
Dataframe... Product Category Product Name Quantity 0 Computer Keyboard 10 1 Mobile Phone Charger 50 2 Electronics SmartTV 10 3 Electronics Camera 20 4 Computer Graphic Card 25 5 Mobile Phone Earphone 50 Resultant DataFrame... Quantity 10 20 25 50 Product Category Product Name Computer Graphic Card 0 0 1 0 Keyboard 1 0 0 0 Electronics Camera 0 1 0 0 SmartTV 1 0 0 0 Mobile Phone Charger 0 0 0 1 Earphone 0 0 0 1
-
Python-PandasDataFrameからnull行を削除する方法
Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-
-
MatplotlibでPandasデータフレームプロットのDPIを変更するにはどうすればよいですか?
Pandas DataFrameプロットのDPIを変更するには、 rcParamsを使用できます。 1インチあたりのドット数を設定します。 ステップ 図のサイズを設定し、サブプロット間およびサブプロットの周囲のパディングを調整します。 DPI値を.rcParams[figure.dpi] =120に設定します Pandasデータフレームを作成してプロットを作成します。 データフレームをプロットします。 図を表示するには、 show()を使用します メソッド。 例 import pandas as pd from matplotlib import pyplot as plt plt.r