Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-Numpyを使用したPandasAggregationで明確にカウント


区別するには、Pandasでnuniqueを使用します。列ごとにグループ化し、Numpy sum()を使用して太陽も検索します。

まず、必要なライブラリをインポートします-

パンダをpdimportnumpyasnpとしてインポート

3列のDataFrameを作成します。列の値が重複しています-

 dataFrame =pd.DataFrame({"Car":['BMW'、'Audi'、'BMW'、'Lexus'、'Lexus']、 "Place":['Delhi'、'Bangalore'、 'デリー'、'チャンディガー'、'チャンディガー']、 "ユニット":[100、150、50、110、90]})

nuniqueを使用した集計agg()で個別にカウントします。カウントするための合計を計算するために、numpy sum()-

を使用しています。
 dataFrame =dataFrame.groupby( "Car")。agg({"Units":np.sum、 "Place":pd.Series.nunique})

以下はコードです-

 import pandas as pdimport numpy as npdataFrame =pd.DataFrame({"Car":['BMW'、'Audi'、'BMW'、'Lexus'、'Lexus']、 "Place":['Delhi' 、'Bangalore'、'Delhi'、'Chandigarh'、'Chandigarh']、 "Units":[100、150、50、110、90]})print "DataFrame ... \ n"、dataFrame#count different in nuniquedataFrame =dataFrame.groupby( "Car")。agg({"Units":np.sum、 "Place":pd.Series.nunique})print "\ nUpdated DataFrame ... \ n"、dataFrame 

出力

これにより、次の出力が生成されます-

 DataFrame ... Car Place Units0 BMW Delhi 1001 Audi Bangalore 1502 BMW Delhi 503 Lexus Chandigarh 1104 Lexus Chandigarh 90Updated DataFrame ... Units PlaceCarAudi 150 1BMW 150 1Lexus 200 1 

  1. Python-Matplotlibを使用してPandasデータフレームのヒストグラムをプロットしますか?

    ヒストグラムは、データの分布を表したものです。ヒストグラムをプロットするには、hist()メソッドを使用します。最初に、両方のライブラリをインポートします- import pandas as pd import matplotlib.pyplot as plt 2列のデータフレームを作成する- dataFrame = pd.DataFrame({    "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', '

  2. PythonPandas-DataFrame内のすべてのNaN要素を0に置き換えます

    NaN値を置き換えるには、fillna()メソッドを使用します。以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") fillna()メソッドを使用してNaN値を0に置き換えます- dataFrame.fillna(0)