Python-Numpyを使用したPandasAggregationで明確にカウント
区別するには、Pandasでnuniqueを使用します。列ごとにグループ化し、Numpy sum()を使用して太陽も検索します。
まず、必要なライブラリをインポートします-
パンダをpdimportnumpyasnpとしてインポート
3列のDataFrameを作成します。列の値が重複しています-
dataFrame =pd.DataFrame({"Car":['BMW'、'Audi'、'BMW'、'Lexus'、'Lexus']、 "Place":['Delhi'、'Bangalore'、 'デリー'、'チャンディガー'、'チャンディガー']、 "ユニット":[100、150、50、110、90]})
nuniqueを使用した集計agg()で個別にカウントします。カウントするための合計を計算するために、numpy sum()-
を使用しています。dataFrame =dataFrame.groupby( "Car")。agg({"Units":np.sum、 "Place":pd.Series.nunique})
例
以下はコードです-
import pandas as pdimport numpy as npdataFrame =pd.DataFrame({"Car":['BMW'、'Audi'、'BMW'、'Lexus'、'Lexus']、 "Place":['Delhi' 、'Bangalore'、'Delhi'、'Chandigarh'、'Chandigarh']、 "Units":[100、150、50、110、90]})print "DataFrame ... \ n"、dataFrame#count different in nuniquedataFrame =dataFrame.groupby( "Car")。agg({"Units":np.sum、 "Place":pd.Series.nunique})print "\ nUpdated DataFrame ... \ n"、dataFrameを使用した集計pre>出力
これにより、次の出力が生成されます-
DataFrame ... Car Place Units0 BMW Delhi 1001 Audi Bangalore 1502 BMW Delhi 503 Lexus Chandigarh 1104 Lexus Chandigarh 90Updated DataFrame ... Units PlaceCarAudi 150 1BMW 150 1Lexus 200 1
-
Python-Matplotlibを使用してPandasデータフレームのヒストグラムをプロットしますか?
ヒストグラムは、データの分布を表したものです。ヒストグラムをプロットするには、hist()メソッドを使用します。最初に、両方のライブラリをインポートします- import pandas as pd import matplotlib.pyplot as plt 2列のデータフレームを作成する- dataFrame = pd.DataFrame({ "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', '
-
PythonPandas-DataFrame内のすべてのNaN要素を0に置き換えます
NaN値を置き換えるには、fillna()メソッドを使用します。以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") fillna()メソッドを使用してNaN値を0に置き換えます- dataFrame.fillna(0)