Pandas Pythonでデータフレームの特定の列の合計を取得するにはどうすればよいですか?
特定の列の合計を取得する必要がある場合があります。ここで「合計」関数を使用できます。
合計を計算する必要がある列は、値として合計関数に渡すことができます。列のインデックスを渡して合計を求めることもできます。
同じのデモンストレーションを見てみましょう-
例
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20]) } print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The sum of 'age' column is :") print(my_df.sum(1))
出力
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The sum of 'age' column is : 0 53.79 1 90.24 2 120.98 3 90.56 4 113.20 dtype: float64
説明
-
必要なライブラリがインポートされ、使いやすいようにエイリアス名が付けられています。
-
キーと値で構成されるシリーズの辞書が作成されます。値は実際にはシリーズのデータ構造です。
-
この辞書は、後で「パンダ」ライブラリにある「データフレーム」関数にパラメータとして渡されます
。 -
データフレームはコンソールに印刷されます。
-
「年齢」列の合計を計算することを検討しています。
-
合計を計算する必要がある列の名前は、「合計」関数にパラメーターとして渡されます。
-
合計はコンソールに印刷されます。
-
Python-Pandasデータフレームの列のNaNオカレンスをカウントする方法は?
列内のNaNの出現をカウントするには、isna()を使用します。 sum()を使用して値を加算し、カウントを見つけます。 まず、必要なライブラリをそれぞれのエイリアスとともにインポートしましょう- import pandas as pd import numpy as np DataFrameを作成します。 「Units_Sold」列のNumpynp.infを使用してNaN値を設定しました- dataFrame = pd.DataFrame({"Car": ['BMW', 'Lexus', 'Tesla', 'Mu
-
Python-PandasDataFrameからnull行を削除する方法
Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-