Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-Pandasデータフレームの列のNaNオカレンスをカウントする方法は?


列内のNaNの出現をカウントするには、isna()を使用します。 sum()を使用して値を加算し、カウントを見つけます。

まず、必要なライブラリをそれぞれのエイリアスとともにインポートしましょう-

import pandas as pd
import numpy as np

DataFrameを作成します。 「Units_Sold」列のNumpynp.infを使用してNaN値を設定しました-

dataFrame = pd.DataFrame({"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Cubic_Capacity": [2000, 1800, 1500, 2500, 2200, 3000],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000],"Units_Sold": [ 100, np.NaN, 150, np.NaN, 200, np.NaN]
})

列「Units_Sold」からNaN値をカウントします-

dataFrame["Units_Sold"].isna().sum()

以下はコードです-

import pandas as pd
import numpy as np

# creating dataframe
dataFrame = pd.DataFrame({"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Cubic_Capacity": [2000, 1800, 1500, 2500, 2200, 3000],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000],"Units_Sold": [ 100, np.NaN, 150, np.NaN, 200, np.NaN]
})

print("Dataframe...\n",dataFrame)

# count NaN values from column "Units_Sol"
count = dataFrame["Units_Sold"].isna().sum()

print("\nCount of NaN values in column Units_Sold...\n",count)

出力

これにより、次の出力が生成されます-

Dataframe...
        Car   Cubic_Capacity   Reg_Price   Units_Sold
0       BMW             2000        7000        100.0
1     Lexus             1800        1500          NaN
2     Tesla             1500        5000        150.0
3   Mustang             2500        8000          NaN
4  Mercedes             2200        9000        200.0
5    Jaguar             3000        6000          NaN

Count of NaN values in column Units_Sold...
3

  1. Python-PandasDataFrameからnull行を削除する方法

    Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-

  2. Pandas Pythonでデータフレームの特定の列の合計を取得するにはどうすればよいですか?

    特定の列の合計を取得する必要がある場合があります。ここで「合計」関数を使用できます。 合計を計算する必要がある列は、値として合計関数に渡すことができます。列のインデックスを渡して合計を求めることもできます。 同じのデモンストレーションを見てみましょう- 例 import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 1