Python
 Computer >> コンピューター >  >> プログラミング >> Python

PythonPandas-不足している列の値をモードで埋める


モードは、一連の値の中で最も多く表示される値です。 fillna()を使用します メソッドを設定し、欠落している列をモードで埋めるようにモードを設定します。まず、必要なライブラリをそれぞれのエイリアスとともにインポートしましょう-

import pandas as pd
import numpy as np

2列のDataFrameを作成します。 Numpy np.NaNを使用してNaN値を設定しました −

dataFrame = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Lexus', 'Mustang', 'Bentley', 'Mustang'],"Units": [100, 150, np.NaN, 80, np.NaN, np.NaN]
   }
)

NaNを使用して列値のモードを検索します。つまり、ここで単位列を検索します。 NaNを、Units列のmode()を使用して配置されている列のモードに置き換えます-

dataFrame.fillna(dataFrame['Units'].mode()[0], inplace = True)

以下は完全なコードです-

import pandas as pd
import numpy as np

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Lexus', 'Mustang', 'Bentley', 'Mustang'],"Units": [100, 150, np.NaN, 80, np.NaN, np.NaN]
   }
)

print"DataFrame ...\n",dataFrame

# finding mode of the column values with NaN i.e, for Units columns here
# Replace NaNs with the mode of the column where it is located
dataFrame.fillna(dataFrame['Units'].mode()[0], inplace = True)

print"\nUpdated Dataframe after filling NaN values with mode...\n",dataFrame

出力

これにより、次の出力が生成されます-

DataFrame ...
       Car   Units
0      BMW   100.0
1    Lexus   150.0
2    Lexus     NaN
3  Mustang    80.0
4  Bentley     NaN
5  Mustang     NaN

Updated Dataframe after filling NaN values with mode...
       Car   Units
0      BMW   100.0
1    Lexus   150.0
2    Lexus    80.0
3  Mustang    80.0
4  Bentley    80.0
5  Mustang    80.0

  1. PythonPandas-DataFrame内のすべてのNaN要素を0に置き換えます

    NaN値を置き換えるには、fillna()メソッドを使用します。以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") fillna()メソッドを使用してNaN値を0に置き換えます- dataFrame.fillna(0)

  2. PythonPandas-補間法を使用してNaN値を入力します

    Interpolate()メソッドを使用して、NaN値を入力します。以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") NaN値をinterpolate()-で埋めます dataFrame.interpolate() 例 以下はコードです- import pandas as pd # Load dat