PythonPandas-欠落している列の値を中央値で埋める
中央値は、データの上半分と下半分を分離します。 fillna()メソッドを使用し、中央値を設定して、欠落している列を中央値で埋めます。まず、必要なライブラリをそれぞれのエイリアスとともにインポートしましょう-
import pandas as pd import numpy as np
2列のDataFrameを作成します。 Numpy np.NaNを使用してNaN値を設定しました −
dataFrame = pd.DataFrame(
{
"Car": ['Lexus', 'BMW', 'Audi', 'Bentley', 'Mustang', 'Tesla'],"Units": [100, 150, np.NaN, 80, np.NaN, np.NaN]
}
) NaNを使用して列値の中央値を検索します。つまり、ここで単位列を検索します。 NaNを、Units列のmedian()を使用して配置されている列の中央値に置き換えます-
dataFrame.fillna(dataFrame['Units'].median(), inplace = True)
例
以下はコードです-
import pandas as pd
import numpy as np
# Create DataFrame
dataFrame = pd.DataFrame(
{
"Car": ['Lexus', 'BMW', 'Audi', 'Bentley', 'Mustang', 'Tesla'],"Units": [100, 150, np.NaN, 80, np.NaN, np.NaN]
}
)
print"DataFrame ...\n",dataFrame
# finding median of the column values with NaN i.e, for Units columns here
# Replace NaNs with the median of the column where it is located
dataFrame.fillna(dataFrame['Units'].median(), inplace = True)
print"\nUpdated Dataframe after filling NaN values with median...\n",dataFrame 出力
これにより、次の出力が生成されます-
DataFrame ... Car Units 0 Lexus 100.0 1 BMW 150.0 2 Audi NaN 3 Bentley 80.0 4 Mustang NaN 5 Tesla NaN Updated Dataframe after filling NaN values with median... Car Units 0 Lexus 100.0 1 BMW 150.0 2 Audi 100.0 3 Bentley 80.0 4 Mustang 100.0 5 Tesla 100.0
-
PythonPandas-DataFrame内のすべてのNaN要素を0に置き換えます
NaN値を置き換えるには、fillna()メソッドを使用します。以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") fillna()メソッドを使用してNaN値を0に置き換えます- dataFrame.fillna(0)
-
PythonPandas-補間法を使用してNaN値を入力します
Interpolate()メソッドを使用して、NaN値を入力します。以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") NaN値をinterpolate()-で埋めます dataFrame.interpolate() 例 以下はコードです- import pandas as pd # Load dat