Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python –DataFrameから重複していない値のみを表示します


重複していない値のみを表示する方法を説明します。最初に、重複する値を持つDataFrameを作成します-

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
   }
)

上記では、2つの列を作成しました。重複していない値のみを表示するには、duplicate()メソッドと論理否定を使用します。これにより、重複していない値がフェッチされます-

dataFrame[~dataFrame.duplicated('Student')]

以下は完全なコードです-

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# displaying non-duplicates
res = dataFrame[~dataFrame.duplicated('Student')]
print"\nDataFrame after removing duplicates ...\n",res

出力

これにより、次の出力が生成されます-

DataFrame ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Pass       Ted
3    Fail     Robin
4    Pass  Scarlett
5    Pass       Kat
6    Pass       Ted

DataFrame after removing duplicates ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Pass       Ted
4    Pass  Scarlett
5    Pass       Kat

  1. Python Pandas –null以外の値を転送します

    「方法」を使用します ” fillnaのパラメータ () 方法。フォワードフィルには、値「 ffill」を使用します ’を以下に示すように- fillna(method='ffill') 以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\S

  2. Python Pandas –null以外の値を逆方向に伝播する

    「方法」を使用します ” fillnaのパラメータ () 方法。後方塗りつぶしには、値「bfill」を使用します 以下に示すように- fillna(method='bfill') 以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesD