Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-重複することなくPandasDataFrameを連結します


DataFrameを連結するには、concat()メソッドを使用しますが、重複を無視するには、drop_duplicates()メソッドを使用します。

必要なライブラリをインポートする-

import pandas as pd

連結するDataFrameを作成する-

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Jaguar', 'Audi', 'Mustang'],"Units": [100, 150, 110, 80]
   }
)

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['Tesla', 'Jaguar', 'Mercedes', 'Mustang'],"Units": [120, 150, 180, 80]

   }
)

それでは、DataFrameを連結して、重複を削除しましょう-

concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()

以下はコードです-

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Jaguar', 'Audi', 'Mustang'],"Units": [100, 150, 110, 80]
   }
)

print"DataFrame1 ...\n",dataFrame1

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['Tesla', 'Jaguar', 'Mercedes', 'Mustang'],"Units": [120, 150, 180, 80]

   }
)

print"\nDataFrame2 ...\n",dataFrame2

# concat DataFrames and remove duplicates
concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()
print"\nConcatenating DataFrame without duplicates...\n", concatRes

出力

これにより、次の出力が生成されます-

DataFrame1 ...
       Car   Units
0      BMW     100
1   Jaguar     150
2     Audi     110
3  Mustang      80

DataFrame2 ...
        Car   Units
0     Tesla     120
1    Jaguar     150
2  Mercedes     180
3   Mustang      80

Concatenating DataFrame without duplicates...
        Car   Units
0       BMW     100
1    Jaguar     150
2      Audi     110
3   Mustang      80
0     Tesla     120
2  Mercedes     180

  1. PythonPandas-NaN値なしでインデックスを返す

    NaN値なしでインデックスを返すには、 index.dropna()を使用します パンダのメソッド。まず、必要なライブラリをインポートします- import pandas as pd import numpy as np いくつかのNaN値も使用してPandasインデックスを作成する- index = pd.Index([50, 10, 70, np.nan, 90, 50, np.nan, np.nan, 30]) パンダのインデックスを表示する- print("Pandas Index...\n",index) NaN値のみを削除します- print("

  2. Python-ヘッダーなしのパンダでcsvファイルを読み取りますか?

    ヘッダーなしでCSVファイルを読み取るには、ヘッダーパラメータを使用して「なし」に設定します 」read_csv() メソッド。 以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードします。これにより、ヘッダーも表示されます- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") ロード中に、ヘッダー