Python
 Computer >> コンピューター >  >> プログラミング >> Python

PandasDataFrameを共通の列とマージします


2つのPandasDataFrameを共通の列とマージするには、 merge()を使用します 機能し、オンを設定します 列名としてのパラメータ。

まず、エイリアスを使用してpandasライブラリをインポートしましょう-

import pandas as pd

1番目の st を作成しましょう DataFrame-

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

次に、2番目の を作成します DataFrame-

dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

次に、2つのDataFrameを列列「Car」とマージします-

mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car')

以下は完全なコードです-

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

print"DataFrame1 ...\n",dataFrame1

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

print"\nDataFrame2 ...\n",dataFrame2

# merge DataFrames with common column Car
mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car')
print"\nMerged data frame with common column...\n", mergedRes

出力

これにより、次の出力が生成されます-

DataFrame1 ...
       Car   Units
0      BMW     100
1    Lexus     150
2     Audi     110
3  Mustang      80
4  Bentley     110
5   Jaguar      90

DataFrame2 ...
        Car   Reg_Price
0       BMW        7000
1     Lexus        1500
2      Audi        5000
3   Mustang        8000
4  Mercedes        9000
5    Jaguar        6000

Merged data frame with common column...
       Car   Units   Reg_Price
0      BMW     100        7000
1    Lexus     150        1500
2     Audi     110        5000
3  Mustang      80        8000
4   Jaguar      90        6000

  1. PandasDataFrameでアイテムセットの頻度をカウントする方法

    Series.value_counts()メソッドを使用して、アイテムセットの頻度をカウントします。まず、DataFrameを作成しましょう- # Create DataFrame dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'Audi', 'Mercedes', 'Porsche', 'Lamborghini', 'BMW'], 'Place&#

  2. PandasDataFrameでの処理時間

    この記事では、組み込みのパンダライブラリを使用してさまざまなタイムスタンプを生成および処理する方法について学習します。また、numpyモジュールを使用して、タイムスタンプの生成に必要なデータベースを生成および変更しています。 推奨されるIDE:Jupyterノートブック このチュートリアルを開始する前に、pandasとnumpyライブラリをインストールする必要があります。このjupyterノートブックは、コードをテストして実行するのに最適な場所です。パンダをインストールするには、次のコマンドを実行する必要があります。 >>> pip install pandas このコマ