Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python Pandas –両方のDataFrameからデカルト積をマージして作成します


Pandas DataFrameをマージするには、 merge()を使用します 働き。デカルト積は、「方法」で設定することにより、両方のDataFrameに実装されます。 ” merge()関数のパラメータ、つまり-

how = “cross”

まず、エイリアスを使用してpandasライブラリをインポートしましょう-

import pandas as pd

DataFrame1を作成する-

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 120]
   }
)
>

DataFrame2を作成する

dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Tesla', 'Jaguar'],"Reg_Price": [7000, 8000, 9000]

   }
)

次に、DataFrameを「how」パラメータの「cross」とマージします。つまり、デカルト積-

mergedRes = pd.merge(dataFrame1, dataFrame2, how ="cross")

以下はコードです

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 120]
   }
)

print("DataFrame1 ...\n",dataFrame1)

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Tesla', 'Jaguar'],"Reg_Price": [7000, 8000, 9000]

   }
)

print("\nDataFrame2 ...\n",dataFrame2)

# merge DataFrames with "cross" in "how" parameter i.e Cartesian Product
mergedRes = pd.merge(dataFrame1, dataFrame2, how ="cross")
print("\nMerged dataframe with cartesian product...\n", mergedRes)

出力

これにより、次の出力が生成されます-

DataFrame1 ...
       Car   Units
0      BMW     100
1  Mustang     150
2  Bentley     110
3   Jaguar     120
DataFrame2 ...
      Car   Reg_Price
0     BMW        7000
1   Tesla        8000
2  Jaguar        9000

Merged dataframe with cartesian product...
       Car   Units   Car_y   Reg_Price
0      BMW     100     BMW        7000
1      BMW     100   Tesla        8000
2      BMW     180  Jaguar        9000
3  Mustang     150     BMW        7000
4  Mustang     150   Tesla        8000
5  Mustang     150  Jaguar        9000
6  Bentley     110     BMW        7000
7  Bentley     110   Tesla        8000
8  Bentley     110  Jaguar        9000
9   Jaguar     120     BMW        7000
10  Jaguar     120   Tesla        8000
11  Jaguar     120  Jaguar        9000

  1. PythonPandas-元のインデックスと名前の両方でシリーズを作成します

    元のインデックスと名前の両方でシリーズを作成するには、 index.to_series()を使用します パンダのメソッド。まず、必要なライブラリをインポートします- import pandas as pd パンダインデックスの作成: index = pd.Index(['Electronics','Accessories','Decor', 'Books', 'Toys'],name ='Products') インデックスをシリーズに変換- print("\nIndex to seri

  2. Python Pandas –サブセットを作成し、重複する値から最後のエントリのみを表示します

    サブセットを作成し、重複する値から最後のエントリのみを表示するには、「キープ」を使用します 」パラメータと「最後」 drop_duplicates()メソッドの「」値。 drop_duplicates()メソッドは重複を削除しました。 まず、3列のDataFrameを作成しましょう- dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'],&#