Python Pandas –両方のDataFrameからデカルト積をマージして作成します
Pandas DataFrameをマージするには、 merge()を使用します 働き。デカルト積は、「方法」で設定することにより、両方のDataFrameに実装されます。 ” merge()関数のパラメータ、つまり-
how = “cross”
まず、エイリアスを使用してpandasライブラリをインポートしましょう-
import pandas as pd
DataFrame1を作成する-
dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 120] } )>
DataFrame2を作成する
dataFrame2 = pd.DataFrame( { "Car": ['BMW', 'Tesla', 'Jaguar'],"Reg_Price": [7000, 8000, 9000] } )
次に、DataFrameを「how」パラメータの「cross」とマージします。つまり、デカルト積-
mergedRes = pd.merge(dataFrame1, dataFrame2, how ="cross")
例
以下はコードです
import pandas as pd # Create DataFrame1 dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 120] } ) print("DataFrame1 ...\n",dataFrame1) # Create DataFrame2 dataFrame2 = pd.DataFrame( { "Car": ['BMW', 'Tesla', 'Jaguar'],"Reg_Price": [7000, 8000, 9000] } ) print("\nDataFrame2 ...\n",dataFrame2) # merge DataFrames with "cross" in "how" parameter i.e Cartesian Product mergedRes = pd.merge(dataFrame1, dataFrame2, how ="cross") print("\nMerged dataframe with cartesian product...\n", mergedRes)
出力
これにより、次の出力が生成されます-
DataFrame1 ... Car Units 0 BMW 100 1 Mustang 150 2 Bentley 110 3 Jaguar 120 DataFrame2 ... Car Reg_Price 0 BMW 7000 1 Tesla 8000 2 Jaguar 9000 Merged dataframe with cartesian product... Car Units Car_y Reg_Price 0 BMW 100 BMW 7000 1 BMW 100 Tesla 8000 2 BMW 180 Jaguar 9000 3 Mustang 150 BMW 7000 4 Mustang 150 Tesla 8000 5 Mustang 150 Jaguar 9000 6 Bentley 110 BMW 7000 7 Bentley 110 Tesla 8000 8 Bentley 110 Jaguar 9000 9 Jaguar 120 BMW 7000 10 Jaguar 120 Tesla 8000 11 Jaguar 120 Jaguar 9000
-
PythonPandas-元のインデックスと名前の両方でシリーズを作成します
元のインデックスと名前の両方でシリーズを作成するには、 index.to_series()を使用します パンダのメソッド。まず、必要なライブラリをインポートします- import pandas as pd パンダインデックスの作成: index = pd.Index(['Electronics','Accessories','Decor', 'Books', 'Toys'],name ='Products') インデックスをシリーズに変換- print("\nIndex to seri
-
Python Pandas –サブセットを作成し、重複する値から最後のエントリのみを表示します
サブセットを作成し、重複する値から最後のエントリのみを表示するには、「キープ」を使用します 」パラメータと「最後」 drop_duplicates()メソッドの「」値。 drop_duplicates()メソッドは重複を削除しました。 まず、3列のDataFrameを作成しましょう- dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'],