Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-PandasDataFrameを右外部結合とマージ


Pandas DataFrameをマージするには、 merge()を使用します 働き。 「方法」で設定することにより、両方のデータフレームに右外部結合が実装されます。 ” merge()関数のパラメータ、つまり-

how = “right”

まず、エイリアスを使用してpandasライブラリをインポートしましょう-

import pandas as pd

マージする2つのデータフレームを作成します-

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]
   }
)

DataFrameを共通の列Carとマージし、「how」パラメーターの「right」は右外部結合を実装します-

mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="right")

以下はコードです-

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

print"DataFrame1 ...\n",dataFrame1

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

print"\nDataFrame2 ...\n",dataFrame2

# merge DataFrames with common column Car and "right" in "how" parameter implements Right Outer Join
mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="right")
print"\nMerged dataframe with right outer join...\n", mergedRes

出力

これにより、次の出力が生成されます-

DataFrame1 ...
       Car   Units
0      BMW     100
1    Lexus     150
2     Audi     110
3  Mustang      80
4  Bentley     110
5   Jaguar      90

DataFrame2 ...
        Car   Reg_Price
0       BMW        7000
1     Lexus        1500
2     Tesla        5000
3   Mustang        8000
4  Mercedes        9000
5    Jaguar        6000

Merged dataframe with right outer join...
        Car   Units   Reg_Price
0       BMW   100.0        7000
1     Lexus   150.0        1500
2   Mustang    80.0        8000
3    Jaguar    90.0        6000
4     Tesla     NaN        5000
5  Mercedes     NaN        9000

  1. PythonPandas-DataFrame内のすべてのNaN要素を0に置き換えます

    NaN値を置き換えるには、fillna()メソッドを使用します。以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") fillna()メソッドを使用してNaN値を0に置き換えます- dataFrame.fillna(0)

  2. Python-PandasDataFrameのサブセットを選択する方法

    以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") サブセットを選択するには、角かっこを使用します。括弧内の列に言及し、データセット全体から単一の列をフェッチします- dataFrame['Car'] 例 以下はコードです- import pandas as pd # Load data fr