Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python Pandas – merge()を使用して2つのDataFrame間の共通の行を検索します


merge()を使用して2つのDataFrame間で共通の行を見つけるには、パラメーター「 how 」を使用します 」を「内部」として 」はSQL内部結合のように機能し、これが私たちが達成したいことだからです。

2つの列を持つDataFrame1を作成しましょう-

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Reg_Price": [1000, 1500, 1100, 800, 1100, 900] }
)

2つの列を持つDataFrame2を作成します-

dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Reg_Price": [1200, 1500, 1000, 800, 1100, 1000]
   }
)

ここで、一般的な行を見つけましょう-

dataFrame1.merge(dataFrame2, how = 'inner' ,indicator=False)

以下はコードです-

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Reg_Price": [1000, 1500, 1100, 800, 1100, 900] }
)

print"DataFrame1 ...\n",dataFrame1

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Reg_Price": [1200, 1500, 1000, 800, 1100, 1000]
   }
)

print"\nDataFrame2 ...\n",dataFrame2

# finding common rows between two DataFrames
resData = dataFrame1.merge(dataFrame2, how = 'inner' ,indicator=False)
print"\nCommon rows between two DataFrames...\n",resData

出力

これにより、次の出力が生成されます-

DataFrame1 ...
       Car   Reg_Price
0      BMW       1000
1    Lexus       1500
2     Audi       1100
3    Tesla        800
4  Bentley       1100
5   Jaguar        900

DataFrame2 ...
       Car   Reg_Price
0      BMW        1200
1    Lexus        1500
2     Audi        1000
3    Tesla         800
4  Bentley        1100
5   Jaguar        1000

Common rows between two DataFrames...
       Car   Reg_Price
0    Lexus        1500
1    Tesla         800
2  Bentley        1100

  1. Python-PandasDataFrameの統計の要約を検索します

    DataFrameの統計の要約を見つけるには、describe()メソッドを使用します。最初に、エイリアスを使用して次のpandasライブラリをインポートしました import pandas as pd 以下はCSVファイルで、PandasDataFrameを作成しています- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") ここで、PandasDataFrameの統計の要約を取得します- dataFrame.describe() 例 以下は完全なコードです import pand

  2. Python Pandas-Seabornを使用して、群れを2つのカテゴリ変数でグループ化します

    SeabornのSwarmPlotは、重複しないポイントを持つカテゴリ散布図を描画するために使用されます。これにはseaborn.swarmplot()が使用されます。群れを2つのカテゴリ変数でグループ化するには、x、y、または色相を使用してswarmplot()でそれらの変数を設定します。 パラメータ。 次がCSVファイル形式のデータセットであるとしましょう:Cricketers2.csv まず、必要なライブラリをインポートします- import seaborn as sb import pandas as pd import matplotlib.pyplot as plt CSV