Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python Pandas – concat()を使用して2つのDataFrame間の共通行をフェッチします


2つのDataFrame間で共通の行をフェッチするには、 concat()を使用します 働き。 2つの列を持つDataFrame1を作成しましょう-

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Reg_Price": [1000, 1500, 1100, 800, 1100, 900] }
)

2つの列を持つDataFrame2を作成します-

dataFrame2 = pd.DataFrame(
   {
"Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
"Reg_Price": [1200, 1500, 1000, 800, 1100, 1000]
}
)

concat()-

を使用して2つのDataFrame間で共通の行を検索する
dfRes = pd.concat([dataFrame1, dataFrame2])

インデックスのリセット-

dfRes = dfRes.reset_index(drop=True)

グループ化列-

dfGroup = dfRes.groupby(list(dfRes.columns))

カウントを計算するために各行の長さを取得します。 countが1より大きい場合、それは一般的な行を意味します-

res = [k[0] for k in dfGroup.groups.values() if len(k) > 1]

以下はコードです-

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
"Reg_Price": [1000, 1500, 1100, 800, 1100, 900] }
)

print"DataFrame1 ...\n",dataFrame1

# Create DataFrame2
dataFrame2 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
"Reg_Price": [1200, 1500, 1000, 800, 1100, 1000]
}
)

print"\nDataFrame2 ...\n",dataFrame2

# finding common rows between two DataFrames
dfRes = pd.concat([dataFrame1, dataFrame2])

# reset index
dfRes = dfRes.reset_index(drop=True)

# groupby columns
dfGroup = dfRes.groupby(list(dfRes.columns))

# length of each row to calculate the count
# if count is greater than 1, that would mean common rows
res = [k[0] for k in dfGroup.groups.values() if len(k) > 1]

print"\nCommon rows...\n",dfRes.reindex(res)

出力

これにより、次の出力が生成されます-

DataFrame1 ...
       Car   Reg_Price
0      BMW        1000
1    Lexus        1500
2     Audi        1100
3    Tesla         800
4  Bentley        1100
5   Jaguar         900

DataFrame2 ...
       Car   Reg_Price
0      BMW        1200
1    Lexus        1500
2     Audi        1000
3    Tesla         800
4  Bentley        1100
5   Jaguar        1000

Common rows...
       Car   Reg_Price
3    Tesla         800
1    Lexus        1500
4  Bentley        1100

  1. Python Pandas-Seabornを使用して、群れを2つのカテゴリ変数でグループ化します

    SeabornのSwarmPlotは、重複しないポイントを持つカテゴリ散布図を描画するために使用されます。これにはseaborn.swarmplot()が使用されます。群れを2つのカテゴリ変数でグループ化するには、x、y、または色相を使用してswarmplot()でそれらの変数を設定します。 パラメータ。 次がCSVファイル形式のデータセットであるとしましょう:Cricketers2.csv まず、必要なライブラリをインポートします- import seaborn as sb import pandas as pd import matplotlib.pyplot as plt CSV

  2. 値が欠落しているPythonPandasの2つのDataFrameを比較する方法

    はじめに Pandasは、NumPy NaN(np.nan)オブジェクトを使用して、欠落している値を表します。このNumpyNaN値には、いくつかの興味深い数学的特性があります。たとえば、それ自体と同じではありません。ただし、Python Noneオブジェクトは、それ自体と比較するとTrueと評価されます。 その方法.. np.nanの動作を理解するために、いくつかの例を見てみましょう。 import pandas as pd import numpy as np # Python None Object compared against self. print(f"Outpu