Python-PandasDataFrameを右外部結合とマージ
Pandas DataFrameをマージするには、 merge()を使用します 働き。 「方法」で設定することにより、両方のデータフレームに右外部結合が実装されます。 ” merge()関数のパラメータ、つまり-
how = “right”
まず、エイリアスを使用してpandasライブラリをインポートしましょう-
import pandas as pd
マージする2つのデータフレームを作成します-
# Create DataFrame1 dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90] } ) # Create DataFrame2 dataFrame2 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000] } )
DataFrameを共通の列Carとマージし、「how」パラメーターの「right」は右外部結合を実装します-
mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="right")
例
以下はコードです-
import pandas as pd # Create DataFrame1 dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90] } ) print"DataFrame1 ...\n",dataFrame1 # Create DataFrame2 dataFrame2 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000] } ) print"\nDataFrame2 ...\n",dataFrame2 # merge DataFrames with common column Car and "right" in "how" parameter implements Right Outer Join mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="right") print"\nMerged dataframe with right outer join...\n", mergedRes
出力
これにより、次の出力が生成されます-
DataFrame1 ... Car Units 0 BMW 100 1 Lexus 150 2 Audi 110 3 Mustang 80 4 Bentley 110 5 Jaguar 90 DataFrame2 ... Car Reg_Price 0 BMW 7000 1 Lexus 1500 2 Tesla 5000 3 Mustang 8000 4 Mercedes 9000 5 Jaguar 6000 Merged dataframe with right outer join... Car Units Reg_Price 0 BMW 100.0 7000 1 Lexus 150.0 1500 2 Mustang 80.0 8000 3 Jaguar 90.0 6000 4 Tesla NaN 5000 5 Mercedes NaN 9000
-
PythonPandas-DataFrame内のすべてのNaN要素を0に置き換えます
NaN値を置き換えるには、fillna()メソッドを使用します。以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") fillna()メソッドを使用してNaN値を0に置き換えます- dataFrame.fillna(0)
-
Python-PandasDataFrameのサブセットを選択する方法
以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- 最初に、CSVファイルからPandasDataFrameにデータをロードします- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") サブセットを選択するには、角かっこを使用します。括弧内の列に言及し、データセット全体から単一の列をフェッチします- dataFrame['Car'] 例 以下はコードです- import pandas as pd # Load data fr