Python-重複することなくPandasDataFrameを連結します
DataFrameを連結するには、concat()メソッドを使用しますが、重複を無視するには、drop_duplicates()メソッドを使用します。
必要なライブラリをインポートする-
import pandas as pd
連結するDataFrameを作成する-
# Create DataFrame1 dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Jaguar', 'Audi', 'Mustang'],"Units": [100, 150, 110, 80] } ) # Create DataFrame2 dataFrame2 = pd.DataFrame( { "Car": ['Tesla', 'Jaguar', 'Mercedes', 'Mustang'],"Units": [120, 150, 180, 80] } )
それでは、DataFrameを連結して、重複を削除しましょう-
concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()
例
以下はコードです-
import pandas as pd # Create DataFrame1 dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Jaguar', 'Audi', 'Mustang'],"Units": [100, 150, 110, 80] } ) print"DataFrame1 ...\n",dataFrame1 # Create DataFrame2 dataFrame2 = pd.DataFrame( { "Car": ['Tesla', 'Jaguar', 'Mercedes', 'Mustang'],"Units": [120, 150, 180, 80] } ) print"\nDataFrame2 ...\n",dataFrame2 # concat DataFrames and remove duplicates concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates() print"\nConcatenating DataFrame without duplicates...\n", concatRes
出力
これにより、次の出力が生成されます-
DataFrame1 ... Car Units 0 BMW 100 1 Jaguar 150 2 Audi 110 3 Mustang 80 DataFrame2 ... Car Units 0 Tesla 120 1 Jaguar 150 2 Mercedes 180 3 Mustang 80 Concatenating DataFrame without duplicates... Car Units 0 BMW 100 1 Jaguar 150 2 Audi 110 3 Mustang 80 0 Tesla 120 2 Mercedes 180
-
PythonPandas-NaN値なしでインデックスを返す
NaN値なしでインデックスを返すには、 index.dropna()を使用します パンダのメソッド。まず、必要なライブラリをインポートします- import pandas as pd import numpy as np いくつかのNaN値も使用してPandasインデックスを作成する- index = pd.Index([50, 10, 70, np.nan, 90, 50, np.nan, np.nan, 30]) パンダのインデックスを表示する- print("Pandas Index...\n",index) NaN値のみを削除します- print("
-
Python-ヘッダーなしのパンダでcsvファイルを読み取りますか?
ヘッダーなしでCSVファイルを読み取るには、ヘッダーパラメータを使用して「なし」に設定します 」read_csv() メソッド。 以下は、MicrosoftExcelで開いたCSVファイルの内容であるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードします。これにより、ヘッダーも表示されます- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") ロード中に、ヘッダー