Pandas DataFrameの特定のタイムスタンプを比較する– Python
特定のタイムスタンプを比較するには、角括弧内のインデックス番号を使用します。まず、必要なライブラリをインポートします-
import pandas as pd
3列のDataFrameを作成します。タイムスタンプ付きの2つの日付列があります-
dataFrame = pd.DataFrame( { "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW"], "Date_of_Purchase": [ pd.Timestamp("2021-06-10"), pd.Timestamp("2021-07-11"), pd.Timestamp("2021-06-25"), pd.Timestamp("2021-06-29"), pd.Timestamp("2021-03-20"), ], "Date_of_Service": [ pd.Timestamp("2021-11-05"), pd.Timestamp("2021-12-03"), pd.Timestamp("2021-10-30"), pd.Timestamp("2021-11-29"), pd.Timestamp("2021-08-20"), ] })
特定のタイムスタンプを検索します。たとえば、1〜3行-
timestamp1_diff = abs(dataFrame['Date_of_Purchase'][0]-dataFrame['Date_of_Service'][0]) timestamp2_diff = abs(dataFrame['Date_of_Purchase'][1]-dataFrame['Date_of_Service'][1]) timestamp3_diff = abs(dataFrame['Date_of_Purchase'][2]-dataFrame['Date_of_Service'][2])
例
以下はコードです-
import pandas as pd # create a dataframe with 3 columns dataFrame = pd.DataFrame( { "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW"], "Date_of_Purchase": [ pd.Timestamp("2021-06-10"), pd.Timestamp("2021-07-11"), pd.Timestamp("2021-06-25"), pd.Timestamp("2021-06-29"), pd.Timestamp("2021-03-20"), ], "Date_of_Service": [ pd.Timestamp("2021-11-05"), pd.Timestamp("2021-12-03"), pd.Timestamp("2021-10-30"), pd.Timestamp("2021-11-29"), pd.Timestamp("2021-08-20"), ] }) print"DataFrame...\n", dataFrame # compare specific timestamps timestamp1_diff = abs(dataFrame['Date_of_Purchase'][0]-dataFrame['Date_of_Service'][0]) timestamp2_diff = abs(dataFrame['Date_of_Purchase'][1]-dataFrame['Date_of_Service'][1]) timestamp3_diff = abs(dataFrame['Date_of_Purchase'][2]-dataFrame['Date_of_Service'][2]) print"\nDifference between Car 1 Date of Purchase and Service \n",timestamp1_diff print"\nDifference between Car 2 Date of Purchase and Service \n",timestamp2_diff print"\nDifference between Car 3 Date of Purchase and Service \n",timestamp3_diff
出力
これにより、次の出力が生成されます-
DataFrame... Car Date_of_Purchase Date_of_Service 0 Audi 2021-06-10 2021-11-05 1 Lexus 2021-07-11 2021-12-03 2 Tesla 2021-06-25 2021-10-30 3 Mercedes 2021-06-29 2021-11-29 4 BMW 2021-03-20 2021-08-20 Difference between Car 1 Date of Purchase and Service 148 days 00:00:00 Difference between Car 2 Date of Purchase and Service 145 days 00:00:00 Difference between Car 3 Date of Purchase and Service 127 days 00:00:00
-
Python-PandasDataFrameの散布図を描画します
散布図は、データの視覚化手法です。 plot.scatter()を使用して、散布図をプロットします。まず、必要なライブラリをインポートしましょう- チームレコードにデータがあります。 PandasDataFrameに設定します- data = [["Australia", 2500],["Bangladesh", 1000],["England", 2000],["India", 3000],["Srilanka", 1500]] dataFrame = pd.DataFrame(data,
-
Python Pandas – notnull()を使用してNull値を確認します
notnull()メソッドはブール値を返します。つまり、DataFrameにnull値がある場合は、Falseが返され、そうでない場合はTrueが返されます。 以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- まずCSVファイルを読みましょう- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") null以外の値をチェックする- res = dataFrame.notnull() これで、DataFrameを表示すると、notnull()がブ