Pandas DataFrameの特定のタイムスタンプを比較する– Python
特定のタイムスタンプを比較するには、角括弧内のインデックス番号を使用します。まず、必要なライブラリをインポートします-
import pandas as pd
3列のDataFrameを作成します。タイムスタンプ付きの2つの日付列があります-
dataFrame = pd.DataFrame(
{
"Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW"],
"Date_of_Purchase": [
pd.Timestamp("2021-06-10"),
pd.Timestamp("2021-07-11"),
pd.Timestamp("2021-06-25"),
pd.Timestamp("2021-06-29"),
pd.Timestamp("2021-03-20"),
],
"Date_of_Service": [
pd.Timestamp("2021-11-05"),
pd.Timestamp("2021-12-03"),
pd.Timestamp("2021-10-30"),
pd.Timestamp("2021-11-29"),
pd.Timestamp("2021-08-20"),
]
})
特定のタイムスタンプを検索します。たとえば、1〜3行-
timestamp1_diff = abs(dataFrame['Date_of_Purchase'][0]-dataFrame['Date_of_Service'][0]) timestamp2_diff = abs(dataFrame['Date_of_Purchase'][1]-dataFrame['Date_of_Service'][1]) timestamp3_diff = abs(dataFrame['Date_of_Purchase'][2]-dataFrame['Date_of_Service'][2])
例
以下はコードです-
import pandas as pd
# create a dataframe with 3 columns
dataFrame = pd.DataFrame(
{
"Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW"],
"Date_of_Purchase": [
pd.Timestamp("2021-06-10"),
pd.Timestamp("2021-07-11"),
pd.Timestamp("2021-06-25"),
pd.Timestamp("2021-06-29"),
pd.Timestamp("2021-03-20"),
],
"Date_of_Service": [
pd.Timestamp("2021-11-05"),
pd.Timestamp("2021-12-03"),
pd.Timestamp("2021-10-30"),
pd.Timestamp("2021-11-29"),
pd.Timestamp("2021-08-20"),
]
})
print"DataFrame...\n", dataFrame
# compare specific timestamps
timestamp1_diff = abs(dataFrame['Date_of_Purchase'][0]-dataFrame['Date_of_Service'][0])
timestamp2_diff = abs(dataFrame['Date_of_Purchase'][1]-dataFrame['Date_of_Service'][1])
timestamp3_diff = abs(dataFrame['Date_of_Purchase'][2]-dataFrame['Date_of_Service'][2])
print"\nDifference between Car 1 Date of Purchase and Service \n",timestamp1_diff
print"\nDifference between Car 2 Date of Purchase and Service \n",timestamp2_diff
print"\nDifference between Car 3 Date of Purchase and Service \n",timestamp3_diff 出力
これにより、次の出力が生成されます-
DataFrame... Car Date_of_Purchase Date_of_Service 0 Audi 2021-06-10 2021-11-05 1 Lexus 2021-07-11 2021-12-03 2 Tesla 2021-06-25 2021-10-30 3 Mercedes 2021-06-29 2021-11-29 4 BMW 2021-03-20 2021-08-20 Difference between Car 1 Date of Purchase and Service 148 days 00:00:00 Difference between Car 2 Date of Purchase and Service 145 days 00:00:00 Difference between Car 3 Date of Purchase and Service 127 days 00:00:00
-
Python-PandasDataFrameの散布図を描画します
散布図は、データの視覚化手法です。 plot.scatter()を使用して、散布図をプロットします。まず、必要なライブラリをインポートしましょう- チームレコードにデータがあります。 PandasDataFrameに設定します- data = [["Australia", 2500],["Bangladesh", 1000],["England", 2000],["India", 3000],["Srilanka", 1500]] dataFrame = pd.DataFrame(data,
-
Python Pandas – notnull()を使用してNull値を確認します
notnull()メソッドはブール値を返します。つまり、DataFrameにnull値がある場合は、Falseが返され、そうでない場合はTrueが返されます。 以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- まずCSVファイルを読みましょう- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") null以外の値をチェックする- res = dataFrame.notnull() これで、DataFrameを表示すると、notnull()がブ