Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pandas DataFrameの特定のタイムスタンプを比較する– Python


特定のタイムスタンプを比較するには、角括弧内のインデックス番号を使用します。まず、必要なライブラリをインポートします-

import pandas as pd

3列のDataFrameを作成します。タイムスタンプ付きの2つの日付列があります-

dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW"],

      "Date_of_Purchase": [
         pd.Timestamp("2021-06-10"),
         pd.Timestamp("2021-07-11"),
         pd.Timestamp("2021-06-25"),
         pd.Timestamp("2021-06-29"),
         pd.Timestamp("2021-03-20"),
      ],
      "Date_of_Service": [
          pd.Timestamp("2021-11-05"),
          pd.Timestamp("2021-12-03"),
          pd.Timestamp("2021-10-30"),
          pd.Timestamp("2021-11-29"),
          pd.Timestamp("2021-08-20"),
       ]
})

特定のタイムスタンプを検索します。たとえば、1〜3行-

timestamp1_diff = abs(dataFrame['Date_of_Purchase'][0]-dataFrame['Date_of_Service'][0])
timestamp2_diff = abs(dataFrame['Date_of_Purchase'][1]-dataFrame['Date_of_Service'][1])
timestamp3_diff = abs(dataFrame['Date_of_Purchase'][2]-dataFrame['Date_of_Service'][2])

以下はコードです-

import pandas as pd

# create a dataframe with 3 columns
dataFrame = pd.DataFrame(
   {
      "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW"],

      "Date_of_Purchase": [
         pd.Timestamp("2021-06-10"),
         pd.Timestamp("2021-07-11"),
         pd.Timestamp("2021-06-25"),
         pd.Timestamp("2021-06-29"),
         pd.Timestamp("2021-03-20"),
      ],
      "Date_of_Service": [
         pd.Timestamp("2021-11-05"),
         pd.Timestamp("2021-12-03"),
         pd.Timestamp("2021-10-30"),
         pd.Timestamp("2021-11-29"),
         pd.Timestamp("2021-08-20"),
      ]
})

print"DataFrame...\n", dataFrame

# compare specific timestamps
timestamp1_diff = abs(dataFrame['Date_of_Purchase'][0]-dataFrame['Date_of_Service'][0])
timestamp2_diff = abs(dataFrame['Date_of_Purchase'][1]-dataFrame['Date_of_Service'][1])
timestamp3_diff = abs(dataFrame['Date_of_Purchase'][2]-dataFrame['Date_of_Service'][2])

print"\nDifference between Car 1 Date of Purchase and Service \n",timestamp1_diff
print"\nDifference between Car 2 Date of Purchase and Service \n",timestamp2_diff
print"\nDifference between Car 3 Date of Purchase and Service \n",timestamp3_diff

出力

これにより、次の出力が生成されます-

DataFrame...
        Car   Date_of_Purchase   Date_of_Service
0      Audi        2021-06-10        2021-11-05
1     Lexus        2021-07-11        2021-12-03
2     Tesla        2021-06-25        2021-10-30
3  Mercedes        2021-06-29        2021-11-29
4       BMW        2021-03-20        2021-08-20

Difference between Car 1 Date of Purchase and Service
148 days 00:00:00

Difference between Car 2 Date of Purchase and Service
145 days 00:00:00

Difference between Car 3 Date of Purchase and Service
127 days 00:00:00

  1. Python-PandasDataFrameの散布図を描画します

    散布図は、データの視覚化手法です。 plot.scatter()を使用して、散布図をプロットします。まず、必要なライブラリをインポートしましょう- チームレコードにデータがあります。 PandasDataFrameに設定します- data = [["Australia", 2500],["Bangladesh", 1000],["England", 2000],["India", 3000],["Srilanka", 1500]] dataFrame = pd.DataFrame(data,

  2. Python Pandas – notnull()を使用してNull値を確認します

    notnull()メソッドはブール値を返します。つまり、DataFrameにnull値がある場合は、Falseが返され、そうでない場合はTrueが返されます。 以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- まずCSVファイルを読みましょう- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") null以外の値をチェックする- res = dataFrame.notnull() これで、DataFrameを表示すると、notnull()がブ