Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-PandasDataFrameを時間でフィルタリング


DataFrameを時間でフィルタリングするには、locを使用し、その中に条件を設定してレコードをフェッチします。まず、必要なライブラリをインポートします-

import pandas as pd

日付レコードを含むリストの辞書を作成する-

d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'],'Date_of_Purchase': ['2021-07-10', '2021-08-12', '2021-06-17', '2021-03-16', '2021-05-19', '2021-08-22']
   }

上記のリストの辞書からデータフレームを作成する-

dataFrame = pd.DataFrame(d)

ここで、特定の日付以降に購入した車を取得する必要があるとします。このために、loc −

を使用します
resDF = dataFrame.loc[dataFrame["Date_of_Purchase"] > "2021-07-15"]

以下は完全なコードです-

import pandas as pd

# dictionary of lists
d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'],'Date_of_Purchase': ['2021-07-10', '2021-08-12', '2021-06-17', '2021-03-16', '2021-05-19', '2021-08-22']
   }

# creating dataframe from the above dictionary of lists
dataFrame = pd.DataFrame(d)
print"DataFrame...\n",dataFrame

# fetch cars purchased after 15th July 2021
resDF = dataFrame.loc[dataFrame["Date_of_Purchase"] > "2021-07-15"]

# print filtered data frame
print"\nCars purchased after 15th July 2021: \n",resDF

出力

これにより、次の出力が生成されます-

DataFrame...
        Car   Date_of_Purchase
0       BMW         2021-07-10
1     Lexus         2021-08-12
2      Audi         2021-06-17
3  Mercedes         2021-03-16
4    Jaguar         2021-05-19
5   Bentley         2021-08-22

Cars purchased after 15th July 2021:
       Car   Date_of_Purchase
1    Lexus         2021-08-12
5  Bentley         2021-08-22

  1. Python Pandas –null以外の値を転送します

    「方法」を使用します ” fillnaのパラメータ () 方法。フォワードフィルには、値「 ffill」を使用します ’を以下に示すように- fillna(method='ffill') 以下が、いくつかのNaN値を使用してMicrosoftExcelで開いたCSVファイルであるとしましょう- まず、必要なライブラリをインポートします- import pandas as pd CSVファイルからPandasDataFrameにデータをロードする- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\S

  2. Python-PandasDataFrameの散布図を描画します

    散布図は、データの視覚化手法です。 plot.scatter()を使用して、散布図をプロットします。まず、必要なライブラリをインポートしましょう- チームレコードにデータがあります。 PandasDataFrameに設定します- data = [["Australia", 2500],["Bangladesh", 1000],["England", 2000],["India", 3000],["Srilanka", 1500]] dataFrame = pd.DataFrame(data,