Python
 Computer >> コンピューター >  >> プログラミング >> Python

正規表現でパンダの行をフィルタリングするにはどうすればよいですか?


正規表現(regex)は、検索パターンを定義する一連の文字です。パンダの行を正規表現でフィルタリングするには、 str.match()を使用できます。 メソッド。

ステップ

  • 2次元、サイズ変更可能、潜在的に異種の表形式データ、 dfを作成します 。
  • 入力DataFrame、 dfを印刷します 。
  • 変数を初期化する正規表現 式のために。文字列値を正規表現として指定します。たとえば、文字列'J。*' 文字「J」で始まるすべてのエントリをフィルタリングします。
  • df.column_name.str.match(regex)を使用します 指定された正規表現で指定された列名のすべてのエントリをフィルタリングします。

import pandas as pd

df = pd.DataFrame(
   dict(
      name=['John', 'Jacob', 'Tom', 'Tim', 'Ally'],
      marks=[89, 23, 100, 56, 90],
      subjects=["Math", "Physics", "Chemistry", "Biology", "English"]
   )
)

print "Input DataFrame is:\n", df

regex = 'J.*'
print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)]

regex = 'A.*'
print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)]

出力

Input DataFrame is:

     name    marks   subjects
0    John     89        Math
1   Jacob     23     Physics
2     Tom    100   Chemistry
3     Tim     56     Biology
4    Ally     90     English

After applying J.* DataFrame is:

    name   marks   subjects
0   John     89        Math
1  Jacob     23     Physics

After applying A.* DataFrame is:

    name   marks   subjects
4   Ally     90     English

  1. 日付パンダデータフレームごとに集計してプロットする方法は?

    日付パンダデータフレームごとに集計してプロットするには、次の手順を実行できます- ステップ 図のサイズを設定し、サブプロット間およびサブプロットの周囲のパディングを調整します。 データフレームdfを作成します 、2次元、サイズ変更可能、潜在的に異種の表形式データ。 日付パンダデータフレームごとに集計された値を取得します。 dfをプロットします (ステップ3) kind =barを使用 。 図を表示するには、 show()を使用します メソッド。 例 import numpy as np import pandas as pd from matplotlib

  2. Python-PandasDataFrameからnull行を削除する方法

    Pandas DataFrameのnull行を削除するには、dropna()メソッドを使用します。以下が、いくつかのNaN、つまりnull値を含むCSVファイルであるとしましょう- read_csv()を使用してCSVファイルを読み取ってみましょう。 CSVはデスクトップにあります- dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv") dropna()-を使用してnull値を削除します dataFrame = dataFrame.dropna() 例 以下は完全なコードです-