Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonの正規表現パターン


制御文字(+?。* ^ $()[] {} | \)を除いて、すべての文字は一致します。制御文字の前に円記号を付けると、制御文字をエスケープできます。

次の表に、Pythonで使用できる正規表現の構文を示します-

Sr.No。 パターンと説明
1 ^
行頭に一致します。
2 $
行末に一致します。
3
改行以外の任意の1文字に一致します。 mオプションを使用すると、改行にも一致させることができます。
4 [...]
角かっこ内の任意の1文字に一致します。
5 [^ ...]
角かっこで囲まれていない任意の1文字に一致します
6 re *
先行する式の0回以上の出現に一致します。
7 re +
前の式の1つ以上のオカレンスに一致します。
8 re?
前の式の0または1回の出現に一致します。
9 re {n}
前の式のn回の出現に正確に一致します。
10 re {n、}
前の式のn回以上の出現に一致します。
11 re {n、m}
先行する式の少なくともn回および最大m回の出現に一致します。
12 a | b
aまたはbのいずれかに一致します。
13 (再)
正規表現をグループ化し、一致したテキストを記憶します。
14 (?imx)
正規表現内のi、m、またはxオプションを一時的にオンに切り替えます。括弧内の場合、その領域のみが影響を受けます。
15 (?-imx)
正規表現内のi、m、またはxオプションを一時的にオフに切り替えます。括弧内の場合、その領域のみが影響を受けます。
16 (?:re)
一致したテキストを記憶せずに正規表現をグループ化します。
17 (?imx:re)
括弧内のi、m、またはxオプションを一時的にオンに切り替えます。
18 (?-imx:re)
括弧内のi、m、またはxオプションを一時的にオフに切り替えます。
19 (?#...)
コメント。
20 (?=re)
パターンを使用して位置を指定します。範囲がありません。
21 (?! re)
パターン否定を使用して位置を指定します。範囲がありません。
22 (?> re)
バックトラックなしで独立したパターンに一致します。
23 \ w
単語の文字に一致します。
24 \ W
単語以外の文字に一致します。
25 \ s
空白に一致します。 [\ t \ n \ r\f]と同等です。
26 \ S
非空白に一致します。
27 \ d
数字と一致します。 [0-9]と同等です。
28 \ D
非数字に一致します。
29 \ A
文字列の先頭に一致します。
30 \ Z
文字列の終わりに一致します。改行が存在する場合は、改行の直前と一致します。
31 \ z
文字列の終わりに一致します。
32 \ G
最後の試合が終了した試合ポイント。
33 \ b
角かっこで囲まれていない場合、単語の境界に一致します。角かっこ内の場合、バックスペース(0x08)に一致します。
34 \ B
単語以外の境界に一致します。
35 \ n、\tなど
改行、キャリッジリターン、タブなどに一致します。
36 \ 1 ... \ 9
n番目のグループ化された部分式に一致します。
37 \ 10
すでに一致している場合は、n番目のグループ化された部分式に一致します。それ以外の場合は、文字コードの8進表現を指します。

  1. Pythonで正規表現のグループ化はどのように機能しますか?

    グループ化 正規表現の一部を括弧で囲んでグループ化します。これは、単一の文字ではなく、グループ全体に演算子を適用する方法です。 グループのキャプチャ 括弧は部分式をグループ化するだけでなく、後方参照も作成します。正規表現のグループ化された部分と一致する文字列の部分は、後方参照に格納されます。後方参照の助けを借りて、正規表現の一部を再利用します。 実際のアプリケーションでは、2つ以上の選択肢のいずれかに一致する正規表現が必要になることがよくあります。また、数量詞を複数の式に適用したい場合もあります。これらはすべて、括弧でグループ化することで実現できます。そして、垂直バー(|)と交互に使用し

  2. Pythonの正規表現とは何ですか?

    簡単に言うと、正規表現は、主に文字列またはファイル内のパターンを検索して置換するために使用される文字のシーケンスです。これらは、python、perl、R、Javaなどのほとんどのプログラミング言語でサポートされています。 正規表現は、コード、ログファイル、スプレッドシート、さらにはドキュメントなどのテキストから情報を抽出する場合に非常に役立ちます。正規表現の実際の使用法について詳しく説明します。 正規表現を使用するときに最初に知っておくべきことは、すべてが基本的に文字であり、特定の文字シーケンス(文字列とも呼ばれる)に一致するパターンを作成することです。ほとんどのパターンは通常のASCI