Pythonの正規表現を使用して、文字列内のすべての数値を検索します
テキストから数字のみを抽出することは、Pythonデータ分析で非常に一般的な要件です。これは、Python正規表現ライブラリを使用して簡単に実行できます。このライブラリは、サブストリングとして抽出できる数字のパターンを定義するのに役立ちます。
例
以下の例では、reモジュールの関数findall()を使用しています。これらの関数のパラメーターは、抽出するパターンと抽出する文字列です。以下の例では、小数点や負の符号ではなく、数字のみが取得されることに注意してください。
import re str=input("Enter a String with numbers: \n") #Create a list to hold the numbers num_list = re.findall(r'\d+', str) print(num_list)を保持するリストを作成します
出力
上記のコードを実行すると、次の結果が得られます-
Enter a String with numbers: Go to 13.8 miles and then -4.112 miles. ['13', '8', '4', '112']
小数点と記号の取得
検索パターンを拡張して、検索結果にも小数点と負または正の符号を含めることができます。
例
import re str=input("Enter a String with numbers: \n") #Create a list to hold the numbers num_list=re.findall(r'[-+]?[.]?[\d]+',str) print(num_list)
出力
上記のコードを実行すると、次の結果が得られます-
Enter a String with numbers: Go to 13.8 miles and then -4.112 miles. ['13', '.8', '-4', '.112']
-
Pythonの正規表現とは何ですか?
簡単に言うと、正規表現は、主に文字列またはファイル内のパターンを検索して置換するために使用される文字のシーケンスです。これらは、python、perl、R、Javaなどのほとんどのプログラミング言語でサポートされています。 正規表現は、コード、ログファイル、スプレッドシート、さらにはドキュメントなどのテキストから情報を抽出する場合に非常に役立ちます。正規表現の実際の使用法について詳しく説明します。 正規表現を使用するときに最初に知っておくべきことは、すべてが基本的に文字であり、特定の文字シーケンス(文字列とも呼ばれる)に一致するパターンを作成することです。ほとんどのパターンは通常のASCI
-
文字列が英数字かどうかを確認するPython正規表現とは何ですか?
モジュールの正規表現または正規表現を使用して文字列が英数字のみで構成されているかどうかを確認するには、正規表現 ^ [a-zA-Z0-9] + $を使用してre.match(regex、string)を呼び出すことができます。 たとえば、 >>> bool(re.match('^[a-zA-Z0-9]+$', '789def')) True >>> bool(re.match('^[a-zA-Z0-9]+$', '789#%$def')) False re.matchはオブジェクトを返しま