Python
 Computer >> コンピューター >  >> プログラミング >> Python

Webページのすべてのアンカータグを取得するPython正規表現を作成するにはどうすればよいですか?


次のコードは、指定された文字列内のすべてのタグを抽出します

import re
rex = re.compile(r'[\<\>]')
l = "this is text1 <a href='irawati.com' target='_blank'>hi</a> this is text2"
print rex.findall(l)
出力
['<', '>', '<', '>']

  1. 正規表現を使用してPythonで文字列の最後に一致させる方法は?

    次のコードは、文字列の最後にある「スタジアム」という単語と一致します。「サッカースタジアムのチアリーダー」 $-文字列の末尾に一致します 例 import re s = 'cheer leaders at the football stadium' result = re.search(r'\w+$', s) print result.group() 出力 これにより、出力が得られます stadium

  2. 正規表現を使用してPythonの文字列の先頭で一致させる方法は?

    次のコードは、文字列の先頭にある「チア」という単語と一致します。「サッカースタジアムのチアリーダー」 ^-文字列の先頭に一致します 例 import re s = 'cheer leaders at the football stadium' result = re.search(r'^\w+', s) print result.group() 出力 これにより出力が得られます cheer