Python
 Computer >> コンピューター >  >> プログラミング >> Python

PythonでBeautifulSoupを使用して空のタグを削除するにはどうすればよいですか?


BeautifulSoupは、HTMLおよびXMLファイルからデータを引き出すPythonライブラリです。BeautifulSoupを使用して、HTMLまたはXMLドキュメントに存在する空のタグを削除し、指定されたデータをさらに人間に変換することもできます。読み取り可能なファイル。

まず、コマンド pip install beautifulsoup4 を使用して、BeautifulSoupライブラリをローカル環境にインストールします。

#Import the BeautifulSoup library

from bs4 import BeautifulSoup

#Get the html document
html_object = """
<p>Python is an interpreted, high-level and general-purpose
programming language. Python's design
philosophy emphasizes code readability with its notable use of
significant indentation.</p>
"""

#Let us create the soup for the given html document
soup = BeautifulSoup(html_object, "lxml")

#Iterate over each line of the document and extract the data
for x in soup.find_all():
   if len(x.get_text(strip=True)) == 0:
      x.extract()

print(soup)

出力

上記のコードを実行すると、出力が生成され、空のタグが削除されて、指定されたHTMLドキュメントが人間が読めるコードに変換されます。

<html><body><p>Python is an interpreted, high−level and general−purpose programming
language. Python's design
philosophy emphasizes code readability with its notable use of significant indentation.</p>
</body></html>

  1. Pythonでリストから要素を削除するにはどうすればよいですか?

    Pythonのリストは線形データ構造であり、要素は連続したメモリ位置に格納され、要素はそれらのインデックスによってアクセスされます。 Pythonのリストから要素を削除する必要がある場合があります。これを実現するためのさまざまな組み込み関数があります。 pop() これにより、pop()で引数として渡されたインデックスの要素が削除または削除されます。 例 lst=[1,2,3,4,5] lst.pop(2) print(lst) 出力 [1, 2, 4, 5] 上記のコードスニペットは、pop(2)がインデックス2の要素を削除することを示しています。 remove() この関数は、

  2. Pythonでラベルからテキストを削除するにはどうすればよいですか?

    Tkinterは、GUIベースのアプリケーションの作成と開発に使用されるPythonライブラリです。この記事では、テキストが含まれるラベルからテキストを削除する方法を説明します。 ラベルからテキストを削除するために、ラベルのトリガーとして機能する関連ボタンを作成します。 例 #import Tkinter Library from tkinter import * #Create an instance of tkinter frame win= Tk() #Define the size and geometry of the frame win.geometry("700x