Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonを使用してPDFファイルをExcelファイルに変換する方法は?


Pythonには、さまざまなタイプの操作を処理するためのライブラリの大規模なセットがあります。この記事では、PDFファイルをExcelファイルに変換する方法を説明します。 pdfをCSVに変換するためにPythonで利用できるさまざまなパッケージがありますが、Tabula-pyモジュールを使用します。 tabula-pyの大部分はJavaで記述されており、PDFドキュメントを読み取り、PythonDataFrameをJSONオブジェクトに変換します。

tabula-pyを使用するには、システムにJavaがプリインストールされている必要があります。ここで、PDFファイルをcsvに変換するには、次の手順に従います-

  • まず、 pip install tabula-py と入力して、必要なパッケージをインストールします コマンドシェルで。

  • 次に、 read_pdf( "file location"、pages =number)を使用してファイルを読み取ります 働き。これにより、DataFrameが返されます。

  • tabula.convert_into(‘pdf-filename’、‘name_this_file.csv’、output_format ="csv"、pages ="all")を使用してDataFrameをExcelファイルに変換します 。通常、PDFファイルをExcelファイルにエクスポートします

この例では、IPL一致スケジュールドキュメントを使用しました エクセルファイルに変換します。

# Import the required Module
import tabula
# Read a PDF File
df = tabula.read_pdf("IPLmatch.pdf", pages='all')[0]
# convert PDF into CSV
tabula.convert_into("IPLmatch.pdf", "iplmatch.csv", output_format="csv", pages='all')
print(df)

出力

上記のコードを実行すると、pdfファイルがExcel(csv)ファイルに変換されます。

Pythonを使用してPDFファイルをExcelファイルに変換する方法は?


  1. 既存のファイルをPDFに変換する方法は?

    既存のMSWordまたはMSExcelファイルをPDFに変換するのが非常に難しいと感じる人はたくさんいます。そして、人々がこれらのファイルをPDF形式に変換するために使用したWebサイトもあります。 ExcelとWordの両方に、これらのアプリケーション内で作業内容をPDFとして保存するオプションがあるため、通常のファイルをPDFにするためにWebサイトを実際に使用する必要はありません。 pdfの仕事に多くの言葉を使わなければならなかったので、これは間違いなく私の大学生活を楽にしてくれました。うまくいけば、これもあなたの助けになるでしょう。 これがあなたがする必要があることです。 必要なド

  2. Excel ファイルを PDF に変換する方法

    仕事で大量のデータや数値を扱う場合は、おそらく Microsoft Excel や Google スプレッドシートを使用します。しかし、他の人と共有する前に、Excel ファイルを PDF に変換することは常に良い習慣であることをご存知ですか? このブログでは、Excel ファイルを PDF に変換する方法について説明します。ただし、Excel ファイルを PDF に変換するさまざまな方法について説明する前に、Excel シートを PDF に変換する理由を見てみましょう。 Excel を PDF に変換する理由 PDF を使用すると、Excel シートが安全になり、編集できなくなります。次