Pythonでリストするcsvファイル固有の列を抽出します
Pythonでリストする特定の列のcsvファイルを抽出するには、Pandas read_csv()を使用できます。 メソッド。
ステップ
-
抽出する必要のある列のリストを作成します。
-
read_csv()を使用する csvファイルをデータフレームに抽出する方法。
-
実行されたデータを印刷します。
-
plot()を使用してデータフレームをプロットします メソッド。
-
図を表示するには、 show()を使用します メソッド。
例
import pandas as pd from matplotlib import pyplot as plt plt.rcParams["figure.figsize"] = [7.00, 3.50] plt.rcParams["figure.autolayout"] = True columns = ["Name", "Marks"] df = pd.read_csv("input.csv", usecols=columns) print("Contents in csv file:\n", df) plt.plot(df.Name, df.Marks) plt.show()
csvファイルには次のデータが含まれています-
名前 | マーク |
---|---|
アルン | 98 |
シャム | 75 |
Govind | 54 |
Javed | 92 |
ラジュ | 87 |
出力
コードを実行すると、csvファイルからデータが抽出され、次のプロットが表示されます-
-
PythonでPDFからハイパーリンクを抽出する
Pythonには、さまざまなタイプの操作を処理するためのライブラリの大規模なセットがあります。 PDFからデータとメタ情報を抽出するには、PyPdf2パッケージを使用します。使いやすく、PDFからのデータの抽出、ドキュメント内のキーワードの検索、ハイパーリンク、URL、その他の情報の検索などのメタ情報の抽出など、さまざまな操作やツールキットがあります。 PyPDF2パッケージを使用して、PDFドキュメントからハイパーリンクを抽出します。 次の手順に従って、PDFからハイパーリンクを抽出します pip install PyPDF2 と入力して、ローカルマシンにPyPDF2をインストール
-
Pythonを使用してPDFをCSVに変換する
Pythonは、パッケージの膨大なライブラリでよく知られています。ライブラリの助けを借りて、PDFをCSVファイルに変換する方法を見ていきます。 CSVファイルは、一連の行と列とともにフレーム化されたデータのコレクションに他なりません。 PythonライブラリにはPDFをCSVに変換するためのさまざまなパッケージがありますが、Tabula-pyモジュールを使用します 。 tabula-pyの大部分はJavaで記述されており、最初にPDFドキュメントを読み取り、PythonDataFrameをJSONオブジェクトに変換します。 tabula-pyを使用するには、システムにJavaがプリインスト