Python
 Computer >> コンピューター >  >> プログラミング >> Python

Python-Pandasのフォルダー内のすべてのCSVファイルを読み取りますか?


フォルダ内のすべてのExcelファイルを読み取るには、Globモジュールとread_csv()メソッドを使用します。次がディレクトリ内のExcelファイルであるとしましょう-

まず、パスを設定してcsvファイルを取得しましょう。 CSVファイルはMyProject-

フォルダーにあります
path = "C:\\Users\\amit_\\Desktop\\MyProject\\"

上記のパスから拡張子.csvのファイルを読み取る-

filenames = glob.glob(path + "\*.csv")

ここで、すべてのcsvファイルを反復処理し、それらを読み取って印刷するforループを作成しましょう-

for file in filenames:
   # reading csv files
   print("\nReading file = ",file)
   print(pd.read_csv(file))

以下は完全なコードです-

import pandas as pd
import glob

# getting csv files from the folder MyProject
path = "C:\\Users\\amit_\\Desktop\\MyProject\\"

# read all the files with extension .csv
filenames = glob.glob(path + "\*.csv")
print('File names:', filenames)

# for loop to iterate all csv files
for file in filenames:
   # reading csv files
   print("\nReading file = ",file)
   print(pd.read_csv(file))

出力

これにより、次の出力が生成されます

File names:['C:\\Users\\amit_\\Desktop\\MyProject\\Sales1.xlsx','C:\\Users\\amit_\\Desktop\\MyProject\\Sales2.xlsx']

Reading file = C:\Users\amit_\Desktop\MyProject\Sales1.xlsx
          Car      Place   UnitsSold
0        Audi  Bangalore          80
1     Porsche     Mumbai         110
2  RollsRoyce       Pune         100

Reading file = C:\Users\amit_\Desktop\MyProject\Sales2.xlsx
          Car       Place   UnitsSold
0         BMW       Delhi          95
1    Mercedes   Hyderabad          80
2  Lamborgini  Chandigarh          80

  1. Python-フォルダ内のすべてのExcelファイルをマージする方法

    フォルダ内のすべてのExcelファイルをマージするには、Globモジュールとappend()メソッドを使用します。 以下がデスクトップ上のExcelファイルであるとしましょう- Sales1.xlsx Sales2.xlsx 注 −openpyxlおよびxlrdパッケージのインストールが必要になる場合があります。 最初に、マージするすべてのExcelファイルが配置されるパスを設定します。 Excelファイルを取得し、globを使用してそれらを読み取ります- path = "C:\\Users\\amit_\\Desktop\\" file

  2. Pythonを使用してPDFをCSVに変換する

    Pythonは、パッケージの膨大なライブラリでよく知られています。ライブラリの助けを借りて、PDFをCSVファイルに変換する方法を見ていきます。 CSVファイルは、一連の行と列とともにフレーム化されたデータのコレクションに他なりません。 PythonライブラリにはPDFをCSVに変換するためのさまざまなパッケージがありますが、Tabula-pyモジュールを使用します 。 tabula-pyの大部分はJavaで記述されており、最初にPDFドキュメントを読み取り、PythonDataFrameをJSONオブジェクトに変換します。 tabula-pyを使用するには、システムにJavaがプリインスト