Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonでのデータのインポート


Pythonプログラムを実行するときは、データ分析にデータセットを使用する必要があります。 Pythonには、さまざまなファイル形式の外部データをPythonプログラムにインポートするのに役立つさまざまなモジュールがあります。この例では、さまざまな形式のデータをPythonプログラムにインポートする方法を説明します。

csvファイルをインポート

csvモジュールを使用すると、区切り文字としてコンマを使用して、ファイル内の各行を読み取ることができます。最初にファイルを読み取り専用モードで開き、次に区切り文字を割り当てます。最後に、forループを使用して、csvファイルから各行を読み取ります。

import csv

with open("E:\\customers.csv",'r') as custfile:
rows=csv.reader(custfile,delimiter=',')
for r in rows:
print(r)
>

出力

上記のコードを実行すると、次の結果が得られます-

['customerID', 'gender', 'Contract', 'PaperlessBilling', 'Churn']
['7590-VHVEG', 'Female', 'Month-to-month', 'Yes', 'No']
['5575-GNVDE', 'Male', 'One year', 'No', 'No']
['3668-QPYBK', 'Male', 'Month-to-month', 'Yes', 'Yes']
['7795-CFOCW', 'Male', 'One year', 'No', 'No']
……
…….

パンダと

pandasライブラリは、csvファイルを含むほとんどのファイルタイプを実際に処理できます。このプログラムでは、パンダライブラリがread_excelモジュールを使用してExcelファイルを処理する方法を見てみましょう。以下の例では、上記のファイルのExcelバージョンを読み取り、ファイルを読み取ったときに同じ結果が得られます。

import pandas as pd

df = pd.ExcelFile("E:\\customers.xlsx")
data=df.parse("customers")
print(data.head(10))

出力

上記のコードを実行すると、次の結果が得られます-

  customerID   gender Contract            PaperlessBilling Churn
0 7590-VHVEG Female   Month-to-month         Yes            No
1 5575-GNVDE   Male   One year                No            No
2 3668-QPYBK   Male   Month-to-month         Yes           Yes
3 7795-CFOCW   Male   One year                No            No
4 9237-HQITU Female   Month-to-month        Yes            Yes
5 9305-CDSKC Female   Month-to-month        Yes            Yes
6 1452-KIOVK   Male   Month-to-month        Yes             No
7 6713-OKOMC Female   Month-to-month         No             No
8 7892-POOKP Female   Month-to-month        Yes            Yes
9 6388-TABGU   Male   One year               No             No

pyodbcを使用

pyodbcというモジュールを使用してデータベースサーバーに接続することもできます。これは、SQLクエリを使用してリレーショナルソースからデータをインポートするのに役立ちます。もちろん、クエリを渡す前に、データベースへの接続の詳細を定義する必要もあります。

import pyodbc
sql_conn = pyodbc.connect("Driver={SQL Server};Server=serverName;UID=UserName;PWD=Password;Database=sqldb;")
data_sql = pd.read_sql_query(SQL QUERY’, sql_conn)
data_sql.head()

出力

SQLクエリに応じて、結果が表示されます。


  1. Pythonでの顧客離れの予測

    すべてのビジネスは顧客の忠誠心に依存しています。顧客からのリピートビジネスは、ビジネスの収益性の基礎の1つです。したがって、顧客が事業を辞める理由を知ることが重要です。顧客が離れることは、顧客離れとして知られています。過去の傾向を見ることで、顧客離れに影響を与える要因と、特定の顧客がビジネスから離れるかどうかを予測する方法を判断できます。この記事では、MLアルゴリズムを使用して、顧客離れの過去の傾向を調査し、どの顧客が離れる可能性が高いかを判断します。 データの準備 例として、この記事のテレコム顧客チャーンを検討します。ソースデータはkaggelで入手できます。データをダウンロードするための

  2. Pythonで国勢調査データを分析する

    国勢調査とは、特定の人口に関する情報を体系的に記録することです。キャプチャされたデータには、人口統計、経済、居住の詳細など、さまざまなカテゴリの情報が含まれます。これは、最終的に政府が現在のシナリオと将来の計画を理解するのに役立ちます。この記事では、Pythonを活用してインドの人口の人口調査データを分析する方法を説明します。さまざまな人口統計学的および経済的側面を見ていきます。次に、分析をグラフィカルに投影する電荷をプロットします。 kaggleから収集されたソース。ここにあります。 データの整理 以下のプログラムでは、最初に短いPythonプログラムを使用してデータを取得します。さらに分