Pythonでのデータのインポート
Pythonプログラムを実行するときは、データ分析にデータセットを使用する必要があります。 Pythonには、さまざまなファイル形式の外部データをPythonプログラムにインポートするのに役立つさまざまなモジュールがあります。この例では、さまざまな形式のデータをPythonプログラムにインポートする方法を説明します。
csvファイルをインポート
csvモジュールを使用すると、区切り文字としてコンマを使用して、ファイル内の各行を読み取ることができます。最初にファイルを読み取り専用モードで開き、次に区切り文字を割り当てます。最後に、forループを使用して、csvファイルから各行を読み取ります。
例
import csv with open("E:\\customers.csv",'r') as custfile: rows=csv.reader(custfile,delimiter=',') for r in rows: print(r)>
出力
上記のコードを実行すると、次の結果が得られます-
['customerID', 'gender', 'Contract', 'PaperlessBilling', 'Churn'] ['7590-VHVEG', 'Female', 'Month-to-month', 'Yes', 'No'] ['5575-GNVDE', 'Male', 'One year', 'No', 'No'] ['3668-QPYBK', 'Male', 'Month-to-month', 'Yes', 'Yes'] ['7795-CFOCW', 'Male', 'One year', 'No', 'No'] …… …….
パンダと
pandasライブラリは、csvファイルを含むほとんどのファイルタイプを実際に処理できます。このプログラムでは、パンダライブラリがread_excelモジュールを使用してExcelファイルを処理する方法を見てみましょう。以下の例では、上記のファイルのExcelバージョンを読み取り、ファイルを読み取ったときに同じ結果が得られます。
例
import pandas as pd df = pd.ExcelFile("E:\\customers.xlsx") data=df.parse("customers") print(data.head(10))
出力
上記のコードを実行すると、次の結果が得られます-
customerID gender Contract PaperlessBilling Churn 0 7590-VHVEG Female Month-to-month Yes No 1 5575-GNVDE Male One year No No 2 3668-QPYBK Male Month-to-month Yes Yes 3 7795-CFOCW Male One year No No 4 9237-HQITU Female Month-to-month Yes Yes 5 9305-CDSKC Female Month-to-month Yes Yes 6 1452-KIOVK Male Month-to-month Yes No 7 6713-OKOMC Female Month-to-month No No 8 7892-POOKP Female Month-to-month Yes Yes 9 6388-TABGU Male One year No No
pyodbcを使用
pyodbcというモジュールを使用してデータベースサーバーに接続することもできます。これは、SQLクエリを使用してリレーショナルソースからデータをインポートするのに役立ちます。もちろん、クエリを渡す前に、データベースへの接続の詳細を定義する必要もあります。
例
import pyodbc sql_conn = pyodbc.connect("Driver={SQL Server};Server=serverName;UID=UserName;PWD=Password;Database=sqldb;") data_sql = pd.read_sql_query(SQL QUERY’, sql_conn) data_sql.head()
出力
SQLクエリに応じて、結果が表示されます。
-
Pythonでの顧客離れの予測
すべてのビジネスは顧客の忠誠心に依存しています。顧客からのリピートビジネスは、ビジネスの収益性の基礎の1つです。したがって、顧客が事業を辞める理由を知ることが重要です。顧客が離れることは、顧客離れとして知られています。過去の傾向を見ることで、顧客離れに影響を与える要因と、特定の顧客がビジネスから離れるかどうかを予測する方法を判断できます。この記事では、MLアルゴリズムを使用して、顧客離れの過去の傾向を調査し、どの顧客が離れる可能性が高いかを判断します。 データの準備 例として、この記事のテレコム顧客チャーンを検討します。ソースデータはkaggelで入手できます。データをダウンロードするための
-
Pythonで国勢調査データを分析する
国勢調査とは、特定の人口に関する情報を体系的に記録することです。キャプチャされたデータには、人口統計、経済、居住の詳細など、さまざまなカテゴリの情報が含まれます。これは、最終的に政府が現在のシナリオと将来の計画を理解するのに役立ちます。この記事では、Pythonを活用してインドの人口の人口調査データを分析する方法を説明します。さまざまな人口統計学的および経済的側面を見ていきます。次に、分析をグラフィカルに投影する電荷をプロットします。 kaggleから収集されたソース。ここにあります。 データの整理 以下のプログラムでは、最初に短いPythonプログラムを使用してデータを取得します。さらに分