Python
 Computer >> コンピューター >  >> プログラミング >> Python

scikit-learnライブラリを使用してPythonでデータをロードするにはどうすればよいですか?


一般にsklearnとして知られているScikit-learnは、機械学習アルゴリズムを実装する目的で使用されるPythonのオープンソースライブラリです。

これには、Pythonの強力で安定したインターフェースの助けを借りて、分類、回帰、クラスタリング、次元削減などが含まれます。このライブラリは、Numpy、SciPy、およびMatplotlibライブラリに基づいて構築されています。

データをロードする例を見てみましょう-

from sklearn.datasets import load_iris
my_data = load_iris()
X = my_data.data
y = my_data.target
feature_name = my_data.feature_names
target_name = my_data.target_names
print("Feature names are : ", feature_name)
print("Target names are : ", target_name)
print("\nFirst 8 rows of the dataset are : \n", X[:8])

出力

Feature names are : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
Target names are : ['setosa' 'versicolor' 'virginica']
First 8 rows of the dataset are :
[[5.1 3.5 1.4 0.2]
[4.9 3. 1.4 0.2]
[4.7 3.2 1.3 0.2]
[4.6 3.1 1.5 0.2]
[5. 3.6 1.4 0.2]
[5.4 3.9 1.7 0.4]
[4.6 3.4 1.4 0.3]
[5. 3.4 1.5 0.2]]

説明

  • 必要なパッケージがインポートされます。
  • これに必要なデータセットも環境に読み込まれます。
  • 機能とターゲット値はデータセットから分離されています。
  • これらの機能とターゲットはコンソールに出力されます。
  • また、データのサンプルを表示するには、データの最初の8行がコンソールに出力されます。

  1. Seabornライブラリを使用してPythonでヒストグラムを表示するにはどうすればよいですか?

    データの視覚化は、実際に数値を調べたり複雑な計算を実行したりすることなく、データで何が起こっているのかを理解するのに役立つため、重要なステップです。定量的な洞察を聴衆に効果的に伝えるのに役立ちます。 Seabornは、データの視覚化に役立つライブラリです。カスタマイズされたテーマと高レベルのインターフェースが付属しています。 Pythonでヒストグラムを表示する例を見てみましょう- 例 import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('

  2. Seabornライブラリを使用してPythonで散布図を表示するにはどうすればよいですか?

    データの視覚化は、実際に数値を調べたり複雑な計算を実行したりすることなく、データで何が起こっているのかを理解するのに役立つため、重要なステップです。 Seabornは、データの視覚化に役立つライブラリです。 散布図は、グラフ上に分散/分散されたデータポイントとしてデータの分布を示します。ドットを使用して、データセットの値を表します。データセットは本質的に数値です。横軸と縦軸のすべてのドットの位置は、単一のデータポイントの値を示します。 これらは、2つの変数間の関係を理解するのに役立ちます。 PythonでSeabornライブラリを使用してこれを実現する方法を理解しましょう- 例 impor