Python
 Computer >> コンピューター >  >> プログラミング >> Python

Scikit-learnでの学習モデル構築:Python機械学習ライブラリ


この記事では、Scikit-learn:Python MachineLearningLibraryでの学習モデルの構築について学習します。

無料の機械学習ライブラリです。ランダムフォレスト、ベクターマシン、k最近傍法などのさまざまなアルゴリズムをサポートし、numpyとscipyを直接実装します。

データセットのインポート

import pandas
Url = < specify your URL here>
data=pandas.rad_csv(url)

データの探索とクリーニング

headメソッドを使用して、必要に応じてレコードを指定/フィルタリングできます。

data.head()
data.head(n=4) # restricting the record to be 4

データセットの最後の数レコードを実装することもできます

data.tail()
data.tail(n=4) # restricting the record to be 4

データの視覚化の段階になりました

このために、Seabornモジュールとmatplotlibを使用してデータを視覚化します

import seaborn as s
import matplotlib.pyplot as plt
sns.set(style="whitegrid", color_codes=True)
# create a countplot
sns.countplot('Route To Market',data=sales_data,hue = 'Opportunity Result')

データの前処理

from sklearn import preprocessing
le = preprocessing.LabelEncoder()
#convert the columns into numeric values
encoded_value = le.fit_transform(list of column names)
print(encoded_value)

最終的に、データセットをトレーニングすることでモデル構築の段階に到達します。

Scikit-learnでの学習モデル構築:Python機械学習ライブラリ

結論

この記事では、Pythonで利用可能なライブラリであるscikit-learnでのモデル構築について学びました。


  1. scikit-learnライブラリを使用してPythonで画像の解像度を取得するにはどうすればよいですか?

    データの前処理とは、基本的に、すべてのデータ(さまざまなリソースまたは単一のリソースから収集される)を共通の形式または統一されたデータセット(データの種類に応じて)に収集するタスクを指します。実際のデータは決して理想的ではないため、データにセルの欠落、エラー、外れ値、列の不一致などが含まれる可能性があります。場合によっては、画像が正しく配置されていないか、鮮明でないか、サイズが非常に大きいことがあります。前処理の目標は、これらの不一致やエラーを取り除くことです。 画像の解像度を取得するには、「shape」という名前の組み込み関数を使用します。画像が読み取られた後、ピクセル値は配列の形式で保存

  2. Pythonを使用した機械学習の概要

    この記事では、Python3.xを使用した機械学習の基本について学習します。またはそれ以前。 まず、既存のライブラリを使用して機械学習環境を設定する必要があります >>> pip install numpy >>> pip install scipy >>> pip install matplotlib >>> pip install scikit-learn 機械学習は経験と事実の研究を扱い、予測は提供された意図に基づいて行われます。データベースが大きいほど、機械学習モデルは優れています。 機械学習の流れ データ