Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonでscikit-learnライブラリを使用してL1正規化を実装する方法を説明してください。


値の範囲を標準化された値の範囲に変換するプロセスは、正規化と呼ばれます。これらの値は、-1から+1または0から1の間である可能性があります。データは、減算と除算を使用して正規化することもできます。

入力として学習アルゴリズムに供給されるデータは、一貫性があり、構造化されている必要があります。値を効果的に予測するには、入力データのすべての機能を単一のスケールにする必要があります。しかし、現実の世界では、データは構造化されておらず、ほとんどの場合、同じ規模ではありません。

これは、正規化が思い浮かぶときです。これは、最も重要なデータ準備プロセスの1つです。

これは、入力データセットの列の値を同じスケールに収まるように変更するのに役立ちます。

正規化の過程で、値の範囲が歪まないことが保証されます。

−機械学習アルゴリズムに供給されるすべての入力データセットを正規化する必要はありません。正規化が必要なのは、データセット内のフィーチャの値のスケールが完全に異なる場合のみです。

正規化にはさまざまな種類があります-

  • 最小-最大正規化
  • Z正規化
  • 単位ベクトルの正規化

L1正規化がどのように機能するかを理解しましょう。

最小絶対偏差とも呼ばれ、絶対値の合計がすべての行で1のままになるようにデータを変更します。

Pythonでscikitlearnを使用してL1正規化を実装する方法を見てみましょう-

import numpy as np
from sklearn import preprocessing
input_data = np.array(
   [[34.78, 31.9, -65.5],[-16.5, 2.45, -83.5],[0.5, -87.98, 45.62],[5.9, 2.38, -55.82]]
)
data_normalized_l1 = preprocessing.normalize(input_data, norm='l1')
print("\nL1 normalized data is \n", data_normalized_l1)

出力

L1 normalized data is
[[ 0.26312604 0.24133757 -0.49553639]
[-0.16105417 0.0239141 -0.81503172]
[ 0.00372856 -0.65607755 0.34019389]
[ 0.09204368 0.03712949 -0.87082683]]

説明

  • 必要なパッケージがインポートされます。

  • 入力データは、Numpyライブラリを使用して生成されます。

  • クラス「preprocessing」にある「normalize」関数は、データを正規化するために使用されます。

  • 正規化のタイプは「l1」として指定されます。

  • このようにして、配列内のすべてのデータが正規化され、すべての行の合計は1のみになります。

  • この正規化されたデータはコンソールに表示されます。


  1. Pythonの「seaborn」ライブラリを使用してデータを視覚的に表現するにはどうすればよいですか?

    機械学習では、データからモデルを作成し、これまでに見たことのないデータを一般化します。入力として機械学習モデルに提供されるデータは、システムがデータを適切に理解して結果を生成できるようにする必要があります。 Seabornは、データの視覚化に役立つライブラリです。カスタマイズされたテーマと高レベルのインターフェースが付属しています。このインターフェースは、データの種類と、特定のフィルターが適用されたときのデータの動作をカスタマイズおよび制御するのに役立ちます。 Seabornライブラリには、さまざまなスタイルでの作業に役立つ「set_Style()」と呼ばれるインターフェースが含まれていま

  2. scikit-learnライブラリを使用してPythonで画像の解像度を取得するにはどうすればよいですか?

    データの前処理とは、基本的に、すべてのデータ(さまざまなリソースまたは単一のリソースから収集される)を共通の形式または統一されたデータセット(データの種類に応じて)に収集するタスクを指します。実際のデータは決して理想的ではないため、データにセルの欠落、エラー、外れ値、列の不一致などが含まれる可能性があります。場合によっては、画像が正しく配置されていないか、鮮明でないか、サイズが非常に大きいことがあります。前処理の目標は、これらの不一致やエラーを取り除くことです。 画像の解像度を取得するには、「shape」という名前の組み込み関数を使用します。画像が読み取られた後、ピクセル値は配列の形式で保存