Pythonでscikit-learnライブラリを使用してL1正規化を実装する方法を説明してください。
値の範囲を標準化された値の範囲に変換するプロセスは、正規化と呼ばれます。これらの値は、-1から+1または0から1の間である可能性があります。データは、減算と除算を使用して正規化することもできます。
入力として学習アルゴリズムに供給されるデータは、一貫性があり、構造化されている必要があります。値を効果的に予測するには、入力データのすべての機能を単一のスケールにする必要があります。しかし、現実の世界では、データは構造化されておらず、ほとんどの場合、同じ規模ではありません。
これは、正規化が思い浮かぶときです。これは、最も重要なデータ準備プロセスの1つです。
これは、入力データセットの列の値を同じスケールに収まるように変更するのに役立ちます。
正規化の過程で、値の範囲が歪まないことが保証されます。
注 −機械学習アルゴリズムに供給されるすべての入力データセットを正規化する必要はありません。正規化が必要なのは、データセット内のフィーチャの値のスケールが完全に異なる場合のみです。
正規化にはさまざまな種類があります-
- 最小-最大正規化
- Z正規化
- 単位ベクトルの正規化
L1正規化がどのように機能するかを理解しましょう。
最小絶対偏差とも呼ばれ、絶対値の合計がすべての行で1のままになるようにデータを変更します。
Pythonでscikitlearnを使用してL1正規化を実装する方法を見てみましょう-
例
import numpy as np from sklearn import preprocessing input_data = np.array( [[34.78, 31.9, -65.5],[-16.5, 2.45, -83.5],[0.5, -87.98, 45.62],[5.9, 2.38, -55.82]] ) data_normalized_l1 = preprocessing.normalize(input_data, norm='l1') print("\nL1 normalized data is \n", data_normalized_l1)
出力
L1 normalized data is [[ 0.26312604 0.24133757 -0.49553639] [-0.16105417 0.0239141 -0.81503172] [ 0.00372856 -0.65607755 0.34019389] [ 0.09204368 0.03712949 -0.87082683]]
説明
-
必要なパッケージがインポートされます。
-
入力データは、Numpyライブラリを使用して生成されます。
-
クラス「preprocessing」にある「normalize」関数は、データを正規化するために使用されます。
-
正規化のタイプは「l1」として指定されます。
-
このようにして、配列内のすべてのデータが正規化され、すべての行の合計は1のみになります。
-
この正規化されたデータはコンソールに表示されます。
-
Pythonの「seaborn」ライブラリを使用してデータを視覚的に表現するにはどうすればよいですか?
機械学習では、データからモデルを作成し、これまでに見たことのないデータを一般化します。入力として機械学習モデルに提供されるデータは、システムがデータを適切に理解して結果を生成できるようにする必要があります。 Seabornは、データの視覚化に役立つライブラリです。カスタマイズされたテーマと高レベルのインターフェースが付属しています。このインターフェースは、データの種類と、特定のフィルターが適用されたときのデータの動作をカスタマイズおよび制御するのに役立ちます。 Seabornライブラリには、さまざまなスタイルでの作業に役立つ「set_Style()」と呼ばれるインターフェースが含まれていま
-
scikit-learnライブラリを使用してPythonで画像の解像度を取得するにはどうすればよいですか?
データの前処理とは、基本的に、すべてのデータ(さまざまなリソースまたは単一のリソースから収集される)を共通の形式または統一されたデータセット(データの種類に応じて)に収集するタスクを指します。実際のデータは決して理想的ではないため、データにセルの欠落、エラー、外れ値、列の不一致などが含まれる可能性があります。場合によっては、画像が正しく配置されていないか、鮮明でないか、サイズが非常に大きいことがあります。前処理の目標は、これらの不一致やエラーを取り除くことです。 画像の解像度を取得するには、「shape」という名前の組み込み関数を使用します。画像が読み取られた後、ピクセル値は配列の形式で保存