Python
 Computer >> コンピューター >  >> プログラミング >> Python

Pythonのscikit-learnライブラリを使用して特徴ベクトルから平均値を削除するにはどうすればよいですか?


データの前処理とは、データのクリーンアップ、無効なデータの削除、ノイズ、データを関連する値に置き換えることなどを指します。

データの前処理とは、基本的に、すべてのデータ(さまざまなリソースまたは単一のリソースから収集される)を共通の形式または統一されたデータセット(データの種類に応じて)に収集するタスクを指します。あるステップの出力が次のステップへの入力になります。

特定の結果を得るには、入力データから平均値を削除する必要がある場合があります。 scikit-learnライブラリを使用してそれを実現する方法を理解しましょう。

import numpy as np
from sklearn import preprocessing
input_data = np.array([
[34.78, 31.9, -65.5],
[-16.5, 2.45, -83.5],
[0.5, -87.98, 45.62],
[5.9, 2.38, -55.82]])
print("Mean value is : ", input_data.mean(axis=0))
print("Standard deviation value is : ", input_data.std(axis=0))
data_scaled = preprocessing.scale(input_data)
print("Mean value has been removed ", data_scaled.mean(axis=0))
print("Standard deviation has been removed ", data_scaled.std(axis=0))

出力

Mean value is : [ 6.17 -12.8125 -39.8 ]
Standard deviation value is : [18.4708067 45.03642047 50.30754615]
Mean value has been removed [-2.60208521e-18 -8.32667268e-17 -1.11022302e-16]
Standard deviation has been removed [1. 1. 1.]

説明

  • 必要なパッケージがインポートされます。

  • 入力データは、Numpyライブラリを使用して生成されます。

  • 平均値と標準偏差値が計算されます。

  • コンソールに表示されます。

  • 「data_scaled」関数は、データから平均値と標準偏差値を削除するために使用されます。

  • この削除された平均と標準偏差のデータがコンソールに表示されます。


  1. Pythonでscikit-learnを使用して画像のピクセル値を表示するにはどうすればよいですか?

    データの前処理とは、基本的に、すべてのデータ(さまざまなリソースまたは単一のリソースから収集される)を共通の形式または統一されたデータセット(データの種類に応じて)に収集するタスクを指します。 実際のデータは決して理想的ではないため、データにセルの欠落、エラー、外れ値、列の不一致などが含まれる可能性があります。 場合によっては、画像が正しく配置されていないか、鮮明でないか、サイズが非常に大きいことがあります。前処理の目標は、これらの不一致やエラーを取り除くことです。 画像のピクセルを取得するには、「flatten」という名前の組み込み関数を使用します。画像が読み取られた後、ピクセル値はデ

  2. scikit-learnライブラリを使用してPythonで画像の解像度を取得するにはどうすればよいですか?

    データの前処理とは、基本的に、すべてのデータ(さまざまなリソースまたは単一のリソースから収集される)を共通の形式または統一されたデータセット(データの種類に応じて)に収集するタスクを指します。実際のデータは決して理想的ではないため、データにセルの欠落、エラー、外れ値、列の不一致などが含まれる可能性があります。場合によっては、画像が正しく配置されていないか、鮮明でないか、サイズが非常に大きいことがあります。前処理の目標は、これらの不一致やエラーを取り除くことです。 画像の解像度を取得するには、「shape」という名前の組み込み関数を使用します。画像が読み取られた後、ピクセル値は配列の形式で保存