プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

最近傍分類器の特徴は何ですか?


最近傍ルールは、トレーニングインスタンスが抽出される割り当てについての事前の仮定なしに、頻繁に高いパフォーマンスを生成します。これには、ポジティブケースとネガティブケースの両方のトレーニングセットが含まれています。新しいサンプルは、便利なトレーニングケースまでの距離を計算することによって定義されます。次に、その点の符号がサンプルの分類を決定します。

k-NN分類器は、k最近傍点を取得し、多数決の符号を作成することにより、この概念を強化します。タイを分割するために、kを小さく奇数として選択することがよくあります(通常は1、3、または5)。 k値を大きくすると、トレーニングデータセット内のノイズの多いポイントの影響を減らすことができ、kの選択は交差検定によって実装されます。

次のような最近傍のいくつかの特性があります-

最近傍分類は、インスタンスベースの学習と呼ばれるより一般的なアプローチの要素です。データから派生した抽象化(またはモデル)をサポートせずに予測を作成するには、特定のトレーニングインスタンスが必要です。

インスタンスベースの学習アルゴリズムには、インスタンス間の類似性または距離を決定するための近接度と、他のインスタンスへの近接性に応じてテストインスタンスの予測クラスを復元​​する分類関数が必要でした。

最近傍分類器を含む怠惰な学習者は、モデル構築を必要としません。ただし、テスト例とトレーニング例の間で近接値を個別に計算する必要があるため、テスト例の定義は非常に安価です。対照的に、熱心な学習者は、モデル構築のためにコンピューティングリソースの数を費やします。モデルが構築されているため、テスト例の定義は完全に迅速です。

最近傍分類器はローカルデータに応じて予測を作成しますが、決定木とルールベースの分類器は入力空間全体に適合するグローバルモデルを見つけようとします。分類の決定はローカルで作成されるため、最近傍分類器はノイズの影響を受けます。

最近傍分類器は、任意の形状の決定境界を作成できます。このような境界は、決定木や、直線的な決定境界を強制されるルールベースの分類子とは区別される、より動的なモデル表現をサポートします。

最近傍分類器は、適切な近接測定とデータ前処理フェーズが実行されない限り、誤った予測を行う可能性があります。たとえば、身長(メートルで測定)や体重(ポンドで測定)などの属性に基づいて一連の人を定義する必要があると考えてください。

高さ属性は変動性が低く、1.5mから1.85mの範囲ですが、重量属性は90ポンドから250ポンドまで変化する可能性があります。属性のスケールがアプリケーションに組み込まれていない場合、近接度の測定値は次のようになります。人の体重の違い。


  1. C#のコメントは何ですか?

    コメントはコードの説明に使用されます。コンパイラはコメントエントリを無視します。 C#プログラムの複数行コメントは、以下に示すように/ *で始まり、文字*/で終わります。 複数行のコメント /* The following is a mult-line comment In C# /* /*...*/はコンパイラによって無視され、プログラムにコメントを追加するために配置されます。 1行のコメント // variable int a = 10; 以下は、単一行コメントと複数行コメントを追加する方法を示すサンプルC#プログラムです- 例 using System; namespace Dem

  2. Java 9のモジュールの特徴は何ですか?

    モジュール コード、データ、およびリソースのコレクションです。これは、クラスのような関連するパッケージとタイプのセットです。 、要約 クラス 、およびインターフェース コード、データファイル、およびいくつかの静的リソースを使用します。 以下は、モジュールの特徴の一部です。 モジュールの特徴: モジュールはインターフェースを定義する必要があります 他のモジュールとの通信用。 モジュールは、モジュール間の分離を定義します インターフェース およびモジュール 実装 。 モジュールは、情報を含む一連のプロパティを提示します。 2つ以上のモジュールがネストされています 一緒に。 モジュールにはクリア