プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

属性サブセット選択の基本的な方法は何ですか?


属性サブセットを選択すると、無関係または冗長な属性(またはディメンション)が削除され、データセットのサイズが小さくなります。属性サブセットの選択は、データクラスの結果の確率分布が、すべての属性を使用してアクセスする元の分布に可能な限り近くなるように、属性の最小セットを検出することを目的としています。削減された属性セットでのデータマイニングには、追加の利点があります。検出されたパターンで発生する複数の属性を減らし、理解しやすいパターンを作成できるようにします。

n個の属性には、2 n があります。 可能なサブセット。属性の最適なサブセットを徹底的に検索すると、特にn個のデータクラスと複数のデータクラスが増えると、非常にコストがかかる可能性があります。したがって、属性サブセットの選択には、縮小された検索スペースを探索するヒューリスティック手法が頻繁に使用されます。

これらのメソッドは通常、属性スペースを検索するときに、その時点でより適切に見えるものを常に作成するという点で貪欲です。彼らの戦略は、これがグローバルに最適なソリューションにつながることを期待して、ローカルで最適な選択を行うことです。このような貪欲なアプローチは実際には効率的であり、最適なソリューションの見積もりに近づく可能性があります。

最良および最悪の属性は、一般に、属性が互いに分離していると見なす統計的有意性のテストを使用して決定されます。分類のための決定木を構築する際に使用される情報獲得尺度を含む、他のいくつかの属性評価尺度を使用することができます。

属性サブセットの選択には、次のような方法があります-

  • 段階的順方向選択 −プロセスは、縮小セットとしての属性のヌルセットから始まります。元の属性の最良のものが決定され、縮小されたセットに追加されます。後続の反復またはステップごとに、残りの元の属性の最良のものがセットに挿入されます。

  • 段階的な後方排除 −手順は、属性の完全なセットから始まります。各ステップで、セットに残っている最悪の属性を削除します。

  • 前方選択と後方排除の組み合わせ −ステップワイズ順方向選択と逆方向除去の方法を接続して、各ステップで、プロシージャが最良の属性を選択し、残りの属性の中から最悪の属性を除去することができます。

  • デシジョンツリーの誘導 − ID3、C4.5、およびCARTを含む決定木アルゴリズムは、もともと分類用に設計されました。デシジョンツリー誘導は、フローチャートのような構造を構築します。各内部(非リーフ)ノードは属性のテストを示し、各ブランチはテストの結果に対応し、各外部(リーフ)ノードはクラス予測を示します。各ノードで、アルゴリズムは「最良の」属性を選択して、データを個々のクラスに分割します。


  1. JavaScriptでの_.size()メソッドの使用は何ですか?

    _。size() _。Size() underscore.jsからのものです javascriptのライブラリ。これは、配列のサイズを見つけるために使用されます。この方法を使用する前に、 CDNを使用する必要があることを確認する必要があります underscore.jsの コードを実行します。 構文 _.size(array); 例-1 次の例では、通常の配列が _.size()に渡されます。 配列のサイズを取得するメソッド。 <html> <body> <head> <script src = "https://cdnj

  2. novalidate属性とformnovalidate属性の違いは何ですか?

    novalidate およびf ormnovalidate 属性は、検証をバイパスするために使用されます。 ノバリデート 属性がフォームに適用され、検証されないようにします。 formnovalidate novalidateを上書きする入力タイプの送信ボタンに適用されます 。検証せずにフォームを送信します。 ノバリデート 属性もブール属性ですが、これを使用しても送信フォームは検証されません。 formnovalidate HTMLの属性は、複数の送信ボタンがあるフォームがある場合に役立ちます。 HTMLnovalidate属性 HTMLのnovalidate属性は、送