プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

決定木は分類にどのように使用されますか?


デシジョンツリーの誘導は、クラスラベルの付いたトレーニングタプルからデシジョンツリーを学習することです。デシジョンツリーは、シーケンス図のようなツリー構造であり、すべての内部ノード(非リーフノード)が属性のテストを示し、各ブランチがテストの結果を定義し、各リーフノード(またはターミナルノード)がクラスに影響を与えます。ラベル。ツリーの最上位ノードはルートノードです。

これは、コンピューターを購入するという概念を定義します。つまり、AllElectronicsのユーザーがコンピューターを購入する可能性が高いかどうかを予測します。内部ノードは長方形で示され、葉ノードは楕円で示されます。さまざまな決定木アルゴリズムがあり、バイナリツリーのみを作成します(すべての内部ノードが他の2つのノードに正確に分岐します)が、他のアルゴリズムは非バイナリツリーを作成できます。

関連するクラスラベルが匿名であるタプルXが与えられると、タプルの属性値が決定木に対してチェックされます。ルートからリーフノードへの方向がトレースされ、そのタプルのクラス予測に影響を与えます。決定木は分類ルールに変更できます。

デシジョンツリー分類子の開発には、ドメイン知識やパラメータ設定は必要ないため、探索的な知識の発見に適しています。

デシジョンツリーは、大規模なデータを管理できます。習得した知識をツリー形式で説明するのは直感的で、通常は人間が簡単に理解できます。デシジョンツリー帰納の学習と分類のフェーズは簡単で迅速です。

一般に、決定木分類器の効率は良好です。ただし、使用の成功は、手元のデータに基づくことができます。デシジョンツリー誘導アルゴリズムは、医学、製造および生産、金銭分析、天文学、分子生物学など、いくつかのアプリケーション分野での分類に使用されてきました。デシジョンツリーは、複数の商用ルール誘導システムに基づいています。

ツリーの構築中に、属性選択メジャーを使用して、タプルをさまざまなクラスに最適に分割する属性を選択します。デシジョンツリーが構築されると、一部のブランチはトレーニングレコードのノイズまたは外れ値を反映する可能性があります。木の剪定は、表示されていないデータの分類精度を向上させることを目的として、そのような枝を認識して排除しようとします。

ID3、C4.5、およびCARTは、決定木がトップダウンの再帰的分割統治法で構築される貪欲な(つまり、非バックトラッキング)方法を承認します。決定木の帰納法のいくつかのアルゴリズムも、タプルとそれに関連するクラスラベルのトレーニングコレクションから始まるこのようなトップダウン方式に従います。トレーニングコレクションは、ツリーが構築されている間、再帰的に小さなサブセットに分割されます。


  1. 多方向ツリー

    マルチウェイツリーは、3つ以上の子を持つことができるツリーとして定義されます。マルチウェイツリーが最大m個の子を持つことができる場合、このツリーは次数mのマルチウェイツリー(またはmウェイツリー)と呼ばれます。 調査された他のツリーと同様に、m-wayツリーのノードはm-1キーフィールドと子へのポインタで構成されます。 次数5の多元ツリー m-wayツリーの処理を容易にするために、ある種の制約または順序が各ノード内のキーに課され、順序mの多方向検索ツリー(またはm-way検索ツリー)が生成されます。定義上、m-way探索木は、次の条件を満たす必要があるm-wayツリーです- 各ノ

  2. PC用のサージプロテクタはどれほど重要ですか?

    新しいコンピューターを購入するとき、それと一緒にどのようなアクセサリーを購入しますか?単なる塔の場合は、それに合わせて画面が必要になります。おそらく、マウスとキーボードも必要になるでしょう。すべての必需品があっても、スピーカー、WiFiアダプター、ヘッドホンなど、購入できるものはまだほとんどありません。ただし、サージプロテクタの可能性についても検討したことがありますか? 忘れられがちなハードウェアですが、検討する価値があります。結局のところ、ある日、それはあなたのマシンの生と死の違いを意味するかもしれません! パワースパイクはPCにどのように害を及ぼしますか? デバイスを主電源に接続すると