デシジョンツリーとは何ですか?
デシジョンツリーはフローチャートのようなツリーメカニズムであり、各内部ノードは属性のテストを示し、各部門はテストの結果を定義し、リーフノードはクラスまたはクラス分布を記述します。ツリーの最上位ノードはルートノードです。
決定木を学習するためのアルゴリズム
アルゴリズム −指定されたトレーニング情報から決定木を作成します。
入力 −離散値属性によって記述されたトレーニングサンプル、サンプル。学生の属性のセット、属性リスト。
出力 −決定木。
メソッド
-
ノードNを作成します;
-
サンプルがすべて同じクラスの場合、C、
-
クラスC
でラベル付けされたリーフノードとしてNを返します。 -
属性リストがnullの場合、
-
サンプルで最も一般的なクラスでラベル付けされたリーフノードとしてNを返します。 //多数決
-
情報ゲインが最も高い属性リストの中から属性であるtest-attributeを選択します。
-
ノードNにテスト属性のラベルを付けます。
-
test-attributeの既知の値aiごとに、//サンプルを分割します。
-
条件test-attribute=a iのノードNからブランチを成長させます 。
-
s i test-attribute =a iであるサンプルのサンプルのセットである 。
-
siが空の場合、
-
サンプルで最も一般的なクラスでラベル付けされたリーフを接続できます。
-
それ以外の場合は、Generate Decision Tree(si、attribute-list --test-attribute)によって返されたノードをアタッチします
ディシジョンツリーの誘導
たとえば、決定ルールの自動生成は、ルール誘導または自動ルール誘導と呼ばれます。デシジョンツリーの暗黙的な設計でデシジョンルールを作成することは、ルールインダクションとも呼ばれますが、ツリーインダクションまたはデシジョンツリーインダクションという用語は常に選択されています。
デシジョンツリー誘導の基本的なアルゴリズムは、欲張りアルゴリズムです。これは、トップダウンの再帰的な分割統治法で決定木を生成するために使用されます。決定木を学習するための基本的なアルゴリズムは、有名な決定木誘導アルゴリズムであるID3の形式です。
基本的な方法は次のとおりです-
-
ツリーは、トレーニングサンプルを定義する個々のノードとして始まります。
-
サンプルがすべて類似したクラスである場合、ノードはリーフに変わり、そのクラスでラベル付けされます。
-
アルゴリズムは、サンプルを単一のクラスに分割する属性を選択するためのヒューリスティックとして、情報ゲインと呼ばれるエントロピーベースの測定を適用します。この属性は、ノードで「テスト」または「決定」属性に発展します。この形式のアルゴリズムでは、すべての属性がカテゴリに分類されます。つまり、離散値です。連続値の属性は離散化する必要があります。
-
テスト属性の既知の値ごとに部門が生成され、サンプルは適切に分割されます。
-
アルゴリズムは、同様のプロセスループを使用して、各分離でのサンプルの決定木を形成します。属性はノードに表示されているため、ノードの子孫の一部では処理されないようにする必要があります。
-
m-aryツリー
コンピュータサイエンスのm-aryツリーは、通常、次のように階層的に表されるノードのコレクションとして定義されます。 ツリーはルートノードで開始されます。 ツリーの各ノードは、その子ノードへのポインタのリストを維持します。 子ノードの数がm以下です。 m-aryツリーの一般的な表現は、子を格納するためにm個の参照(またはポインター)の配列を実装します(mは子の数の上限であることに注意してください)。 m-way探索木 a。空または b。 b(1 <=b
-
Windows 11 SE とは何ですか?
Chromebook と Chrome オペレーティング システムが教育市場をほぼ独占してきましたが、Microsoft はかなり長い間、競争の場に参入して平準化しようと試みてきました。 Windows 11 SE では、まさにそれを達成しようとしています。このオペレーティング システムは、K-8 クラスルームで作成されました 念頭に置いて。使いやすく、安全性が高く、機能が制限された低コストのコンピューターにより適していると考えられています。この新しい OS の開発中、Microsoft は教育者、学校の IT 担当者、および管理者と協力しました。 Windows 11 SE 用に特別に作成さ