Hoeffdingツリーアルゴリズムとは何ですか?
Hoeffdingツリーアルゴリズムは、ストリームデータ分類のための決定木学習方法です。これは当初、Webクリックストリームを追跡し、ユーザーがアクセスする可能性のあるWebホストとWebサイトを予測するためのモデルを構築するために使用されていました。通常、劣線形時間で実行され、従来のバッチ学習者とほぼ同じ決定木を生成します。
これはHoeffdingツリーを使用します。これは、最適な分割属性を選択するには、小さなサンプルで十分であることが多いという考えを利用しています。このアイデアは、Hoeffdingバウンド(または加法Chernoffバウンド)によって数学的にサポートされています。
$$ \ varepsilon =\ sqrt {\ frac {R ^ {2} ln \ frac {1} {\ delta}} {2N}} $$
Hoeffding Treeアルゴリズムは、Hoeffding境界を使用して、分割属性を選択するときにノードで必要な例の最小数Nを高い確率で決定します。 Hoeffdingの限界は、他のほとんどの限界方程式とは異なり、確率分布に依存しません。これは、情報ゲインの確率分布、または使用されている属性選択尺度を知ることが不可能な場合があるため、望ましいことです。
アルゴリズムは、属性Aで記述された一連のトレーニング例Sと精度パラメーターδを入力として受け取ります。評価関数G(A i )が提供されます。これは、情報ゲイン、ゲイン比、ジニ係数、またはその他の属性選択尺度である可能性があります。決定木の各ノードで、G(A i )残りの属性の1つ、A i 。目標は、Hoeffdingの境界が満たされるタプルの最小数Nを見つけることです。
アルゴリズムは、属性Aで記述された一連のトレーニング例Sと精度パラメーターδを入力として受け取ります。評価関数G(A i )が提供されます。これは、情報ゲイン、ゲイン比、ジニ係数、またはその他の属性選択尺度である可能性があります。決定木の各ノードで、G(A i )残りの属性の1つ、A i 。目標は、Hoeffdingの境界が満たされるタプルの最小数Nを見つけることです。
特定のノードについて、A a 最高のGを達成する属性であり、2番目に高いGを達成する属性をアッベします。G(A a )− G(A b )>ε、ここでεが計算されます。
Hoeffdingツリーアルゴリズムで維持する必要がある唯一の統計は、カウントn ijkです。 値vjの場合 属性Aiの クラスラベルyk 。したがって、dが属性の数、vが任意の属性の値の最大数、cがクラスの数、lがツリーの最大の深さ(またはレベルの数)である場合、必要な合計メモリはO(ldvc)です。
-
プリムの最小スパニングツリーアルゴリズム
連結グラフG(V、E)があり、すべてのエッジの重みまたはコストが示されています。プリムのアルゴリズムは、グラフGから最小全域木を見つけます。 それは成長する木のアプローチです。このアルゴリズムでは、ツリーを開始するためにシード値が必要です。シード頂点は、ツリー全体を形成するように成長します。 この問題は、2つのセットを使用して解決されます。 1つのセットには、すでに選択されているノードが保持され、別のセットには、まだ考慮されていないアイテムが保持されます。シード頂点から、最小エッジコストに基づいて隣接する頂点を取得するため、ノードを1つずつ取得してツリーを成長させます。 この問題の
-
JSPのインポート属性とは何ですか?
インポート 属性は、Java importステートメントと同じ機能を果たし、そのように動作します。インポートオプションの値は、インポートするパッケージの名前です。 java.sql。*をインポートするには 、次のページディレクティブを使用します- <%@ page import = "java.sql.*" %> 複数のパッケージをインポートするには、次のようにカンマで区切って指定できます- <%@ page import = "java.sql.*,java.util.*" %> デフォルトでは、コンテナは自動的に jav