プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

階層的クラスタリングの要素は何ですか?


階層的クラスタリングアプローチは、データオブジェクトをクラスターのツリーにマージすることによって機能します。階層的クラスタリングアルゴリズムは、トップダウンまたはボトムアップです。正確な階層的クラスタリング手法の機能は、マージまたは分割の決定が完了したため、調整を実行できないことから退化します。

階層的クラスタリングには、次のようなさまざまな要素があります-

グローバルな目的関数の欠如

凝集型階層的クラスタリング手法では、いくつかの要素を使用して、各ステップで、どのクラスターをマージする(または分割アプローチの場合は分割する)必要があるかをローカルで決定します。

この方法により、複雑な組み合わせ最適化の問題を解決するのが困難になることを防ぐクラスタリングアルゴリズムが得られます。

さまざまなクラスターサイズを処理する機能

結合されたクラスターのグループの結合サイズをどのように考慮するかという、凝集型階層的クラスタリングの要素。重心、ワード、グループ平均などの合計を含む近接スキームをクラスター化するためにのみ使用されます。

すべてのクラスターを等しく考慮する加重と、各クラスター内のポイント数を考慮に入れる非加重などの2つの方法があります。加重または非加重の用語は、クラスターではなくデータポイントを定義します。言い換えると、サイズが等しくないクラスターを考慮すると、異なるクラスター内のポイントに複数の重みが等しく提供され、クラスターサイズを考慮に入れると、異なるクラスター内のポイントに同様の重みが提供されます。

統合の決定は最終的なものです

凝集型階層的クラスタリングアルゴリズムは、すべてのポイントのペアワイズ類似性に関するデータを必要とする可能性があるため、2つのクラスターの組み合わせに関する適切なローカル決定の作成に影響を与えます。 2つのクラスターをマージすることが決定されているため、次回は元に戻すことはできません。この方法は、ローカル最適化要素がグローバル最適化基準になることを回避します。

たとえば、K-meansの「二乗誤差を最小化する」基準は、ウォード法でマージするクラスターを決定する際に使用されますが、各レベルのクラスターは、合計SSEに関する極小値を定義しません。実際、あるクラスター内のポイントが、最近のクラスターの重心よりも別のクラスターの重心に近くなる可能性があるという意味で、クラスターは動的ではありません。

マージの制限を克服しようとするいくつかの方法は最終的なものです。 1つの方法は、ツリーのブランチを変更して世界的な目的関数を強化することにより、階層的クラスタリングを提供しようとします。別の方法では、いくつかの小さなクラスターを生成し、これらの小さなクラスターを開始点として使用して階層的クラスタリングを実装するために、Kmeansを含むパーティションクラスタリング手法が必要です。


  1. DESの要素は何ですか?

    DESには次のようなさまざまな要素があります- Sボックスの使用 − DESで置換に使用されるテーブル、つまりSボックスは、IBMによって非表示にされます。 IBMは、Sボックスの内部設計が登場するまでに17人以上かかったことをサポートしています。 キーの長さ −暗号化システムには、暗号化アルゴリズムとキーを含む2つの重要な要素があります。 DESアルゴリズムの内部操作は、一般の人々に完全に人気があります。したがって、DESの強みは、そのキーを含む他の要素にのみあります。これは秘密にする必要があります。 差分解読法 −差分解読法は、主にブロック暗号に適用できる暗号解読の一般的

  2. C言語のキューに挿入する要素は何ですか?

    データ構造は、構造化された方法で編成されたデータのコレクションです。以下に説明するように、2つのタイプに分けられます- 線形データ構造 −データは直線的に編成されます。たとえば、配列、構造、スタック、キュー、リンクリスト。 非線形データ構造 −データは階層的に編成されています。たとえば、ツリー、グラフ、セット、テーブル。 キュー これは線形データ構造であり、挿入は後端で行われ、削除は前端で行われます。 キューの順序はFIFO–先入れ先出しです。 操作 挿入–要素をキューに挿入します。 削除–キューから要素を削除します。 条件 キューオーバーフロー-要素を完全