プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

プロトタイプベースのクラスタリングとは何ですか?


プロトタイプベースのクラスタリングでは、クラスターはオブジェクトのグループであり、あるオブジェクトは、他のクラスターのプロトタイプよりも、クラスターを表すプロトタイプに近いものです。クラスターのプロトタイプとしてクラスター内の要素の重心を必要とする、単純なプロトタイプベースのクラスタリングアルゴリズム。

プロトタイプベースのクラスタリングには、次のようなさまざまなアプローチがあります-

  • オブジェクトは、複数のクラスターに属することができます。さらに、オブジェクトはある程度の重みを持って各クラスターに属します。このような方法は、一部のオブジェクトが同様に複数のクラスタープロトタイプに近いという事実に対処します。

  • クラスターは統計分布としてモデル化されます。つまり、オブジェクトは、平均と分散を含む複数の統計パラメーターによる特徴である統計分布からランダムなフェーズによって生成されます。この視点は、プロトタイプの概念を一般化し、確立された統計的アプローチの必要性を可能にします。

  • クラスターは、一定の関連付けを持つように制約されています。これらの関係は、2つのクラスターが互いに隣接している度合いなどの近隣関係を定義する制約です。クラスタ間の関係を制約することで、データの実行と視覚化を定義できます。

ファジーc-meansは、ファジー論理とファジー集合理論の分野の概念を使用して、K-meansに似ていますが、1つのクラスターにポイントを厳密に割り当てる必要のないクラスタリング設計を提案します。

混合モデルクラスタリングは、クラスターのグループを、クラスターごとに1つずつ、分布の組み合わせとしてモデル化できる方法を採用しています。クラスタリングスキームは、自己組織化マップ(SOM)に依存しており、2次元グリッド構造を含め、クラスターが相互に事前に指定された関連付けを持つ必要がある構造内にクラスタリングを実装します。

ファジークラスタリング −データオブジェクトが十分に独立したセットで分散されている場合、互いに素なクラスターへのオブジェクトの鮮明な記述は理想的な方法のように思われます。ただし、場合によっては、データセット内のオブジェクトを十分に独立したクラスターに分割できないことがあり、オブジェクトを特定のクラスターに割り当てる際に特定の恣意性があります。

2つのクラスターの境界の近くにあるが、そのうちの1つに近いオブジェクトについて考えてみます。場合によっては、すべてのオブジェクトと各クラスターに重みを割り当てて、クラスターの前方にあるオブジェクトの程度を示す方が適切な場合があります。

確率的手法もそのような重みをサポートできます。確率的手法はいくつかの状況で有益ですが、適切な統計モデルを決定するのが複雑な場合があります。一般的に、同じ機能を提供するには、確率的でないクラスタリング手法が必要です。


  1. ドキュメントクラスタリング分析とは何ですか?

    ドキュメントのクラスタリングは、教師なしでファイルを整理するための重要な手法です。ドキュメントが用語ベクトルとして表される場合、クラスタリング手法を適用できます。ドキュメントスペースは、数百から数千に及ぶ大きな次元を持ち続けています。 次元の呪いのために、最初にドキュメントを低次元の部分空間に投影することは理にかなっています。そこでは、ドキュメント空間の意味構造が明確になります。低次元のセマンティック領域では、従来のクラスタリングアルゴリズムを使用できます。 ドキュメントクラスタリング分析にはいくつかの方法があります- スペクトルクラスタリング −スペクトルクラスタリング手法は、最初に元

  2. マルチリレーショナルクラスタリングとは何ですか?

    マルチリレーショナルクラスタリングは、データオブジェクトをクラスターのグループに分割するフェーズであり、複数のリレーションのデータを使用して、それらの類似性に依存します。 CrossClusは、ユーザーガイダンスによる相互関係クラスタリングを表します。これは、物理的な結合を防ぐためにクラスタリングとタプルIDの伝播でユーザーガイダンスを使用する方法を分析するマルチリレーショナルクラスタリングのアルゴリズムです。 マルチリレーショナルクラスタリングの主な課題は、複数の関係にいくつかの属性があり、一般に、それらのごく一部のみが明確なクラスタリングタスクに関連していることです。 学生をクラスター