プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

グラフベースのクラスタリングのアプローチは何ですか?


物理オブジェクトまたは抽象オブジェクトのセットを同じオブジェクトのクラスに結合するプロセスは、クラスタリングと呼ばれます。クラスターは、同じクラスター内で互いに同じであり、他のクラスター内のオブジェクトとは異なるデータオブジェクトのセットです。データオブジェクトのクラスターは、複数のアプリケーションで1つのグループとしてまとめて考えることができます。クラスター分析は人間にとって不可欠な活動です。

クラスタリングは、外れ値の識別をサポートします。同じ値がクラスターに編成され、クラスターの外にある値は外れ値と呼ばれます。クラスタリング手法では、データタプルをオブジェクトと見なします。それらは、オブジェクトをグループまたはクラスターに分割して、クラスター内のオブジェクトが互いに「類似」し、他のクラスター内のオブジェクトと「非類似」になるようにします。これは通常、距離関数に基づいて、オブジェクトが空間内でどれだけ「近い」かという観点から定義されます。

グラフベースのクラスタリングには、次のようなさまざまなアプローチがあります-

近接グラフをスパース化して、オブジェクトとその最近傍とのリンクのみを維持します。このスパース化は、ノイズと外れ値の管理に役立ちます。また、まばらなグラフ用に作成された非常に効果的なグラフ分割アルゴリズムの使用を可能にします。

これは、送信するいくつかの最近傍に基づいて、2つのオブジェクト間の類似度を表すことができます。オブジェクトとその最近傍が一般に同じクラスに属するという観察に依存するこの方法は、高次元性と密度が変化するクラスターの問題を克服するのに役立ちます。

コアオブジェクトを表し、それらの周りにクラスターを開発できます。グラフベースのクラスタリングでは、近接グラフまたはスパース化された近接グラフに基づく密度ベースの概念を導入することが不可欠です。 DBSCANと同様に、コアオブジェクトを中心にクラスターを開発すると、さまざまな形状とサイズのクラスターを検出できるクラスタリングアプローチが実現します。

近接グラフのデータを使用して、2つのクラスターを組み合わせる必要があるかどうかのより高度な計算をサポートできます。特に、2つのクラスターは、結果のクラスターが最初の2つのクラスターと同じ特性を持つ場合にのみ結合されます。

まず、近接グラフのスパース化について説明し、単一接続クラスタリングアルゴリズムと同じMSTやOpossumなど、クラスタリングの方法がこのアプローチに基づいている2つの手法をサポートします。

クラスターを組み合わせる必要があるかどうかを判断するために自己相似性の概念を必要とする階層的クラスタリングアルゴリズム。これは、共有最近傍(SNN)類似性(新しい類似性測度)を定義し、この類似性を必要とするJarvis-Patrickクラスタリングアルゴリズムを学習します。


  1. 制約付きのクラスタリングの方法は何ですか?

    特定の制約を処理するには、さまざまな手法が必要です。次のようなハード制約とソフト制約の処理の一般原則- 厳しい制約の処理 −難しい制約を処理するための一般的な方法は、クラスター割り当て手順で制約を厳密に考慮することです。データセットと例の制約のグループ(つまり、リンクする必要がある制約またはリンクできない制約)が与えられた場合、そのような制約を満たすためにk-meansアプローチをどのように開発できますか? COP-kmeansアルゴリズムは次のように機能します- リンクが必要な制約のスーパーインスタンスを生成する −リンクが必要な制約の推移閉包を計算できます。したがって、すべてのリンクし

  2. 情報セキュリティモデルのアプローチは何ですか?

    セキュリティモデルは、セキュリティポリシーを分析および実施するために使用できるコンピュータモデルです。事前の形成は必要なく、アクセス権モデルまたは検査コンピューティングモデルまたは計算モデルで編成できます。 セキュリティモデルは、セキュリティポリシーが作成されるメカニズムです。このセキュリティポリシーの開発は、ポリシーの明確な設定または例に規制されています。 セキュリティポリシーは認証に依存しますが、セキュリティモデルの範囲内で構築されます。たとえば、認証と承認に依存するセキュリティモデルを設計しています。認証、承認、可用性、信頼性など、セキュリティの4要素モデルを検討できます。 セキュ