プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

CLIQUEとは何ですか?


CLIQUEは、高次元領域での次元成長サブエリアクラスタリング用に予測された最初のアルゴリズムでした。次元成長サブエリアクラスタリングでは、クラスタリングプロセスは単一次元の部分空間から始まり、より高次元の部分空間に向かって増加します。

CLIQUEは、グリッドアーキテクチャなどの各次元を分割し、含まれる複数のポイントに基づいてセルが密集しているかどうかを判断するためです。これは、密度ベースとグリッドベースのクラスタリングアプローチの統合と見なすことができます。

CLIQUEクラスタリングアルゴリズムの考え方は次のとおりです-

  • 多次元データポイントの大規模なグループが与えられると、データ領域は一般にデータポイントによって均一に使用されません。 CLIQUEのクラスタリングは、空間(またはユニット)内のまばらな領域と「混雑した」領域を認識し、それによってデータセットの完全な分布パターンを見つけます。

  • ユニットに含まれる合計データポイントの割合が入力モデルパラメータを超える場合、ユニットはソリッドです。 CLIQUEでは、クラスターはリンクされた高密度ユニットの最大グループとして表されます。

CLIQUEは、次の2つのプロセスで多次元クラスタリングを実装します。最初のプロセスでは、CLIQUEは、d次元データ領域を重複しない長方形の単位に分割し、これらの間の密な単位を認識します。これは、各ディメンションに対して(1-Dで)完了します。

学生検索スペースの識別は、相関ルールマイニングで使用されるAprioriプロパティによって異なります。一般に、プロパティは検索エリア内のアイテムに関する事前の知識を使用して、エリアの一部を剪定できるようにします。

CLIQUEのプロパティは次のとおりです。k次元の単位が密集している場合、(k-1)次元の領域での投影も密集しています。つまり、k次元の学生の密な単位が与えられた場合、その(k-1)番目の投影単位をチェックして、密でないものを見つけることができれば、k次元の単位も密にできないことを理解できます。

>

したがって、(k − 1)次元領域にある密な単位から、k次元領域に潜在的または学生の密な単位を作成できます。一般に、検索結果の領域は元の領域よりもはるかに小さくなります。密集したユニットを調べてクラスターを決定します。

2番目のプロセスでは、CLIQUEは次のように各クラスターの最小限の記述を作成します。クラスターごとに、リンクされた高密度ユニットのクラスターをカバーする最大領域を決定します。各クラスターの最小カバー(論理記述)を決定​​します。

CLIQUEは、高密度クラスターを含む最大次元の部分空間がそれらの部分空間に存在することを必然的に発見します。これは一連の入力オブジェクトの影響を受けず、標準的なデータ分散のふりをしません。入力のサイズに比例してスケーリングし、データの複数のディメンションが強化されるため、最高のスケーラビリティを備えています。


  1. ネットワークとは何ですか?

    ネットワークとは、2台以上のコンピューターをリンクして、リソース、ファイル、さらにはインターネット接続を共有する方法です。ほとんどの家庭や職場では、コンピューターを何らかの方法で接続するようにネットワークが設定されていますが、ユーザーは4つの主要なタイプのネットワークを利用できます。 ネットワークの定義は何ですか? ネットワークはかなり広い定義を持つことができます。最も単純な方法では、常に2台以上のコンピューターがケーブルまたはWi-Fi接続を介して物理的にリンクされている必要があります。リンクすることにより、これらのコンピューターは、毎回手動で接続しなくても、リソース、ファイル、または

  2. ワイドエリアネットワーク(WAN)とは何ですか?

    広域ネットワーク 都市、州、国などの広い地理的領域にまたがっています。ビジネスの一部を接続するためにプライベートにすることも、小規模なネットワークを接続するためにパブリックにすることもできます。 WANの仕組み WANを理解する最も簡単な方法は、世界最大のWANであるインターネットについて考えることです。インターネットはWANです。これは、ISPを使用して、多くの小規模なローカルエリアネットワークまたはメトロエリアネットワークを接続するためです。 小規模では、企業はクラウドサービス、本社、およびブランチオフィスで構成されるWANを持っている場合があります。この場合、WANはビジネスのこれ