プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

マルチリレーショナルクラスタリングとは何ですか?


マルチリレーショナルクラスタリングは、データオブジェクトを類似性に基づいてクラスターのセットに分割し、複数のリレーションの情報を利用するプロセスです。このセクションでは、CrossClus(ユーザーガイダンスを使用したクロスリレーショナルクラスタリング)を紹介します。これは、物理的な結合を回避するためにクラスタリングとタプルIDの伝播でユーザーガイダンスを利用する方法を探るマルチリレーショナルクラスタリングのアルゴリズムです。

マルチリレーショナルクラスタリングには1つの大きな課題があります。それは、さまざまな関係にある属性が多すぎることです。通常、特定のクラスタリングタスクに関連する属性はごく一部です。

コンピュータサイエンス部門のデータベースについて考えてみましょう。学生をクラスター化するように注文できます。属性は、学生が受講したコース、学生の出版物、アドバイザー、学生の研究グループなど、情報のさまざまな側面をカバーします。

ユーザーは通常、情報の特定の側面を使用して学生をクラスタリングすることに関心があります(たとえば、研究分野ごとに学生をクラスタリングします)。多くの場合、ユーザーはアプリケーションの要件とデータのセマンティクスをよく理解しています。したがって、単純なクエリの構造でのユーザーの管理は、高次元のマルチリレーショナルクラスタリングの効率と品質を向上させるために使用できます。

CrossClusは、ターゲットリレーションと1つ以上の関連属性を含むユーザークエリを受け入れます。これらの属性は、ユーザーのクラスタリング目標を一緒に指定します。 CrossClusは、マルチリレーショナル属性を定義します。マルチリレーショナル属性A’は、結合パスR tによって定義されます。 ⋈R1 …。 ⋈Rk 属性Rk 。 R kのA 、および場合によっては集計演算子(平均、カウント、最大など)。

A'は正式には[A'で表されます。参加パス、A’.attr、A’ .aggr]、ここでA’。 aggrはオプションです。マルチリレーショナル属性A’は、R k であるかどうかに応じて、カテゴリの特徴または数値の特徴のいずれかです。 。 Aはカテゴリまたは数値です。 A’がカテゴリ機能である場合、ターゲットタプルtの場合、t。 A’は、R kのタプル間の値の分布を表します tと結合可能です。

マルチリレーショナルクラスタリングプロセスでは、CrossClusは複数のリレーションにわたって適切な属性を検索する必要があります。 CrossClusは、検索プロセスにおける2つの主要な課題に対処する必要があります。まず、ターゲット関係R t 、は通常、多くの異なる結合パスを介して、各非ターゲット関係Rと結合でき、Rの各属性はマルチリレーショナル属性として使用できます。

この巨大な検索スペースで徹底的な検索を実行することは不可能です.2番目に、膨大な数の属性の中には、ユーザークエリに関連するものもあります(たとえば、学生のアドバイザーは彼女の研究領域に関連しています)が、他の多くは無関係です(例:生徒のクラスメートの個人情報)


  1. ドキュメントクラスタリング分析とは何ですか?

    ドキュメントのクラスタリングは、教師なしでファイルを整理するための重要な手法です。ドキュメントが用語ベクトルとして表される場合、クラスタリング手法を適用できます。ドキュメントスペースは、数百から数千に及ぶ大きな次元を持ち続けています。 次元の呪いのために、最初にドキュメントを低次元の部分空間に投影することは理にかなっています。そこでは、ドキュメント空間の意味構造が明確になります。低次元のセマンティック領域では、従来のクラスタリングアルゴリズムを使用できます。 ドキュメントクラスタリング分析にはいくつかの方法があります- スペクトルクラスタリング −スペクトルクラスタリング手法は、最初に元

  2. マルチリレーショナルクラスタリングとは何ですか?

    マルチリレーショナルクラスタリングは、データオブジェクトをクラスターのグループに分割するフェーズであり、複数のリレーションのデータを使用して、それらの類似性に依存します。 CrossClusは、ユーザーガイダンスによる相互関係クラスタリングを表します。これは、物理的な結合を防ぐためにクラスタリングとタプルIDの伝播でユーザーガイダンスを使用する方法を分析するマルチリレーショナルクラスタリングのアルゴリズムです。 マルチリレーショナルクラスタリングの主な課題は、複数の関係にいくつかの属性があり、一般に、それらのごく一部のみが明確なクラスタリングタスクに関連していることです。 学生をクラスター