プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

高次元データから部分空間クラスターを見つけるにはどうすればよいですか?


部分空間検索手法、相関ベースのクラスタリング手法、バイクラスタリング手法など、いくつかの方法が3つの主要なグループに分類されています。

部分空間検索手法 −部分空間検索メソッドは、クラスターのいくつかの部分空間を検索します。したがって、クラスターは、部分空間で互いに同じであるオブジェクトのサブセットです。類似性は、距離や密度などの従来の測定によって取得されます。

たとえば、CLIQUEアルゴリズムは部分空間クラスタリング手法です。次元が増加する系列の部分空間とそれらの部分空間のクラスターを指定でき、非単調性を使用して、クラスターが継続できない部分空間を剪定します。部分空間検索手法が直面するより大きな課題は、部分空間のシーケンスを効果的に検索する方法です。

方法は次の2種類があります-

  • ボトムアップ法は、低次元の部分空間から開始し、それらのより大きな次元にクラスターが存在する可能性がある場合にのみ、高次元の部分空間を検索します。検索する必要のある複数の高次元部分空間を減らすために、いくつかの剪定アプローチが分析されます。 CLIQUEは、ボトムアップアプローチのインスタンスです。

  • トップダウン法は、完全な空間から始まり、ますます小さな部分空間を再帰的に検索します。トップダウン法は、局所性の仮定が影響を与える場合にのみ効率的であり、クラスターの部分空間は局所的な近傍によって決定できる必要があります。

相関ベースのクラスタリング手法 −部分空間検索方法は、距離や密度などの従来のメトリックを使用して計算された類似性を持つクラスターを検索しますが、相関ベースの方法では、高度な相関モデルによって表されるクラスターを見つけることができます。

PCAベースのアプローチでは、最初にPCA(主成分分析)を使用して、相関のない新しいディメンションのセットを変更し、新しいスペースまたはそのサブスペースでクラスターをマイニングします。さらに、PCA、ハフ変換やフラクタル次元など、他の空間変換を使用できます。

バイクラスタリング手法 −一部のアプリケーションでは、オブジェクトと属性の両方を同時にクラスター化する必要があります。結果のクラスターはバイクラスターと呼ばれ、次の4つの要件を満たします-

  • これは、クラスター内で実行されるオブジェクトの小さなグループにすぎません。

  • クラスタには少数の属性しか含まれていません。

  • オブジェクトは複数のクラスターに参加することも、クラスターに参加しないこともできます。

  • 属性は複数のクラスターに含めることも、どのクラスターにも含めないこともできます。

遺伝子発現データを探索するための要件に対処するために、バイクラスタリング手法が最初に推奨されました。遺伝子は、生きている構造からその子孫への形質の受け渡しのシステムです。一般的に、遺伝子はDNAのセグメントで構成されています。

遺伝子はいくつかのタンパク質と機能的なRNA鎖を定義するため、すべての生物にとって重要です。それらはデータに影響を与えて、生物の細胞を構築およびサポートし、遺伝的特性を子孫に渡します。

遺伝子型は、細胞、生物、または個人の遺伝的構成です。表現型は生物の明らかな特徴です。遺伝子発現は、遺伝子型が表現型を引き起こすという点で、遺伝学における重要なレベルです。


  1. データをバックアップするにはどうすればよいですか?

    今日の IT の世界では、包括的なバックアップ戦略を持つことが不可欠です。データが失われる方法は非常に多いため、不快な状況に直面しないためには、データを正常にバックアップする方法を理解することが重要です。では、どのようにデータをバックアップできますか? データ損失 サイバー攻撃、不正な従業員、自然災害、メディアの損傷、および人的エラーは、データを失う可能性があるいくつかの方法にすぎません.データを失うことは、個人にとっては迷惑で悲痛なことかもしれませんが、組織にとっては、その影響は取り返しのつかないものになる可能性があります. Consoltech のこれらの恐ろしい数字のいくつかを以下で見

  2. Bing で Microsoft Search を使用して作業データを検索する方法

    Microsoft の Bing は、単に Web を検索するだけではありません。また、ファイル、連絡先、会話など、組織内の結果を表示することもできます。情報は Bing 検索バー内に表示されます。 この機能を使用するには、職場または学校のアカウントで Bing にサインインする必要があります。サインインしても説明されている機能が表示されない場合は、組織で Microsoft Search が有効になっていない可能性があります。ユーザーがシステムを利用できるようにするのは、管理者次第です。 サインインすると、Bing ホームページに 組織の最新情報 バナーが表示されます。これにより、S