プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

クラスタリングの方法は何ですか?


クラスタリングには次のようなさまざまな方法があります-

パーティション分割方法 − n個のオブジェクトまたはデータタプルのデータベースが与えられた場合、パーティショニングメソッドは情報のk個のパーティションをアセンブルします。各パーティションはクラスターを定義し、k

  • 各グループには、少なくとも1つのオブジェクトが含まれている必要があります。

  • 各オブジェクトは、正確に1つのグループに適用する必要があります。

構築するパーティションの数であるkが与えられると、パーティショニングメソッドは最初のパーティショニングを行います。次に、オブジェクトをあるグループから別のグループに変換することによってパーティション分割を改善しようとする反復再配置メソッドを使用します。

適切なパーティション分割の一般的な基準は、同じクラスター内のオブジェクトが「近い」または相互に関連付けられているのに対し、異なるクラスターのオブジェクトは「遠い」または非常に異なることです。パーティションの品質を決定するための他の基準にはいくつかの種類があります。

階層的手法 −階層的メソッドは、指定されたデータオブジェクトのセットの階層的分解を生成します。階層的方法は、階層的分解がどのように生成されるかに応じて、凝集型または分割型のいずれかに分類できます。凝集的アプローチは、「ボトムアップ」アプローチとしても知られています。

各オブジェクトが独立したグループを形成することから始めることができます。すべてのグループが1つ(階層の最上位レベル)に結合されるまで、または終了条件が成立するまで、互いに近いオブジェクトまたはグループを連続して結合します。分割アプローチは、「トップダウン」アプローチとも呼ばれます。同じクラスター内のすべてのオブジェクトから開始できます。連続する各反復で、クラスターは小さなクラスターに分割され、最終的には各オブジェクトが1つのクラスターに含まれるか、終了条件が成立するまで続きます。

密度ベースの方法 −一部のパーティショニング方法は、オブジェクト間の距離に基づいてオブジェクトをクラスター化します。このような方法では、球形のクラスターしか検出できず、任意の形状のクラスターを見つけるのが困難になります。他のクラスタリング手法は、密度の概念に基づいて作成されています。

DBSCANは、密度のしきい値に従ってクラスターを増やす典型的な密度ベースの方法です。 OPTICSは、自動でインタラクティブなクラスター分析のために、拡張されたクラスタリングの順序を評価する密度ベースの方法です。

グリッドベースのメソッド −グリッドベースの方法は、オブジェクト空間をグリッドアーキテクチャを形成する有限数のセルに量子化します。一部のクラスタリング操作は、グリッドアーキテクチャ(つまり、量子化された空間)に実装されます。

このアプローチの利点は、処理時間が短いことです。これは通常、データオブジェクトの数に依存せず、量子化された空間の各次元のセルの数にのみ依存します。 STINGは、グリッドベースのメソッドのインスタンスです。 CLIQUEとWave-Clusterは、グリッドベースと密度ベースの2つのクラスタリングアルゴリズムです。

モデルベースのメソッド −モデルベースの方法では、クラスターごとにモデルを仮定し、特定のモデルにレコードが最もよく適合することを発見します。モデルベースのアルゴリズムは、データポイントの空間分布を反映する密度関数を作成することにより、クラスターを見つけることができます。また、標準統計に基づいてクラスターの数を自動的に決定し、「ノイズ」または外れ値を考慮に入れて、ロバストクラスタリング手法を生成する方法にもつながります。


  1. Cトークンとは何ですか?

    Cプログラムは命令のコレクションであり、各命令は個々のユニットのコレクションです。 Cプログラムのすべての小さな個々のユニットは一般にトークンと呼ばれ、Cプログラムのすべての命令はトークンのコレクションです。 トークンはCプログラムを構築するために使用され、Cプログラムの基本的な構成要素とも言われています。 Cプログラムでは、トークンには次のものが含まれます- キーワード 識別子 オペレーター 特別な記号 定数 文字列 データ値 Cプログラムでは、これらすべてのキーワード、識別子、演算子、特殊記号、定数、文字列、およびデータ値の集合をトークンと呼びます。 例 以下は、大文字のアル

  2. C#のコメントは何ですか?

    コメントはコードの説明に使用されます。コンパイラはコメントエントリを無視します。 C#プログラムの複数行コメントは、以下に示すように/ *で始まり、文字*/で終わります。 複数行のコメント /* The following is a mult-line comment In C# /* /*...*/はコンパイラによって無視され、プログラムにコメントを追加するために配置されます。 1行のコメント // variable int a = 10; 以下は、単一行コメントと複数行コメントを追加する方法を示すサンプルC#プログラムです- 例 using System; namespace Dem