プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

概念クラスタリングとは何ですか?


概念クラスタリングは、機械学習におけるクラスタリングの形式であり、ラベル付けされていないオブジェクトのセットが与えられると、オブジェクトの分類設計を行います。一般に同様のオブジェクトのグループを識別する従来のクラスタリングとは異なり、概念クラスタリングは、各グループが概念またはクラスを定義する各グループの特性定義も検出することにより、さらに一歩進んでいます。

したがって、概念的なクラスタリングは2段階のプロセスです。クラスタリングが最初に実装され、次に特性評価が行われます。したがって、クラスタリングの品質は、単一のオブジェクトのサービスだけではありません。概念クラスタリングのほとんどの手法は、概念またはクラスターを決定する際に確率測定を使用する統計的手法を採用しています。

確率的記述は、一般に、派生した各概念を定義するために使用されます。COBWEBは、インクリメンタル概念クラスタリングの有名で単純な方法です。その入力オブジェクトは、カテゴリ属性と値のペアによって定義されます。 COBWEBは、分類ツリーの形式で階層的クラスタリングを作成します。

分類ツリーは決定木とは異なります。分類ツリーの各ノードは概念を定義し、その概念の確率的記述を含みます。これは、ノードの下で分類されたオブジェクトを要約したものです。確率的記述には、概念の確率が含まれ、form $ P(A_ {i} =v_ {ij} | C_ {k})$の条件付き確率は属性と値のペア(i th )です。 属性はj 番目 を取ります 可能な値)およびC k はコンセプトクラスです。

COBWEBは、カテゴリユーティリティと呼ばれるヒューリスティック評価尺度を使用して、ツリーの構築をガイドします。カテゴリユーティリティ(CU)は次のように定義されます

$$ \ frac {\ sum_ {k =1} ^ {n} P(C_ {k})\ left [\ sum_ {i} \ sum_ {j} P(A_ {i} =v_ {ij} | C_ { k})^ {2}-\ sum_ {i} \ sum_ {j} P(A_ {i} =v_ {ij})^ {2} \ right]} {n} $$

ここで、nは、パーティションを形成するノード、概念、または「カテゴリ」の数、{C 1 、C 2 、...、C n }、ツリーの特定のレベルで。言い換えると、カテゴリ効用は、パーティションが与えられた場合に完全に推測できる属性値の期待数の増加です(この期待値は用語$ P(C_ {k})\ sum_ {i} \ sum_ {jに対応します) } P(A_ {i} =v_ {ij} | C_ {k})^ {2} $そのような知識がない場合の正しい推測の予想数(用語$ \ sum_ {i} \ sum_ {j}に対応) P(A_ {i} =v_ {ij})^ {2} $。派生を表示する余地はありませんが、カテゴリユーティリティはクラス内の類似性とクラス間の非類似性に報酬を与えます。ここで-

クラス内の類似性 −これは確率$ P(A_ {i} =v_ {ij} | C_ {k})$です。この値が高いほど、この属性と値のペアを共有するクラスメンバーの割合が高くなり、クラスメンバーのペアの予測可能性が高くなります。

クラス間の非類似性 −これは確率$ P(C_ {k} | A_ {i} =v_ {ij})$です。この値が高いほど、この属性と値のペアを共有する対照的なクラスのオブジェクトが少なくなり、ペアのクラスの予測性が高くなります。

COBWEBは、適切なパスに沿ってツリーを下降し、途中でカウントを更新し、オブジェクトを定義する「最適なホスト」またはノードを検索します。この決定は、各ノードでオブジェクトを一時的に配置し、結果のパーティションのcategoryutilityを評価することに依存します。カテゴリユーティリティが最も高くなる配置は、オブジェクトに最適なホストである必要があります。


  1. C#のオブジェクトとは何ですか?

    他のオブジェクト指向言語と同様に、C#にもオブジェクトとクラスがあります。オブジェクトは、実世界のエンティティであり、クラスのインスタンスです。オブジェクトを使用してクラスのメンバーにアクセスします。 クラスメンバーにアクセスするには、オブジェクト名の後にドット(。)演算子を使用する必要があります。ドット演算子は、オブジェクトの名前をメンバーの名前にリンクします(例:)。 Box b1 = new Box(); 上に、Box1がオブジェクトであることがわかります。メンバーにアクセスするために使用します- b1.height = 7.0; メンバー関数を呼び出すためにも使用できます- b1

  2. Pythonで不変とは何ですか?

    Pythonは、オブジェクトのさまざまなデータ型を定義します。これらのオブジェクトはメモリに保存されます。一部のオブジェクトの内容は、作成後に変更できますが、他のオブジェクトは変更できません。整数、浮動小数点、複素数などの数値オブジェクトがメモリを占有し、メモリの内容を変更することはできません。このようなオブジェクトは不変と呼ばれます。文字列オブジェクトと辞書オブジェクトも不変です。タプルも不変です。ただし、リストオブジェクト内のアイテムはリスト内で変更、削除、または追加できるため、リストオブジェクトは変更可能です。