プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データマイニングにおけるクラスタリングの種類は何ですか?


クラスタリングには次のようなさまざまなタイプがあります-

階層型とパーティション型 −いくつかのタイプのクラスタリング間の認識は、クラスターのセットがネストされているかネストされていないか、または一般的な用語では階層的またはパーティション的であるかどうかです。パーティションクラスタリングとは、データオブジェクトのグループを重複しないサブセット(クラスター)に分散することであり、すべてのデータオブジェクトが真に1つのサブセットに含まれます。

クラスターにサブクラスターを持たせることができるため、ツリーとして割り当てられるネストされたクラスターのグループである階層的クラスタリングが必要です。ツリー内のすべてのノード(クラスター)(リーフノードを除く)はその子(サブクラスター)の和集合であり、ツリーのルートはすべてのオブジェクトを含むクラスターです。

排他的vs重複vsFizzy −クラスタリングは、個々のクラスターに対して各オブジェクトを作成するため、すべて排他的です。ポイントを複数のクラスターの上位に配置できる位置はいくつかありますが、これらの状況は、非排他的クラスタリングによって対処するのに優れています。

この方法では、重複または非排他的なクラスタリングは、オブジェクトが複数のグループ(クラス)に属することができるという事実に従うことができます。たとえば、大学の人は、大学の登録候補者と従業員の両方になることができます。

ファジークラスタリングでは、各オブジェクトは、メンバーシップの重みが0(カテゴリに適用されない)から1(カテゴリに適用される)の間の各クラスターに適用されます。言い換えると、クラスターはファジー集合と見なされます。

完全対部分 −完全なクラスタリングでは各オブジェクトがクラスターに作成されますが、部分的なクラスタリングでは作成されません。部分的なクラスタリングの理由は、データセット内の一部のオブジェクトがクリアグループに属することができないためです。データセット内のオブジェクトは、ノイズ、外れ値、または「興味のない背景」を定義することが何度かあります。たとえば、一部の新聞記事は地球温暖化を含む共通のデザインを共有できますが、異なる記事はより普遍的または他に類を見ないものです。

したがって、先月のストーリーで重要なトピックを見つけることができ、共通のテーマでほとんど接続されていないドキュメントのクラスターのみを検索する必要があります。場合によっては、オブジェクトのクラスタリング全体が取得されます。たとえば、すべてのファイルを閲覧できるようにするには、閲覧用にファイルを整理するためにクラスタリングが必要なアプリケーションが必要です。


  1. データマイニングの外れ値の種類は何ですか?

    データマイニングにはさまざまな種類の外れ値があります- グローバル外れ値 −特定のデータセットでは、データオブジェクトが他の情報セットから本質的に逸脱している場合、そのデータオブジェクトはグローバルな外れ値です。グローバル外れ値はポイント異常として知られており、最も簡単なタイプの外れ値です。ほとんどの外れ値の検出方法は、グローバルな外れ値を発見することを目的としています。 グローバルな外れ値を特定できます。重要な問題は、問題のアプリケーションに関する偏差の適切な測定値を見つけることです。いくつかの測定値が提案されており、これらに応じて、外れ値の検出アプローチは複数のカテゴリに分割されます。

  2. データの整合性の種類は何ですか?

    データベースの整合性は、格納された情報の有効性と整合性を定義します。整合性は、一般に、データベースが違反することを許可されていない整合性ルールである制約の観点から定義されます。制約は、各属性に適用することも、テーブル間の関係に適用することもできます。 整合性制約により、許可されたユーザーがデータベースに加えた変更(更新の削除、挿入)によってデータの整合性が失われることはありません。したがって、整合性制約はデータベースへの偶発的な損傷を防ぎます。 データの整合性には、次のようなさまざまなタイプがあります- 論理的整合性 −リレーショナルデータベースでは、論理的な一貫性により、いくつかの