プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

アソシエーションルールクラスタリングシステムに含まれる手順は何ですか?


相関ルールクラスタリングシステムには、次の手順が含まれます-

ビニング −定量的属性は、そのドメインを表す幅広い値を持つことができます。年齢と収入を軸としてプロットできれば、2次元グリッドの大きさを考えることができます。ここで、年齢のすべての可能な値が1つの軸上の特定の位置に作成され、同じように、収入のすべての可能な値が特定の位置に作成されました。もう一方の軸上の位置。

グリッドを管理可能なサイズまで維持でき、代わりに定量的属性の領域を間隔に分割できます。これらの間隔は、マイニングフェーズで組み合わせることができるという点で強力です。パーティショニングフェーズはビニングとして定義されます。つまり、間隔は「ビン」として扱われます。

次の3つの一般的なビニング戦略領域があります-

等幅ビニング −各ビンの間隔サイズが同じである等幅ビニング。

等周波数ビニング −等頻度のビニングでは、各ビンにほぼ同じ数のタプルが割り当てられます。

クラスタリングベースのビニング −クラスタリングベースのビニングでは、定量的属性に対してクラスタリングが実行され、隣接するポイント(さまざまな距離測度に基づいて判断されます)が同じビンにグループ化されます。

ARCSには、等幅のビニングが必要です。このビニングでは、すべての定量属性のビンサイズがユーザーによって入力されます。両方の定量的属性を含むすべての可能なビンの組み合わせの2次元配列が生成されます。

すべての配列セルは、ルールの右側のカテゴリ属性の達成可能な各クラスの対応するカウント分布に影響を与えます。このデータ構造を作成することにより、タスク関連のデータを1回スキャンするだけで済みます。同じ2次元配列を使用して、同じ2つの量的属性に依存する、カテゴリ属性の値のルールを作成できます。

頻繁な述語セットの検索 −すべてのカテゴリのカウント分布を含む2次元配列が設定されているため、スキャンして、最小の信頼度も満たす頻繁な述語セット(最小のサポートを満たすもの)を見つけることができます。

アルゴリズムはグリッドをチェックし、ルールの長方形のクラスターを探します。この方法では、ルールクラスター内に表示される量的属性のビンを組み合わせることができるため、量的属性の動的な離散化が表示されます。

グリッドベースの方法では、元の相関ルールを長方形の領域にクラスター化できると説明されています。クラスタリングを実装する前に、平滑化方法を使用して、レコードからノイズと外れ値を削除できます。長方形のクラスターは、情報を単純化しすぎる可能性があります。

非グリッドベースのアプローチは、より一般的な定量的相関ルールを発見するために推奨されています。このルールでは、ルールのいずれかの側でいくつかの定量的およびカテゴリ属性が発生する可能性があります。

このアプローチでは、定量的属性は同じ頻度のビニングを使用して動的に分離され、パーティションは部分的な完全性の尺度に依存して結合されます。これにより、パーティション化によって失われたデータが定量化されます。


  1. Javaプログラムを実行するために必要なさまざまな手順は何ですか?

    Javaプログラムの実行は、5つの主要なステップに従います 編集-ここでは、プログラマーは単純なエディターまたはメモ帳アプリケーションを使用してJavaプログラムを作成し、最後に「.java」拡張子を付けます。 コンパイル-このステップでは、プログラマーがjavacコマンドを実行し、.javaファイルがJava仮想マシンによって理解される言語であるバイトコードに変換されます(これにより、Javaプラットフォームが独立した言語になります)。このステップでは、コンパイル時のエラーが発生します。 ロード-次に、プログラムがメモリにロードされます。これは、バイトコードを含む.classファイルを取得

  2. OSのカーネルとは何ですか?カーネルの種類は何ですか?

    すべてのオペレーティングシステム(Windows、Mac、Linux、Android)には、カーネルと呼ばれるコアプログラムがあります。 これは、システム全体の「ボス」として機能します。それがOSの心臓部です!カーネルは、他のすべてを制御するコンピュータプログラムに他なりません。コンピューターで発生することはすべてそれを通過します。この投稿では、OSのカーネルとは何か、およびさまざまな種類のカーネルについて説明します。 OSのカーネルとは OSのコアプログラムであることがわかったので、ブートローダーの後にロードされる最初のプログラムでもあることも知っておく必要があります。次に、ハードウェアと