頻繁なパターンマイニングの基準は何ですか?
頻繁なパターンマイニングには、次のようないくつかの基準があります-
マイニングされるパターンの完全性に基づく −最小のサポートしきい値を提供することで、頻繁なアイテムセット、閉じた頻繁なアイテムセット、および最大の頻繁なアイテムセットのコレクション全体をマイニングできます。
また、制約付きの頻繁なアイテムセット(ユーザー定義の制約のコレクションを満たすことができます)、おおよその頻繁なアイテムセット(マイニングされた頻繁なアイテムセットのおおよそのサポート数のみを変更できます)、ほぼ一致する頻繁なアイテムセット(サポート数をカウントできます)を抽出することもできます比較的一致するアイテムセットの)、上位k個の頻繁なアイテムセット(つまり、ユーザー指定の値kに対するk個の最も頻繁なアイテムセット)など。
マイニングされるパターンの整合性に関して複数の要件を持つ可能性のあるアプリケーションがいくつかあり、さまざまな計算や最適化アプローチにつながる可能性があります。
ルールセットに含まれる抽象化のレベルに基づく −相関ルールマイニングには、複数の抽象化レベルでルールを検出できるいくつかの方法があります。たとえば、マイニングされた相関ルールのグループに次のルールが含まれているとします。ここで、Xは顧客を定義する変数です-
Buys(X、「コンピューター」)⇒buys(X、「HPプリンター」)
Buys(X、「ラップトップコンピューター」)⇒buys(X、「HPプリンター」)
ルールに含まれるデータディメンションの数に基づく −アソシエーションルールのアイテムまたは属性が1つのディメンションのみを参照している場合、それは1次元のアソシエーションルールです。
ルールで処理される値のタイプに基づく −ルールにアイテムの有無の関連付けが含まれている場合、それはブール相関ルールです。ルールが定量的アイテムまたは属性間の相関を定義する場合、それは定量的相関ルールです。これらのルールでは、アイテムまたは属性の数量値は間隔に分けられます。
マイニングするルールの種類に基づく −頻繁なパターン分析により、いくつかの種類のルールとさまざまな興味深い関係が作成される可能性があります。アソシエーションルールは、頻繁なパターンから生成される有名な種類のルールです。
マイニングするパターンの種類に基づく −複数の種類のデータセットから、いくつかの種類の頻繁なパターンをマイニングできます。主なターゲットは、頻繁なアイテムセットのマイニング、つまり、トランザクションまたはリレーショナルデータセットからの頻繁なアイテムセット(アイテムのセット)のマイニングです。
シーケンシャルパターンマイニングは、シーケンスデータセット内の頻繁なサブシーケンスを検索します。ここで、シーケンスデータはイベントの順序です。たとえば、シーケンシャルパターンマイニングを使用すると、アイテムが一般的に購入されるシリーズを調査できます。たとえば、ユーザーは最初にPCを購入し、次にデジタルカメラを購入し、次にメモリカードを購入する傾向があります。
-
Webマイニングのアプリケーションは何ですか?
Webマイニングは、データマイニング技術を使用して、Webベースのレコードとサービス、サーバーログ、およびハイパーリンク。 Webマイニングは、データをグループ化して分析し、重要な洞察を受け取ることで、Web情報のデザインを発見することを目的としています。 Webマイニングは、適応されたデータマイニング手法をWebに適用するものと広く見なすことができますが、データマイニングは、知識発見プロセスに固定されたほとんどの構造化データのパターンを見つけるためのアルゴリズムのアプリケーションとして表されます。 ウェブマイニングには次のようなさまざまなアプリケーションがあります- Webマイニング
-
パターンマイニングのアプリケーションは何ですか?
パターンマイニングには、次のようなさまざまなアプリケーションがあります- パターンマイニングは、一般に、いくつかのデータ集約型アプリケーションでの前処理として、ノイズフィルタリングとデータクリーニングに使用されます。たとえば、数万の次元(たとえば、遺伝子の記述)を含むマイクロアレイデータを探索するために使用できます。 パターンマイニングは、データに隠された固有のメカニズムとクラスターの発見を提供します。たとえば、DBLPデータセットを考えると、頻繁なパターンマイニングでは、共著者クラスター(一般的に共同作業を行う著者を決定する)や会議クラスター(複数の著者と用語の共有を決定する)などの興味