閉じた頻繁なアイテムセットをどのようにマイニングできますか?
ナイーブなアプローチでは、頻繁なアイテムセットの完全なセットをマイニングしてから、現在の頻繁なアイテムセットの適切なサブセットである各頻繁なアイテムセットを削除し、同様のサポートを提供できます。
この方法では、2 100 を導き出すことができます。 -長さを取得するための1つの頻繁なアイテムセット-100の頻繁なアイテムセット。すべて、冗長なアイテムセットの削除を開始する前に。推奨される手法は、マイニングフェーズ中にクローズされた頻繁なアイテムセットを正確に検索することです。これには、マイニング中に閉じたアイテムセットの方法を特定できるようになり次第、検索領域を整理する必要がありました。次のようなさまざまな剪定戦略があります-
アイテムのマージ −頻繁なアイテムセットXを含む各トランザクションにアイテムセットYが含まれているが、Yの適切なスーパーセットが含まれていない場合、X∪Yは頻繁に閉じられたアイテムセットを形成し、Xを含むがYを含まないアイテムセットを検索する必要はありません。
>サブアイテムセットの剪定 −頻繁なアイテムセットXが、以前に検出された頻繁に閉じられたアイテムセットYの適切なサブセットであり、support_count(X)=support_count(Y)である場合、Xおよびセット列挙ツリー内のXのすべての子孫は、頻繁に閉じられたアイテムセットになることはできません。剪定。
アイテムのスキップ −クローズドアイテムセットの深さ優先マイニングでは、すべてのレベルで、ヘッダーテーブルと投影されたデータベースに関連するプレフィックスアイテムセットXが存在する可能性があります。ローカルの頻繁なアイテムpが、複数のレベルの複数のヘッダーテーブルで同様のサポートを持っている場合、より大きなレベルのヘッダーテーブルからpを安全に削除できます。
新しい頻繁なアイテムセットが変更された場合、次の2種類のクロージャチェックを実装することが不可欠です-
-
スーパーセットチェック −この新しい頻繁なアイテムセットが、同様のサポートを備えた、以前に見つかったクローズドアイテムセットのスーパーセットであるかどうかをテストできます。
-
サブセットチェック −新しく検出されたアイテムセットが、同様のサポートを持つ以前に検出された閉じたアイテムセットのサブセットであるかどうかをテストできます。
分割統治構造の下でアイテムマージプルーニング手法を採用できます。その後、スーパーセットテストが実際に組み込まれ、スーパーセットチェックを明示的に実装する必要はありません。これは、頻繁なアイテムセットX∪YがアイテムセットXよりも後で検出され、Xと同様のサポートを備えている場合、Xの投影データベースにあり、アイテムセットのマージ中に生成されている必要があるためです。
サブセットのチェックに役立ちます。圧縮されたパターンツリーを構築して、マイニングされた閉じたアイテムセットのセットをサポートできます。パターンツリーのメカニズムはFPツリーと同じですが、検出されたすべての閉じたアイテムセットが対応するツリーブランチに明示的に保存される点が異なります。
-
データをバックアップするにはどうすればよいですか?
今日の IT の世界では、包括的なバックアップ戦略を持つことが不可欠です。データが失われる方法は非常に多いため、不快な状況に直面しないためには、データを正常にバックアップする方法を理解することが重要です。では、どのようにデータをバックアップできますか? データ損失 サイバー攻撃、不正な従業員、自然災害、メディアの損傷、および人的エラーは、データを失う可能性があるいくつかの方法にすぎません.データを失うことは、個人にとっては迷惑で悲痛なことかもしれませんが、組織にとっては、その影響は取り返しのつかないものになる可能性があります. Consoltech のこれらの恐ろしい数字のいくつかを以下で見
-
ウイルス対策で PC を高速化する方法
多くのユーザーは、アンチウイルスが PC の速度を低下させる可能性があると誤解しています。はい、ウイルス対策によって PC の速度が低下するケースはほとんどありません。これについては、このブログで後ほど説明します。アンチウイルスが PC の速度を低下させたとしても (少し)、PC を包括的にスキャンして脅威を検出し、脅威を未然に防ぐことができます。しかし、全体として、ウイルス対策は PC のパフォーマンスを向上させるのに役立ちます。 優れた有料および無料のウイルス対策がいくつかあります そこに。このブログでは、入手可能な最高のアンチウイルスの 1 つである Systweak Antiviru