プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

Aprioriベースのマイニングの効率をさらに向上させるにはどうすればよいですか?


次のように、元のアルゴリズムの効率を開発することを目標とする、予測されたAprioriアルゴリズムのいくつかのバリエーションがあります-

ハッシュベースの手法(アイテムセットを対応するバケットにハッシュする) −ハッシュベースの手法を使用して、候補のkアイテムセットC kのサイズを小さくすることができます。 、k> 1の場合。たとえば、データベース内の各トランザクションをスキャンして、頻繁な1アイテムセットを作成する場合、L 1 、候補1-C 1のアイテムセットから 、トランザクションごとに2つのアイテムセットを作成し、それらをハッシュテーブル構造のいくつかのバケットにハッシュ(つまり、マップ)して、同等のバケット数を増やすことができます。

トランザクションの削減 −いくつかの頻繁なk-itemsetを含まないトランザクションには、いくつかの頻繁な(k + 1)-itemsetを含めることはできません。したがって、このようなトランザクションは、j> kであるj-itemsetsのデータベースの後続のスキャンでは必要ないため、マークを付けるか、今後の検討から削除することができます。

パーティション化 −頻繁なアイテムセットをマイニングするために2回のデータベーススキャンを必要とするパーティショニング手法を使用できます。これには、フェーズIを含む2つのフェーズが含まれ、アルゴリズムはDのトランザクションをn個の重複しないパーティションに分割します。 Dのトランザクションの最小サポートしきい値がmin_supの場合、パーティションの最小サポート数はmin_sup×そのパーティションのトランザクション数です。

パーティションごとに、パーティション内の頻繁なアイテムセットがすべて検出されます。これらは、ローカルの頻繁なアイテムセットとして定義されます。このプロセスでは、アイテムセットごとに、アイテムセット内のアイテムを含むトランザクションのTIDを記録する特定のデータ構造を採用しています。これにより、データベースの1回のスキャンで、k =1、2...のすべてのローカル頻度kアイテムセットを見つけることができます。

ローカルの頻繁なアイテムセットは、データベース全体に頻繁に関連付けることができます。D。頻繁に関連付けられる可能性のあるアイテムセットDは、頻繁なアイテムセットが部分的にパーティションの1つであるために表示される必要があります。したがって、すべてのローカルの頻繁なアイテムセットはわずかにDの候補アイテムセットです。すべてのパーティションからの頻繁なアイテムセットのセットは、Dの世界的な候補アイテムセットを形成します。フェーズIIでは、各候補の実際のサポートが評価されるDの2番目のスキャンが編成されます。グローバルな頻繁なアイテムセットを決定します。

サンプリング −サンプリング手法の基本的な考え方は、与えられたデータDのランダムサンプルSを選択し、DではなくSで頻繁なアイテムセットを検索することです。この方法では、ある程度の精度と効率のトレードオフが可能です。 Sのサンプルサイズは、S内の頻繁なアイテムセットの検索をメインメモリで完了できるようなものであるため、S内のトランザクションのスキャンは全体で1回だけ必要です。


  1. Windows10でごみ箱のパフォーマンスを向上させる方法

    ごみ箱は、プログラムのごく初期の頃からWindowsオペレーティングシステムの一部でした。それは見落としがちなほどの主力です。私たちはそれをやらせます。ご存じないかもしれませんが、ごみ箱には、より良い体験のために微調整できる設定がいくつかあります。 Windowsマシンでファイルを削除しても、そのファイルがシステムからすぐに削除されるわけではありません。代わりに、完全に削除するまで、ごみ箱に移動します。ごみ箱を空にしないと、ごみ箱が最大容量に達するまですべてのファイルが保持され、次に最も古いファイルが最初に空になります。このプロセスにより、誤って削除したり、気が変わったりした可能性のあるファ

  2. データ暗号化アルゴリズムのパフォーマンスをどのように評価できますか?

    データ暗号化規格(DES)アルゴリズムは、1970年代初頭にIBMによって発明されました。 DESベースのシステムの2つの主要な要素は、アルゴリズムとキーです。 DESアルゴリズムは、置換、順列、および数学演算を含む複雑な対話型手順です。 DESの主な機能は、アルゴリズムが固定されており、公開データであるということです。ただし、実際に使用される鍵は、送信の発信者と受信者の間で共有される秘密です。 DESの進歩には、キーを128ビットに延長することと、マルチパスDESには、通常、複数のキーを使用した暗号化と復号化の3つのパスが含まれます。 この分野では、比較されたアルゴリズム間の主な違いを理