プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

頻繁なアイテムセットを生成する方法は何ですか?


Aprioriは、頻繁なアイテムセット生成の組み合わせバーストに強力に対処するためのアルゴリズムです。 Aprioriの原理を使用してこれを実装し、指数検索領域を短縮します。重要なパフォーマンスの向上にもかかわらず、アルゴリズムはトランザクションレコードセットに対してさまざまなパスを作成する必要があるため、かなりのI/Oオーバーヘッドを獲得します。

Aprioriアルゴリズムの動作は、トランザクションの幅が広がるため、高密度のデータセットでは本質的に低下する可能性があります。これらの欠点を克服し、Aprioriアルゴリズムの有効性を高めるために、いくつかの方法が作成されています。

以下は、これらのメソッドの概要です。-

アイテムセットラティスのトラバーサル −頻繁なアイテムセットの検索は、アイテムセットラティスのトラバーサルと見なすことができます。頻繁なアイテムセット生成フェーズ中にラティスアーキテクチャがどのようにトラバースされるかをアルゴリズム方式で使用する検索方法。格子内の頻繁なアイテムセットの構成に基づいて、一部の検索方法は他の方法よりも優れています。

一般から特定へと特定から一般へ − Aprioriアルゴリズムには、一般から特定への検索アプローチが必要です。このアプローチでは、頻繁な(k- l)アイテムセットのペアを組み合わせて、候補のkアイテムセットを取得します。この一般から特定への検索方法は効率的であり、頻繁に使用されるアイテムセットの最大長が長すぎないことをサポートしています。

特定から一般への検索方法では、より一般的な頻度の高いアイテムセットを検出する前に、より明確な頻度の高いアイテムセットを最初に表示します。この方法は、頻繁なアイテムセットの境界が格子の下部近くにある密集したトランザクションで最大の頻繁なアイテムセットを見つけるのに役立ちます。

Aprioriの原則を使用して、最大頻度のアイテムセットの一部のサブセットを整理できます。特に、候補k-itemsetが最大頻度である場合、サイズk-1のサブセットを決定する必要はありません。ただし、候補k-itemsetの頻度が低い場合は、そのk-1サブセットをすべてチェックする必要があります。次の反復で。

もう1つの方法は、一般から特定への検索方法と特定から一般への検索方法の両方を接続することです。この双方向のアプローチでは、候補アイテムセットを保存するためにより多くのスペースが必要でしたが、頻繁なアイテムセットの境界を迅速に特定することをサポートできます。

同値類 −トラバーサルを想定する別の方法は、最初にラティスをノードの互いに素なチーム(または同じクラス)に分割することです。頻繁なアイテムセット生成アルゴリズムは、別の同等性クラスに変更する前に、最初に特定の同等性クラス内の頻繁なアイテムセットを検索します。

Aprioriで使用されているレベル単位の方法であるアルゴリズムは、アイテムセットサイズのサポートに基づいてラティスを分割するように扱うことができます。つまり、アルゴリズムは、より大きなサイズのアイテムセットへの操作の前に、最初にいくつかの頻繁な1アイテムセットを検出します。等価クラスは、アイテムセットのプレフィックスまたはサフィックスラベルに従って表すこともできます。


  1. 多要素認証の方法は何ですか?

    MFAは、2つ以上の検証証拠をサポートした後にのみ、ユーザーが特定のアプリケーション、アカウント、またはWebサイトにアクセスできるようにする認証機能です。つまり、アカウントにログインしようとしている人が本当にそのアカウントの所有者であることを確認するためのアプローチです。 多要素認証は、一般に、追加の防御をサポートし、権限のない人がネットワークまたはデータベースにアクセスするための防御をより複雑にすることで知られています。強力なMFAソリューションを実装することで、個人情報の盗難、アカウントのなりすまし、フィッシングから情報とITリソースを即座に保護できます。 多要素認証には、次のような

  2. オーディオステガノグラフィの方法は何ですか?

    オーディオステガノグラフィでは、秘密のメッセージがデジタル化されたオーディオ信号にインストールされ、一致するオーディオファイルのバイナリシリーズの変更を不快にさせます。オーディオステガノグラフィには、次のようないくつかの方法があります- 低ビットエンコーディング −バイナリ情報は、サウンドファイルの最下位ビット(画像ファイルと同じ)に保存できます。たとえば、チャネル容量は1Hzあたり1秒あたり1kbです。したがって、8kHzのシーケンスを持つことができる場合、容量は8kbpsです。 この方法では、可聴ノイズが発生します。これは、操作に対する耐性が非常に低くなっています。リサンプリングやチャ