頻繁な下部構造をどのように発見できますか?
頻繁な下部構造の発見は通常、2つのステップで構成されます。最初のステップでは、頻繁に下部構造の候補を作成できます。すべての候補の頻度は、2番目のステップでテストされます。頻繁な下部構造の発見に関するほとんどの研究は、最初のステップの最適化に焦点を当てています。これは、2番目のステップには、計算の複雑さが過度に高い(つまり、NP完全)サブグラフ同形性テストが含まれるためです。
頻繁な下部構造マイニングには、次のようなさまざまな方法があります-
Aprioriベースのアプローチ − Aprioriベースの頻繁な下部構造マイニングアルゴリズムは、Aprioriベースの頻繁なアイテムセットマイニングアルゴリズムと同じ機能を送信します。頻繁なグラフの検索は、小さな「サイズ」のグラフから始まり、候補に追加の頂点、エッジ、またはパスを持たせることによってボトムアップ方式で進行します。グラフサイズの表現は、使用されるアルゴリズムに基づいています。
Aprioriベースの下部構造マイニングアルゴリズムの主な設計の複雑さは、候補の生成ステップです。頻繁なアイテムセットマイニングでの候補生産は真実です。たとえば、サイズ3の2つの頻繁なアイテムセットがあるとします:(abc)と(bcd)。
それらから生成されるサイズ4の頻繁なアイテムセット候補は、結合から簡単に(abcd)変更されます。ただし、2つの下部構造を結合する方法は多数あるため、頻繁な下部構造マイニングでの候補生成の問題は、頻繁なアイテムセットマイニングでの問題よりも困難です。
したがって、AprioriのようなアプローチにはBFSが必要です。対照的に、パターン成長法は、その検索方法に関してより動的です。幅優先探索と深さ優先探索(DFS)を使用でき、後者の方がメモリ消費量が少なくなります。
パターン成長グラフは単純ですが、効率的ではありません。ボトルネックは、グラフを拡張することの非効率性です。同じグラフが数回見つかります。たとえば、同じnエッジグラフに拡張できるn個の異なる(n − 1)エッジグラフが存在する場合があります。同じグラフを繰り返し検出すると、計算効率が低下します。 2回目に発見されたグラフを重複グラフと呼びます。
重複するグラフの生成を減らすことができます。頻繁に使用される各グラフは、可能な限り保守的に拡張する必要があります。この原則は、いくつかの新しいアルゴリズムの設計につながります。スパニングアルゴリズムは、重複グラフの生成を減らすように設計されています。重複検出のために、以前に検出された頻繁なグラフを検索する必要はありません。重複するグラフを拡張することはありませんが、頻繁なグラフの完全なセットの検出を保証します。
-
Google Discover フィードの概要とその管理方法
多くの Google 機能は、Android スマートフォンを持っているすべての人、および iPhone で Google のアプリやサービスを使用しているすべての人によって毎日使用されています。ただし、これらの機能の一部は多くの人に知られていません。そのような機能の 1 つは Google Discover フィードで、誰もが無意識のうちに使用しています。これについて少しでも知っていれば、Google のニーズではなく、私たちのニーズに合わせてカスタマイズできるかもしれません。 では、秘密の機能 – Google Discover フィードとは何ですか? Google Discover
-
ウイルス対策で PC を高速化する方法
多くのユーザーは、アンチウイルスが PC の速度を低下させる可能性があると誤解しています。はい、ウイルス対策によって PC の速度が低下するケースはほとんどありません。これについては、このブログで後ほど説明します。アンチウイルスが PC の速度を低下させたとしても (少し)、PC を包括的にスキャンして脅威を検出し、脅威を未然に防ぐことができます。しかし、全体として、ウイルス対策は PC のパフォーマンスを向上させるのに役立ちます。 優れた有料および無料のウイルス対策がいくつかあります そこに。このブログでは、入手可能な最高のアンチウイルスの 1 つである Systweak Antiviru