パターンマイニングのアプリケーションは何ですか?
パターンマイニングには、次のようなさまざまなアプリケーションがあります-
パターンマイニングは、一般に、いくつかのデータ集約型アプリケーションでの前処理として、ノイズフィルタリングとデータクリーニングに使用されます。たとえば、数万の次元(たとえば、遺伝子の記述)を含むマイクロアレイデータを探索するために使用できます。
パターンマイニングは、データに隠された固有のメカニズムとクラスターの発見を提供します。たとえば、DBLPデータセットを考えると、頻繁なパターンマイニングでは、共著者クラスター(一般的に共同作業を行う著者を決定する)や会議クラスター(複数の著者と用語の共有を決定する)などの興味深いクラスターを簡単に見つけることができます。このようなアーキテクチャまたはクラスター検出は、追加の高度なデータマイニングの前処理として使用できます。
頻繁なパターンは、高次元領域での部分空間クラスタリングに効果的に使用できます。 2つのオブジェクト間の距離の測定が複雑な高次元空間では、クラスタリングは困難です。これは、そのような距離が、オブジェクトが占める複数の次元のセットによって支配されるためです。
パターン分析は、時空間情報、時系列データ、画像データ、ビデオデータ、およびマルチメディアデータの分析に役立ちます。時空間データ分析のアプリケーションは、コロケーションパターンの分析です。これらは、特定の病気が、井戸、病院、川などの特定のオブジェクトと地理的に同じ場所にあるかどうかを判断するのに役立ちます。
時系列データ分析では、研究者は時系列値をいくつかの間隔に離散化しているため、小さな変動や値の違いは無視できます。データはシーケンシャルパターンに要約でき、類似性検索や比較分析を簡素化するためにインデックスを付けることができます。
画像分析とパターン認識では、研究者は視覚的な単語として視覚的な断片を整然と頻繁に表示します。これは、効率的なクラスタリング、分類、および比較分析に使用できます。
パターンマイニングは、ツリー、グラフ、サブシーケンス、ネットワークなどのシーケンスまたは構造データの分析に使用されています。ソフトウェアエンジニアリングでは、研究者は、ソフトウェアエラーの識別をサポートするシーケンシャルパターンとして、コード実行において一貫した連続またはギャップのあるサブシーケンスを持っています。
巨大なソフトウェアプログラムのコピーアンドペーストエラーは、ソースコードの拡張シーケンシャルパターン分析によって認識できます。盗用されたソフトウェアプログラムは、実質的に同一のプログラムフロー/ループメカニズムに基づいて認識できます。
頻繁で識別可能なパターンをプリミティブインデックスメカニズム(グラフインデックスと呼ばれる)として使用して、大規模で複雑な構造化されたデータセットとネットワークを検索できます。これらは、化合物データベースまたはXML構造データベースを含むグラフ構造データの類似性検索を提供します。このようなパターンは、データの圧縮と説明に使用できます。
-
Webマイニングのアプリケーションは何ですか?
Webマイニングは、データマイニング技術を使用して、Webベースのレコードとサービス、サーバーログ、およびハイパーリンク。 Webマイニングは、データをグループ化して分析し、重要な洞察を受け取ることで、Web情報のデザインを発見することを目的としています。 Webマイニングは、適応されたデータマイニング手法をWebに適用するものと広く見なすことができますが、データマイニングは、知識発見プロセスに固定されたほとんどの構造化データのパターンを見つけるためのアルゴリズムのアプリケーションとして表されます。 ウェブマイニングには次のようなさまざまなアプリケーションがあります- Webマイニング
-
統計データマイニングの方法論は何ですか?
統計データマイニング技術では、一般的に多次元であり、場合によってはいくつかの複雑なタイプの大量のデータを効果的に処理するために作成されます。 データ分析、特に数値データについては、確立された統計手法がいくつかあります。これらの方法は、科学的記録(物理学、工学、製造、心理学、医学の実験からの記録など)や、経済学や社会科学からの情報に広く使用されています。 統計データマイニングにはさまざまな方法論があります- 回帰 −一般に、これらの手法は、変数が数値である新しい予測子(独立)変数から応答(従属)変数の値を予測するために使用されます。回帰には、線形、多重、加重、多項式、ノンパラメトリック、ロ