プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データマイニングの用途は何ですか?


データマイニングは、パターン認識テクノロジーと統計的および数学的手法を使用して、リポジトリに保存されている大量のデータを選別することにより、意味のある新しい相関関係、パターン、トレンドを発見するプロセスです。

>

予想外の関係を発見し、データ所有者にとって理解可能で有益な新しい手法でレコードを要約するのは、観測データセットの分析です。データマイニングには、次のようなさまざまなアプリケーションがあります-

データウェアハウスとデータ前処理 −データウェアハウスは、情報交換とデータマイニングに不可欠です。地理空間データの分野では、しかし、真の地理空間データウェアハウスは現在存在しません。

このようなウェアハウスを作成するには、セマンティクスの調整、システムの参照、ジオメトリ、精度、精度など、地理的および時間的なデータの非互換性を解決するための手段を見つける必要があります。

一般的な数学ソフトウェアの場合、異種ソースからの情報(さまざまな期間をカバーするデータを含む)を統合し、アクティビティを識別するための方法が必要です。たとえば、気候と生態系のデータ(空間的および時間的)の場合、問題は、空間的ドメインではイベントが多すぎ、時間的ドメインではイベントが少なすぎることです。

複雑なデータ型のマイニング −科学データセットは本質的に異種であり、通常、マルチメディアデータや地理参照ストリームデータなどの半構造化データと非構造化データが含まれています。時空間データ、関連する概念階層、および複雑な地理的関係(非ユークリッド距離など)を処理するには、堅牢な方法が必要です。

グラフベースのマイニング −既存のモデリング手法の制限により、いくつかの物理現象やプロセスをモデリングすることは、多くの場合困難または不可能です。または、ラベル付きグラフを使用して、数値データセットに存在する空間的、位相的、幾何学的、およびその他の関係特性の一部を克服することもできます。

グラフモデリングでは、マイニングされるすべてのデータはグラフ内の頂点によって記述され、頂点間のエッジはオブジェクト間の関係を記述します。たとえば、グラフを使用して、流体の流れのシミュレーションなどの数値シミュレーションによって生成された化学構造やデータをモデル化できます。

ただし、グラフモデリングの成功は、分類、頻繁なパターンマイニング、クラスタリングなど、多くの従来のデータマイニングタスクのスケーラビリティと効率の向上にかかっています。

視覚化ツールとドメイン固有の知識 −数値データマイニングシステムには、高レベルのグラフィカルユーザーインターフェイスと視覚化ツールが必要です。これらは、既存のドメイン固有のデータシステムおよびデータベースシステムと統合して、研究者や一般ユーザーが設計を検索し、発見された設計を解釈および視覚化し、発見された知識を意思決定に利用できるようにする必要があります。


  1. Webマイニングのアプリケーションは何ですか?

    Webマイニングは、データマイニング技術を使用して、Webベースのレコードとサービス、サーバーログ、およびハイパーリンク。 Webマイニングは、データをグループ化して分析し、重要な洞察を受け取ることで、Web情報のデザインを発見することを目的としています。 Webマイニングは、適応されたデータマイニング手法をWebに適用するものと広く見なすことができますが、データマイニングは、知識発見プロセスに固定されたほとんどの構造化データのパターンを見つけるためのアルゴリズムのアプリケーションとして表されます。 ウェブマイニングには次のようなさまざまなアプリケーションがあります- Webマイニング

  2. パターンマイニングのアプリケーションは何ですか?

    パターンマイニングには、次のようなさまざまなアプリケーションがあります- パターンマイニングは、一般に、いくつかのデータ集約型アプリケーションでの前処理として、ノイズフィルタリングとデータクリーニングに使用されます。たとえば、数万の次元(たとえば、遺伝子の記述)を含むマイクロアレイデータを探索するために使用できます。 パターンマイニングは、データに隠された固有のメカニズムとクラスターの発見を提供します。たとえば、DBLPデータセットを考えると、頻繁なパターンマイニングでは、共著者クラスター(一般的に共同作業を行う著者を決定する)や会議クラスター(複数の著者と用語の共有を決定する)などの興味