プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データマイニングのタスクは何ですか?


データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。

データマイニングタスクは、データマイニングシステムに入力されるデータマイニングクエリの設計で定義できます。データマイニングクエリは、データマイニングタスクプリミティブの条件で表されます。これらのプリミティブを使用すると、ユーザーは検出中にデータマイニングシステムと相互に接続して、マイニングプロセスを指示したり、複数の角度や深さから結果をテストしたりできます。

データマイニングのタスクは次のとおりです-

マイニングされるタスク関連データのセット −これは、データベースの一部またはユーザーが関係する情報のセットを定義します。これには、対象のデータベース属性またはデータウェアハウスディメンション(関連する属性またはディメンションとして定義)が含まれます。

マイニングする知識の種類 −これは、特徴付け、識別、関連または相関分析、分類、予測、クラスタリング、外れ値分析、または進化分析を含む、操作されるデータマイニング機能を定義します。

発見プロセスで使用される背景知識 −マイニングされるドメインに関するこの知識は、知識発見プロセスを指示し、確立されたパターンを計算するのに役立ちます。概念階層は、背景知識の有名な形式であり、いくつかの抽象化方法でデータをマイニングできるようにします。

パターン評価の面白さの尺度としきい値 −マイニングプロセスをガイドしたり、検出後に検出されたパターンを計算したりするために使用できます。複数の種類の知識には、さまざまな興味深い尺度があります。

発見されたパターンを視覚化するために期待される表現 −これは、検出されたパターンが表示される形式を表します。これには、ルール、表、チャート、グラフ、決定木、およびキューブを含めることができます。

データマイニングクエリ言語は、これらのプリミティブを組み込むように設計できるため、ユーザーはデータマイニングシステムに柔軟に接続できます。データマイニングクエリ言語は、ユーザーフレンドリーなグラフィカルインターフェイスを構築できる権限をサポートしています。これにより、データマイニングシステムと他のデータシステムとの通信、および完全なデータ処理環境との統合が促進されます。

データマイニングは、データの特性評価から進化の分析まで、幅広い機能を保護するため、包括的なデータマイニング言語を設計することは困難です。各タスクにはいくつかの要件があります。効果的なデータマイニングクエリ言語の設計には、さまざまなタイプのデータマイニングタスクの能力、制限、および基礎となる構造についての幅広い学習が必要でした。


  1. 時間的データマイニングとは何ですか?

    時間的データマイニングは、時間的データの大規模なセットから、重要で、暗黙的で、潜在的に不可欠なデータを抽出するプロセスを定義します。時間データは一連の主要なデータタイプであり、通常は数値であり、時間データから有益な知識を収集することを扱います。 時間的データマイニングの目的は、時間的シーケンスと呼ばれるアルファベットからの名目上のシンボルのシーケンスと連続的な実数のシーケンスで構成される、より高いシーケンシャルデータの時間的パターン、予期しない傾向、またはいくつかの隠れた関係を見つけることです。機械学習、統計、データベーステクノロジーからの一連のアプローチを利用することにより、時系列と呼ばれ

  2. データマイニングの理論的基礎は何ですか?

    データマイニングの基礎となるいくつかの理論には、次のものがあります- データ削減 −この理論では、データマイニングの基本は、データ表現を減らすことです。データ削減は、巨大なデータベースでのクエリに対する迅速な近似回答を取得する必要性に応じて、速度と確実性を交換します。 データ削減方法には、特異値分解(主成分分析の背後にある駆動コンポーネント)、ウェーブレット、回帰、対数線形モデル、ヒストグラム、クラスタリング、サンプリング、およびインデックスツリーの開発が含まれます。 データ圧縮 −この理論によれば、データマイニングの基本は、ビット、相関ルール、決定木、クラスターなどの観点からエンコード