プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

メタルールはデータマイニングでどのように役立ちますか?


データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。

これは、データベースの所有者にとって明確で有益な結果を得るために、最初は未知である規則性または関係を見つけるための大量の情報の選択、調査、およびモデリングの手順です。

データマイニングはデータサイエンスに似ています。それは、特定の状況で、特定のデータセットに対して、目的を持って人によって実行されます。このフェーズには、テキストマイニング、Webマイニング、オーディオおよびビデオマイニング、画像データマイニング、ソーシャルメディアマイニングなど、いくつかのタイプのサービスが含まれます。シンプルまたは非常に具体的なソフトウェアを介して完成します。

メタルールを使用すると、ユーザーはマイニングに関与するルールの構文形式を定義できます。ルールフォームは、マイニングフェーズの有効性を向上させるための制約として使用できます。メタルールは、データに関するアナリストの経験、期待、または直感に基づくことも、データベーススキーマに応じて自動的に生成することもできます。

メタルールガイドマイニング − AllElectronicsの市場アナリストとして、顧客を定義するデータ(顧客の年齢、住所、信用格付けなど)と顧客の取引のリストにアクセスできることを考慮してください。

それは、顧客の特性と顧客が購入するアイテムとの間の関連を見つけることである可能性があります。ただし、これらの関係を反映するいくつかの相関ルールを見つけるのではなく、どの顧客特性のペアがオフィスソフトウェアの販売を強化するかを決定することにのみ関心があります。

このようなメタルールの例は

です。

P 1 (X、Y)∧P 2 (X、W)⇒buys(X、「オフィスソフトウェア」)

ここで、P 1 およびP2 はマイニングフェーズ中に特定のデータベースの属性にインスタンス化される述語変数であり、Xは顧客を定義する変数であり、YとWはP 1に割り当てられた属性の値を取ります。 およびP2 、それに応じて。

一般に、ユーザーはP 1を使用してインスタンス化の対象となる属性のリストを定義できます。 およびP2 。したがって、デフォルトのセットを使用できます。

一般に、メタルールは、ユーザーが知覚または確認に関与している関係に関する仮説を形成します。データマイニングシステムは、指定されたメタルールを接続するルールを検索できます。たとえば、

age(X、“ 30 ... 39”)∧income(X、“ 41K ... 60K”)⇒buys(X、“ office software”)


  1. ウェブマイニングの方法論は何ですか?

    Webマイニングは、知識の学習または導出を目的とした、Webベースのデータへの機械学習(データマイニング)アプローチのアプリケーションです。 Webマイニングの方法論は、次の3つの異なる要素のいずれかに定義できます- Web使用状況マイニング − Web使用マイニングは、WebページのWebアクセスデータのセットを有効にする一種のWebマイニングです。この使用状況データは、アクセスされたWebページにつながる方向をサポートします。 このデータは、Webサーバーを介して接続ログに自動的に収集されます。 CGIスクリプトは、リファラーログ、ユーザーサブスクリプションデータ、調査ログなどの有用な

  2. データマイニングでメジャーはどのように計算されますか?

    メジャーは、分配法則、代数法則、および全体論を含む3つの要素に編成できます。使用する集計関数の種類によって異なります。 配布 −集計関数は、次のように配信された方法で計算できる場合、分配法則です。データがnセットに独立していると考えてください。各パーティションへのサービスを使用できるため、n個の集計値が得られます。 関数を使用してn個の集計値に変更された結果が、関数をデータセット全体(パーティション化なし)に使用して得られた結果と同じである場合、関数は分散して評価できます。 たとえば、データキューブのcount()は、最初にキューブをサブキューブのグループに分割し、すべてのサブキューブの