プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データマイニングの機能は何ですか?


データマイニング機能は、データマイニングタスクで検出する必要のあるパターンのタイプを表すために使用されます。一般に、データマイニングタスクは、記述的タスクと予測的タスクの2つのタイプに分類できます。記述的マイニングタスクはデータベース内のデータの共通機能を定義し、予測的マイニングタスクは現在の情報を推論して予測を作成します。

次のようなさまざまなデータマイニング機能があります-

  • データの特性評価 −これは、データのオブジェクトクラスの一般的な特性の要約です。ユーザー指定のクラスに対応するデータは、通常、データベースクエリによって収集されます。データ特性の出力は、複数の形式で表示できます。

  • データの識別 −これは、ターゲットクラスデータオブジェクトの一般的な特性と、1つまたは一連の対照的なクラスのオブジェクトの一般的な特性との比較です。ターゲットクラスと対照クラスは、ユーザーが表すことができ、同等のデータオブジェクトはデータベースクエリを介してフェッチされます。

  • 関連分析 −トランザクションデータセットで一般的に一緒に発生する一連のアイテムを分析します。アソシエーションルールを決定するために使用される2つのパラメータがあります-

    • データベースに設定されている共通のアイテムを識別するものを提供します。

    • 信頼度は、別のアイテムが発生したときにトランザクションでアイテムが発生する条件付き確率です。

  • 分類 −分類は、クラスラベルが匿名であるオブジェクトのクラスを予測するためにモデルを使用できるようにすることを目的として、データクラスまたは概念を表現および区別するモデルを検出する手順です。派生モデルは、一連のトレーニングデータ(つまり、クラスラベルが共通のデータオブジェクト)の分析に基づいて確立されます。

  • 予測 −これは、いくつかの利用できないデータ値または保留中の傾向を予測することを定義します。オブジェクトの属性値とクラスの属性値に基づいて、オブジェクトを予測できます。これは、欠落している数値の予測、または時間関連情報の傾向の増減の予測である可能性があります。

  • クラスタリング −分類に似ていますが、クラスは事前定義されていません。クラスはデータ属性で表されます。教師なし学習です。オブジェクトはクラスター化またはグループ化され、クラス内の類似性を最大化し、クラス内の類似性を最小化するという原則に依存します。

  • 外れ値分析 −外れ値は、特定のクラスまたはクラスターにグループ化できないデータ要素です。これらは、他のデータオブジェクトの一般的な動作から複数の動作を持つデータオブジェクトです。このタイプのデータの分析は、知識を掘り起こすために不可欠な場合があります。

  • 進化分析 −動作が時間の経過とともに変化するオブジェクトの傾向を定義します。


  1. ウェブマイニングの方法論は何ですか?

    Webマイニングは、知識の学習または導出を目的とした、Webベースのデータへの機械学習(データマイニング)アプローチのアプリケーションです。 Webマイニングの方法論は、次の3つの異なる要素のいずれかに定義できます- Web使用状況マイニング − Web使用マイニングは、WebページのWebアクセスデータのセットを有効にする一種のWebマイニングです。この使用状況データは、アクセスされたWebページにつながる方向をサポートします。 このデータは、Webサーバーを介して接続ログに自動的に収集されます。 CGIスクリプトは、リファラーログ、ユーザーサブスクリプションデータ、調査ログなどの有用な

  2. 空間データマイニングのプリミティブは何ですか?

    空間データマイニングは、データマイニングを空間モデルに適用することです。空間データマイニングでは、アナリストは地理データまたは空間データを使用して、ビジネスインテリジェンスまたはさまざまな結果を作成します。これには、地理データを関連性のある有益な形式に変換するための特定の方法とリソースが必要でした。 空間データマイニングには、パターンの認識や、研究プロジェクトを推進する質問に関連するオブジェクトの発見など、いくつかの課題があります。アナリストは、GIS / GPSツールまたは同様のシステムを利用して、大規模なデータベース領域またはその他の完全に巨大なデータセットで表示し、関連するデータのみを