制約ベースのアソシエーションマイニングとは何ですか?
データマイニング手順では、特定の情報セットから何千ものルールを明らかにすることができます。そのほとんどは、ユーザーにとって独立しているか、面倒です。ユーザーは、マイニングのどの「方向」が興味深いパターンにつながる可能性があるか、および発見したいパターンまたはルールの「形式」を最もよく理解しています。
したがって、優れたヒューリスティックは、ユーザーにそのような直感や期待を検索スペースを制約する制約として定義させることです。この戦略は、制約ベースのマイニングと呼ばれます。
制約ベースのアルゴリズムでは、頻繁なアイテムセット生成ステップで検索領域を減らすために制約が必要です(アソシエーションルール生成ステップは、網羅的なアルゴリズムのステップとまったく同じです)。
一般的な制約は、サポートの最小しきい値です。制約が制御されていない場合、探索空間ラティス内の境界が定義され、その後探索が不要になるため、マイニングフェーズに制約を含めることで探索空間の大幅な削減をサポートできます。
制約の重要性は明確に定義されています-それらはユーザーにアピールするアソシエーションルールのみを作成します。この方法は非常に簡単で、ルールスペースが減り、残りのメソッドが制約を満たします。
制約ベースのクラスタリングは、ユーザー定義の設定または制約を満たすクラスターを検出します。制約の特性によって異なりますが、制約ベースのクラスタリングでは、さまざまなアプローチではなく採用できます。
制約には、次のようなものを含めることができます-
ナレッジタイプの制約 −これらは、関連付けや相関関係など、マイニングする知識のタイプを定義します。
データの制約 −これらは、ディメンション/レベル制約などのタスク関連情報のセットを定義します。−これらは、マイニングで使用される情報の目的のディメンション(または属性)または概念階層のメソッドを定義します。
興味深い制約 −これらは、サポート、信頼性、相関関係など、ルールの関心度の数値測定のしきい値を定義します。
ルールの制約 −これらは、マイニングされるルールの形式を定義します。このような制約は、メタルール(ルールテンプレート)、ルールの前件または後件に表示される述語の最大数または最小数、または属性、属性値、および/または集計間の関係として定義できます。
次の制約は、高レベルの宣言型データマイニングクエリ言語とユーザーインターフェイスを使用して説明できます。この形式の制約ベースのマイニングにより、ユーザーは、データマイニングプロセスをより効率的に作成することで、明らかにしたいルールを定義できます。
さらに、高度なマイニングクエリオプティマイザを使用して、ユーザーが定義した制約を実行できるため、マイニングプロセスをより効果的に作成できます。制約ベースのマイニングは、インタラクティブな探索的マイニングと分析を促進します。
-
データマイニングにおける制約の分類とは何ですか?
制約ベースのアルゴリズムでは、頻繁なアイテムセット生成フェーズで検索領域を減らすために制約が必要です(アソシエーションルールの作成手順は、網羅的なアルゴリズムの手順とまったく同じです)。 制約の重要性は明確に定義されており、顧客にとって興味深い相関ルールのみを作成します。この方法は非常に簡単で、ルール領域が縮小されるため、残りのルールは制約を使用します。 制約には次の3種類があります- インスタンスの制約 −インスタンスの制約は、クラスター分析でインスタンスのペアまたはセットをグループ化する方法を定義します。このカテゴリには、-などの2種類の制約があります。 リンクが必要な制約 −
-
時空間データマイニングとは何ですか?
時空間データマイニングは、時空間データからパターンと知識を見つけるプロセスを定義します。時空間データマイニングの例には、都市や土地の開発履歴の検索、気象設計の発見、地震やハリケーンの予測、地球温暖化の傾向の決定が含まれます。 携帯電話、GPSデバイス、インターネットベースの地図サービス、気象サービス、デジタルアース、衛星、RFID、センサー、ワイヤレス、ビデオテクノロジーの認知度を考えると、時空間データマイニングは重要になり、広範囲にわたる影響があります。 時空間データにはいくつかの種類があり、移動物体データが重要です。たとえば、動物科学者は野生生物の遠隔測定装置を接続して生態学的行動を調