プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

マルチリレーショナルデータマイニングとは何ですか?


マルチリレーショナルデータマイニング(MRDM)メソッドは、リレーショナルデータベースからいくつかのテーブル(リレーション)を含むデザインを検索します。各テーブルまたはリレーションは、一連の属性によって記述されるエンティティまたはリレーションを表します。関係間のリンクは、それらの間の関係を示しています。

従来のデータマイニング方法(データが単一のテーブルにあると想定)を適用する方法の1つは、結合と集計を使用して複数の関係データを単一のフラットなデータ関係に変換する提案化です。

>

これにより、(すべての属性を含む)巨大で望ましくない「普遍的な関係」が生成される可能性があります。さらに、データベース設計のリンクによって表される重要なセマンティック情報を含む情報が失われる可能性があります。

マルチリレーショナルデータマイニングは、リレーショナルデータから直接知識を発見することを目的としています。多国籍分類、クラスタリング、頻繁なパターンマイニングなど、さまざまなマルチリレーショナルデータマイニング機能があります。

マルチリレーショナル分類の利点は、さまざまな関係の情報を利用する分類モデルを構築することです。マルチリレーショナルクラスタリングは、タプルの属性と、異なる関係にあるタプルに関連するタプルを使用して、タプルをクラスターにグループ化することを目的としています。マルチリレーショナルの頻繁なパターンマイニングは、異なる関係にある相互接続されたアイテムを含むパターンを見つけることを目的としています。最初に、マルチリレーショナルデータマイニングの目的と手順を説明するための例として、マルチリレーショナル分類を使用できます。

マルチリレーショナル分類のデータベースには、1つのターゲットリレーションRtがあり、そのタプルはターゲットタプルと呼ばれ、クラスラベルに関連付けられています。他の関係は対象外です。各リレーションには、1つの主キー(リレーション内のタプルを一意に認識する)と複数の外部キー(あるリレーションの主キーを別のリレーションの外部キーに接続できる)を含めることができます。

2クラスの問題を検討できる場合は、一方のクラスをポジティブクラスとして選択し、もう一方をネガティブクラスとして選択できます。正確なマルチリレーショナル分類子を構築するためのサービスは、正と負のターゲットタプルを分類するのに役立つさまざまな関係の関連機能を見つけることです。

多関係分類の仮説の最も一般的な形式は、ルールのセットです。各ルールは、クラスラベルに関連付けられた述語のリスト(論理結合)です。述語は、リレーション内の属性に対する制約です。多くの場合、述語は特定の結合パスに基づいて定義されます。ターゲットタプルは、ルールのすべての述語を満たす場合にのみ、ルールを満たします。


  1. 時間的データマイニングとは何ですか?

    時間的データマイニングは、時間的データの大規模なセットから、重要で、暗黙的で、潜在的に不可欠なデータを抽出するプロセスを定義します。時間データは一連の主要なデータタイプであり、通常は数値であり、時間データから有益な知識を収集することを扱います。 時間的データマイニングの目的は、時間的シーケンスと呼ばれるアルファベットからの名目上のシンボルのシーケンスと連続的な実数のシーケンスで構成される、より高いシーケンシャルデータの時間的パターン、予期しない傾向、またはいくつかの隠れた関係を見つけることです。機械学習、統計、データベーステクノロジーからの一連のアプローチを利用することにより、時系列と呼ばれ

  2. 時空間データマイニングとは何ですか?

    時空間データマイニングは、時空間データからパターンと知識を見つけるプロセスを定義します。時空間データマイニングの例には、都市や土地の開発履歴の検索、気象設計の発見、地震やハリケーンの予測、地球温暖化の傾向の決定が含まれます。 携帯電話、GPSデバイス、インターネットベースの地図サービス、気象サービス、デジタルアース、衛星、RFID、センサー、ワイヤレス、ビデオテクノロジーの認知度を考えると、時空間データマイニングは重要になり、広範囲にわたる影響があります。 時空間データにはいくつかの種類があり、移動物体データが重要です。たとえば、動物科学者は野生生物の遠隔測定装置を接続して生態学的行動を調