プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

名目データの概念階層を生成する方法は何ですか?


名目データの概念階層を生成するには、次のようにさまざまな方法があります-

ユーザーまたは専門家によるスキーマレベルでの属性の半順序の指定 −名目上の属性またはディメンションの概念階層には、通常、一連の属性が含まれています。ユーザーまたは専門家は、スキーマレベルで属性の部分的または全体的な管理を定義することにより、概念階層を簡単に表すことができます。

たとえば、リレーショナルデータベースに、通り、都市、州または州、国などの属性のセットが含まれているとします。データウェアハウスの場所のディメンションには、同じ属性を含めることができます。階層は、ストリート<都市<州または州<国

を含むスキーマレベルでこれらの属性間の全体的な順序を記述することで表すことができます。

明示的なデータグループ化による階層の一部の指定 −これは基本的に、概念階層の一部を手動で説明したものです。巨大なデータベースでは、明示的な値の列挙によって概念階層全体を記述することは非現実的です。

属性のセットの仕様。ただし、半順序の仕様ではありません −ユーザーは、概念階層を形成する属性のセットを定義できますが、半順序を明示的に示すために除外します。システムは、重要な概念階層を作成するために、属性の順序を自動的に作成しようとすることができます。

通常、上位レベルの概念は複数の下位下位レベルの概念をカバーするため、上位の概念レベルを表す属性(たとえば、国)には、下位の概念レベルを表す属性(たとえば、通り)。

この観察に応じて、特定の属性セットの属性ごとに複数の異なる値に基づいて、概念階層を自動的に作成できます。最も明確な値を持つ属性は、最下位の階層レベルにあります。

属性の複数の個別の値が低いほど、生成される概念階層内の属性は大きくなります。このヒューリスティックルールは、いくつかの場合にうまく機能します。一部のローカルレベルのスワッピングまたは適応は、生成された階層の分析後に、必要に応じてユーザーまたは専門家が使用できます。

属性の一部のみの指定 −ユーザーが階層を説明するときに不正確になったり、階層に何を含める必要があるかについて漠然とした概念しか持っていない場合があります。したがって、ユーザーは、階層の説明に関連する属性のごく一部しか含めることができません。

このような部分的に指定された階層を管理できます。高速セマンティックリンクを持つ属性を一緒に固定できるように、データベース設計に情報セマンティクスを埋め込むことが不可欠です。この方法では、1つの属性の表現により、意味的に密接に接続された属性のグループ全体が「ドラッグイン」され、完全な階層が設計されます。ユーザーには、必要に応じて、この機能を元に戻すオプションが必要です。


  1. レコメンダーシステムのデータマイニング方法は何ですか?

    レコメンダーシステムは、コンテンツベースのアプローチ、コラボレーションアプローチ、またはコンテンツベースとコラボレーションの両方の方法を組み合わせたハイブリッドアプローチを使用できます。 コンテンツベース −コンテンツベースのアプローチでは、顧客が以前に好んだまたは照会したアイテムと同じアイテムを推奨します。製品の機能とテキストによるアイテムの定義によって異なります。 コンテンツベースの方法では、類似したユーザーが同じである異なるアイテムに割り当てたユーティリティに基づいて計算されます。多くのシステムは、Webサイト、記事、ニュースメッセージなどのテキストデータを含むアイテムの推奨を対象と

  2. 侵入検知と防止のためのデータマイニングの方法は何ですか?

    データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。 私たちのコンピュータシステムと情報のセキュリティは継続的なリスクにさらされています。 Webの大幅な成長と、Webへの侵入や攻撃のためのツールやトリックへのアクセスの増加により、侵入検知と回避がネットワークシステムの不可欠なコンポーネントになるようになりました。 侵入は、ネッ