プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データの一般化と概念の説明の方法は何ですか?


データの一般化は、比較的低レベルの値(属性年齢の数値など)を高レベルの概念(若年、中年、上級など)に置き換えることによってデータを要約します。データベースに保存されるデータの量が多いことを考えると、一般化された(低いではなく)抽象化の方法で、簡潔で簡潔な用語で概念を定義できることは有益です。

これにより、データセットを複数の抽象化レベルで一般化できるため、ユーザーはデータの一般的な動作を簡単に調べることができます。たとえば、AllElectronicsデータベースを考えると、営業マネージャーは、単一の顧客トランザクションを調べるのではなく、地理的地域ごとのユーザーグループごとの要約、グループごとの購入頻度、ユーザーの収入など、より高いレベルに一般化されたデータを表示することを好む場合があります。これは、データの一般化の一形態である概念記述の概念につながります。

概念は通常、頻繁な購入者、大学院生などを含むデータのセットとして定義されます。データマイニングタスクとして、概念の説明はデータの単純な列挙ではありません。代わりに、概念の説明は、データの特性評価と比較のための説明を生成します。概念がオブジェクトのクラスとして定義される場合、クラスの説明とも呼ばれます。

特性評価は、特定のデータセットの簡潔で簡潔な要約をサポートし、概念またはクラスの比較(識別とも呼ばれる)は、2つ以上のデータセットを比較する記述をサポートします。次のような場合があります-

複雑なデータ型と集計 −データウェアハウスとOLAPツールは、ディメンション(または属性)やメジャー(集約サービス)などの情報をデータキューブの形式で表示する多次元データモデルに依存しています。

ただし、現在のいくつかのOLAPシステムでは、ディメンションが非数値レコードに限定され、メジャーが数値情報に限定されています。データベースには、数値、非数値、空間、テキスト、画像など、いくつかのデータ型の属性を含めることができます。これらの属性は、概念の説明に含める必要があります。

ユーザー制御と自動化 −データウェアハウスでのオンライン分析処理は、ユーザーが制御するフェーズです。ディメンションの選択と、ドリルダウン、ロールアップ、スライス、ダイシングなどのOLAPサービスのソフトウェアは、通常、ユーザーによって指示および管理されます。

いくつかのOLAPシステムの制御はユーザーフレンドリーですが、ユーザーは各ディメンションの重要性を最もよく理解する必要があります。さらに、情報の十分な説明を見つけることができ、ユーザーは長い一連のOLAP操作を定義する必要があります。

分析に含める必要のあるディメンション(または属性)と、レコードの興味深い要約を作成するために特定のデータセットを一般化する必要がある度合いをユーザーが決定できるようにする、より自動化されたフェーズを用意することが望ましいです。


  1. 侵入検知と防止のためのデータマイニングの方法は何ですか?

    データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。 私たちのコンピュータシステムと情報のセキュリティは継続的なリスクにさらされています。 Webの大幅な成長と、Webへの侵入や攻撃のためのツールやトリックへのアクセスの増加により、侵入検知と回避がネットワークシステムの不可欠なコンポーネントになるようになりました。 侵入は、ネッ

  2. ステガノグラフィの長所と短所は何ですか?

    ステガノグラフィは、他のメッセージ内で秘密にされるべきメッセージの隠蔽を単純化するアプローチです。この結果は、隠されたメッセージ自体の秘密です。ステガノグラフィアプローチは、画像、ビデオファイル、またはオーディオファイルに使用できます。 肉眼では簡単に発明できない文書をオーバーレイすることにより、透かしの中に著作権データを隠す透かしなどのステガノグラフィの使用。これにより、不正行為が回避され、著作権で保護されたメディアの保護が強化されます。 ステガノグラフィの利点 ステガノグラフィの利点は次のとおりです- ステガノグラフィの利点は、メッセージが自分自身に配慮を送信しないことです。どん