データマイニングの外れ値の種類は何ですか?
データマイニングにはさまざまな種類の外れ値があります-
グローバル外れ値 −特定のデータセットでは、データオブジェクトが他の情報セットから本質的に逸脱している場合、そのデータオブジェクトはグローバルな外れ値です。グローバル外れ値はポイント異常として知られており、最も簡単なタイプの外れ値です。ほとんどの外れ値の検出方法は、グローバルな外れ値を発見することを目的としています。
グローバルな外れ値を特定できます。重要な問題は、問題のアプリケーションに関する偏差の適切な測定値を見つけることです。いくつかの測定値が提案されており、これらに応じて、外れ値の検出アプローチは複数のカテゴリに分割されます。
グローバルな外れ値の検出は、いくつかのアプリケーションで不可欠です。コンピュータネットワークでの侵入検知を検討してください。たとえば、コンピュータの通信動作が通常の設計と異なる場合(たとえば、大量のパッケージが短時間でアドバタイズされる場合)、この動作はグローバルな異常値として扱われ、対応するコンピューターは、ハッキングの犠牲者の疑いがあります。
コンテキスト外れ値 −コンテキスト外れ値は、条件付き外れ値と呼ばれます。これらのタイプの外れ値は、特定のデータセットの特定の条件のためにデータオブジェクトが複数のデータポイントから逸脱した場合に表示されます。
データのオブジェクトの属性には、コンテキスト属性と動作属性の2種類があります。コンテキスト外れ値分析により、ユーザーは複数のコンテキストと条件で外れ値を特定できます。これは、いくつかのアプリケーションで役立つ場合があります。
ビヘイビア属性では、オブジェクトの特性を表すことができ、オブジェクトが理解できるコンテキストで外れ値であるかどうかを計算するために使用されます。温度の場合、行動属性は温度、湿度、圧力です。
コンテキスト外れ値は、ローカル外れ値の一般化であり、密度ベースの外れ値分析方法で導入された概念です。データセット内のオブジェクトは、その密度がそれが表示されるローカルエリアから本質的に逸脱している場合、ローカルの外れ値です。
グローバル外れ値検出は、コンテキスト属性のグループがnullであるコンテキスト外れ値検出の特別な方法として関係する可能性があります。つまり、グローバルな外れ値の検出には、データセット全体がコンテキストとして必要です。コンテキスト外れ値分析は、複数のコンテキストで外れ値を判別できるという点で、ユーザーの柔軟性をサポートします。これは、複数のアプリケーションで望ましい場合があります。
集合的な外れ値 −特定のデータセットにおいて、データポイントのセットが残りの情報セットから逸脱している場合は、集合的な外れ値と呼ばれます。したがって、データオブジェクトの特定のセットを外れ値にすることはできませんが、データオブジェクト全体を考慮することができる場合、それらは外れ値として機能する可能性があります。
複数の外れ値のタイプを認識できます。複数のデータオブジェクトによって示される外れ値の動作間の関係に関するバックグラウンドデータを調べる必要があります。
-
外れ値とは何ですか?
外れ値は、いくつかのメカニズムによって生成されたかのように、本質的に残りのオブジェクトから分岐するデータオブジェクトです。表示を簡単にするために、外れ値ではないデータオブジェクトを「通常の」情報または期待される情報として定義できます。通常、外れ値を「異常な」データとして定義できます。 外れ値は、特定のクラスまたはクラスターで組み合わせることができないデータコンポーネントです。これらは、さまざまなデータオブジェクトの通常の動作とは異なるいくつかの動作を持つデータオブジェクトです。この種のデータの分析は、知識を掘り起こすために重要になる可能性があります。 外れ値は、ノイズの多い情報とは異なりま
-
データの整合性の種類は何ですか?
データベースの整合性は、格納された情報の有効性と整合性を定義します。整合性は、一般に、データベースが違反することを許可されていない整合性ルールである制約の観点から定義されます。制約は、各属性に適用することも、テーブル間の関係に適用することもできます。 整合性制約により、許可されたユーザーがデータベースに加えた変更(更新の削除、挿入)によってデータの整合性が失われることはありません。したがって、整合性制約はデータベースへの偶発的な損傷を防ぎます。 データの整合性には、次のようなさまざまなタイプがあります- 論理的整合性 −リレーショナルデータベースでは、論理的な一貫性により、いくつかの