プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

異常の原因は何ですか?


異常検出の目的は、複数のオブジェクトとは異なるオブジェクトを検出することです。多くの場合、異常なオブジェクトは、データの散布図上で複数のデータポイントから遠く離れているため、外れ値と呼ばれます。異常検出は、逸脱検出と呼ばれます。これは、異常オブジェクトの属性値が、期待値または一般的な属性値から本質的に逸脱しているため、または例外マイニングとして、異常がいくつかの意味で例外的であるためです。

地球、人間社会、またはデータグループのドメインでは、ほとんどのイベントとオブジェクトは、表現によって、共通の領域または通常のものです。しかし、それは、異なるまたは異常なオブジェクトの実現可能性についての鋭い知識を持つことができます。これには、非常に乾燥した季節や雨季、人気のあるアスリート、または他のすべての季節よりもはるかに小さいまたは高い属性値が含まれます。

異常の原因は次のとおりです-

さまざまなクラスのデータ −オブジェクトは複数のタイプまたはクラスであるため、異常などの複数のオブジェクトとは異なる場合があります。たとえば、クレジットカード詐欺を犯した人は、クレジットカードを正確に必要とする人よりも複数のクラスのクレジットカードユーザーに属しています。

詐欺、侵入、病気の発生、異常なテスト結果など、表示されるいくつかの例は、異なるクラスの要素を定義する異常のインスタンスです。このような異常は非常に興味深いものであり、データマイニングの分野での異常識別の対象です。

自然変異 −一部のデータセットは、正規(ガウス)分布を含む統計分布でモデル化できます。この分布では、分布の中央からオブジェクトまでの距離が長くなるにつれて、データオブジェクトの確率がますます低下します。

言い換えれば、いくつかのオブジェクトは中心に近く(平均的なオブジェクト)、オブジェクトがこの平均的なオブジェクトと本質的に異なる可能性は小さいです。たとえば、非常に背の高い人は、オブジェクトの独立したクラスからの方法では異常ではなく、一部のオブジェクトによって消費される特性(高さ)の完全な値を持つ方法でのみ異常です。深刻な、またはありそうもない変動を定義する異常は興味深いものです。

データの測定と収集のエラー −データセットまたは測定プロセスのエラーは、異常のもう1つの原因です。たとえば、コンピューティングデバイスの人為的エラーの問題、またはノイズの存在が原因で、測定値が誤って記録される可能性があります。

目的は、そのような異常を取り除くことです。なぜなら、それらは興味深いデータをサポートせず、データの特徴とその後のデータ分析を減らすだけだからです。実際、このタイプの異常の削除は、データ前処理、特にデータクリーニングの対象です。


  1. データの整合性の種類は何ですか?

    データベースの整合性は、格納された情報の有効性と整合性を定義します。整合性は、一般に、データベースが違反することを許可されていない整合性ルールである制約の観点から定義されます。制約は、各属性に適用することも、テーブル間の関係に適用することもできます。 整合性制約により、許可されたユーザーがデータベースに加えた変更(更新の削除、挿入)によってデータの整合性が失われることはありません。したがって、整合性制約はデータベースへの偶発的な損傷を防ぎます。 データの整合性には、次のようなさまざまなタイプがあります- 論理的整合性 −リレーショナルデータベースでは、論理的な一貫性により、いくつかの

  2. ステガノグラフィの用途は何ですか?

    ステガノグラフィは、明らかに無害なメッセージ内にメッセージを埋め込むことによってデータを隠す芸術と科学としても表されます。ステガノグラフィは、通常のコンピュータファイルにある役に立たない情報や未使用の情報を復元することで機能します。この隠しデータは、平文または暗号文、さらには画像である可能性があります。 ステガノグラフィは秘密のメッセージを隠しますが、2つの当事者が互いに接続しているという事実は隠しません。ステガノグラフィの手順には、多くの場合、キャリアと呼ばれる輸送媒体で隠されたメッセージを見つけることが含まれます。 秘密のメッセージは、ステガノグラフィチャネルを形成するためにキャリアに