プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

シーケンシャル例外テクニックとは何ですか?


シーケンシャル例外手法は、人間が異常なセットを、おそらく類似しているオブジェクトのシーケンス間から区別できる方法をシミュレートします。データの暗黙的な冗長性に役立ちます。

n個のオブジェクトのデータセットDが与えられると、サブセットのシーケンス{D 1を構築します。 、D 2 、...、D m }、2≤m≤nのこれらのオブジェクトのうち

$$ \ mathrm {D_ {j-1} \ subset D_ {j} \:\:where \:D_ {j} \ subseteq D} $$

相違点は、シリーズのサブセット間で評価されます。このテクニックは、次の用語を学習します-

例外セット −これは偏差または外れ値のセットです。これは、オブジェクトの最小のサブセットとして定義され、その削除により、残差セットの可能性が最も低くなります。

非類似度関数 −この関数は、オブジェクト間の距離を測定する必要はありません。オブジェクトのセットが与えられた場合、オブジェクトが互いに同じである場合は、低い値を復元します。オブジェクト間の非類似度が高いほど、関数によって返される値も高くなります。

サブセットの非類似度は、シーケンス内でその前のサブセットに応じて段階的に計算されます。 n個の数のサブセットが与えられると、{x 1 、...、x n }、考えられる非類似度関数は、セット内の数値の分散です

$$ \ mathrm {\ frac {1} {n} \ displaystyle \ sum \ Limits_ {i =1} ^ n(x_ {i} -x ^ {'})^ 2} $$

ここで、x ' セット内のn個の数値の平均です。文字列の場合、非類似度関数は、これまでのすべてのパターンビューをカバーできるパターン文字列(ワイルドカード文字など)の設計に含めることができます。 D j-1 の一部の文字列をカバーするパターンの場合、非類似度が増加します。 D jの一部の文字列をカバーしていません それはDj-1にはありません 。

カーディナリティ関数 −これは通常、特定のセット内の複数のオブジェクトの数です。

平滑化要因 −この関数は、シーケンス内のサブセットごとに計算されます。オブジェクトの初期セットからサブセットを削除することにより、非類似度をどれだけ減らすことができるかを評価します。この値は、セットのカーディナリティによるレートです。平滑化係数の値が最も高いサブセットが例外セットです。

例外セットを見つける機能は、NP困難(つまり、手に負えない)になる可能性があります。シーケンシャルメソッドは計算上可能であり、線形アルゴリズムを使用して実行できます。

アルゴリズムは、補完セットに関する現在のサブセットの非類似性を評価するのではなく、分析のためにセットから一連のサブセットを選択します。サブセットごとに、シーケンス内の前のサブセットに関するサブセットの非類似度の違いを決定します。


  1. サービスセット識別子(SSID)とは何ですか?

    SSID(サービスセット識別子)は、ホームネットワークやパブリックホットスポットなど、802.11ワイヤレスローカルエリアネットワーク(WLAN)に関連付けられたプライマリ名です。クライアントデバイスはこの名前を使用して、ワイヤレスネットワークを識別して参加します。簡単に言うと、Wi-Fiネットワークの名前です。 ネットワークSSIDはどのように見えるか SSIDは大文字と小文字を区別するテキスト文字列で、文字と数字で構成される32文字までの長さです。これらのルールの範囲内で、SSIDは何でも言うことができます。 ワイヤレスネットワークに接続すると、範囲内にある別のネットワークや他のネッ

  2. ダブルVPNとは何ですか?どのように設定されていますか?

    VPNの傾向を追跡していると、「ダブルVPN」と呼ばれる新しい概念に出くわしたかもしれません。この用語が示すように、これは通常のVPNサービスにVPNプライバシーの第2層を追加することを意味します。これを実現する方法はたくさんあり、少数のVPNプロバイダーがすでにこの新機能を導入しています。 問題は、ダブルVPNを使用することでユーザーに実際のメリットがもたらされるのか、それとも単なる誇大広告なのかということです。さらに重要なのは、このような異常な接続をどのように設定するのでしょうか。ここでは、それを行うためのさまざまな方法をすべて取り上げます。 注 :このチュートリアルは、商用VPN