プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

例外値はどのように計算されますか?


データ異常の認識をサポートするための例外インジケーターとして使用される3つのメジャーがあります。これらの測定値は、セル内の量がその期待値に関して影響を与えるという驚きの程度を示します。

メジャーは計算され、すべてのレベルの集計についてすべてのセルに関連付けられます。 SelfExp、InExp、およびPathExpの測定値は、テーブル分析の数値的アプローチに基づいています。

セル値は、その期待値が統計モデルで決定される場合の期待値との違いに応じて、例外として扱われます。与えられたセル値とその期待値の差は残差として知られています。

直感的には、残差が大きいほど、提供されるセル値は例外になります。残差値を比較するには、残差に関連する予想される標準偏差に基づいて値をスケーリングする必要があります。したがって、セルの値は、スケーリングされた残差値が事前に指定されたしきい値を超えた場合、例外と見なされます。

SelfExp、InExp、およびPathExpの測定値は、このスケーリングされた残差に基づいています。特定のセルの期待値は、提供されたセルのより大きなレベルのgroup-byのサービスです。たとえば、3次元のA、B、およびCを持つ立方体が与えられた場合、Aのi番目の位置、Bのj番目の位置、およびCのk番目の位置にあるセルの期待値はγ、γAiの関数です。使用される数値モデルの係数であるγBj、γCk、γABij、γACik、およびγBCjk。

係数は、より多くのレベルでの値の違いが、より大きなレベルの集計で表示することによって形成される一般化されたインプレッションに依存することを示しています。このアプローチでは、セル値の例外品質は、それに続く値の例外に依存します。したがって、例外を表示するときは、ユーザーがドリルダウンして例外を分析することが不可欠です。

この計算は、次のような3つのフェーズで構成されます-

  • 最初のステップには、例外が検出される合計またはカウントを含む、キューブを定義する集計値の計算が含まれます。

  • 2番目のフェーズはモデルフィッティングで構成され、係数が決定され、標準化された残差を計算するために使用されます。計算が同じであるため、このフェーズは最初のフェーズとオーバーラップする可能性があります。

  • 3番目のフェーズでは、標準化された残差に応じて、SelfExp、InExp、およびPathExpの値を計算します。このフェーズは、フェーズ1と計算上同等です。したがって、ディスカバリー駆動型の探索のためのデータキューブの計算を効果的に完了することができます。


  1. Excelの列の一意の個別の値の数をカウントする方法

    Excelシートの列全体のリストから一意の個別の値の数を並べ替えると、多くの目的に役立ちます。単一のイベント(または複数)に勝ったプレーヤーの数、または顧客に販売された(または個別の)ユニークなアイテムの数を計算する必要がある場合があります。このような状況では、このような並べ替えは非常に役立ちます。 Excelの列の一意の値をカウントする方法 配列数式を使用して、列のリストから一意の値の数を数えます 配列数式を使用して列のリストから一意の値の数をカウントするための構文は次のとおりです。 =SUM(IF(COUNTIF(<first cell from which you c

  2. Redis HVALS –ハッシュ値に含まれるすべての値を取得する方法

    このチュートリアルでは、キーに格納されているハッシュ値に含まれるすべての値を取得する方法について学習します。このために、Redis HVALSを使用します コマンド。 HVALSコマンド このコマンドは、指定されたキーに格納されているハッシュ値に含まれるすべてのフィールドの値を返します。キーが存在しない場合は空のリストが返され、キーは存在するがキーに格納されている値がハッシュデータ型ではない場合はエラーが返されます。 RedisHVALSコマンドの構文は次のとおりです。- 構文:- redis host:post> HVALS <keyname> 出力:- -