プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データキューブ計算の手法は何ですか?


以下は、データキューブを効率的に計算するための一般的な最適化手法です。-

並べ替え、ハッシュ、グループ化 −関連付けられたタプルを並べ替えてクラスター化するには、ディメンション属性に対して並べ替え、ハッシュ、およびグループ化の操作を使用する必要があります。キューブ計算では、類似したディメンション値のセットを共有するタプルに集計が実装されます。したがって、そのような集計の評価をサポートするために、そのようなデータにアクセスしてグループ化するには、並べ替え、ハッシュ、およびグループ化サービスを分析することが不可欠です。

支店、日、アイテムごとの総売上高を計算できます。タプルまたはセルをブランチごとに、つまり日ごとに並べ替えてから、アイテム名ごとにグループ化する方が効果的です。巨大なデータセットでのこのような操作の効果的なパフォーマンスは、データベース研究コミュニティで広く検討されています。

このようなパフォーマンスは、データキューブの計算まで継続できます。この方法は、共有ソートの実装(つまり、ソートベースの手法が使用されている場合は異なる直方体間でのソートコストの共有)、または共有パーティションの実装(つまり、ハッシュベースのアルゴリズムの場合は異なる直方体間でのパーティション化コストの共有)を継続することもできます。利用されます。

中間結果の同時集計とキャッシュ −キューブの計算では、基本ファクトテーブルからではなく、以前に計算された下位レベルの集計から上位レベルの集計を計算することが効果的です。さらに、キャッシュされた中間計算結果からの同時集計は、高額なディスク入出力(I / O)操作の低下につながる可能性があります。

たとえば、支店ごとの売上を計算できます。たとえば、支店別および日別の売上を含む、下位レベルの直方体の計算から変更された中間結果を使用できます。この方法は、償却スキャンを実装するために継続できます(つまり、ディスク読み取りを償却するために、可能な限り複数の直方体を同時に計算します)。

複数の子直方体が存在する場合の最小の子からの集計 −複数の子直方体が存在する場合、通常、以前に計算された最小の子直方体から目的の親(つまり、より一般化された)直方体を計算する方が効果的です。

Aprioriの剪定方法を検討して、氷山の立方体を効率的に計算できます −データキューブのコンテキストでのAprioriプロパティ。次のように定義されます。特定のセルが最小サポートを満たさない場合、そのセルの子孫(つまり、より具体的なセル)は最小サポートを満たしません。このプロパティを使用すると、氷山の立方体の計算を大幅に減らすことができます。

氷山キューブの説明には、氷山の状態が含まれています。これは、実体化されるセルに対する制約です。一般的な氷山の条件は、セルが最小カウントまたは合計を含む最小サポートしきい値を満たす必要があることです。この用語では、Aprioriプロパティを使用して、セルの子孫の検査を短縮できます。


  1. ステガナリシスのテクニックは何ですか?

    ステガノグラフィは、隠されたデータを検出し、それを抽出または破壊することによってステガノグラフィを打ち負かそうとするテクノロジーです。ステガノグラフィは、ビットパターンと異常に高いファイルサイズの間の差異を表示することによってステガノグラフィを検出する手順です。これは、意味のない秘密のメッセージを見つけてレンダリングする技術です。 ステガナリシスの主な目的は、疑わしいデータストリームを認識し、それらに隠しメッセージがエンコードされているかどうかを判断し、該当する場合は隠しデータを復元することです。 ステガナリシスは通常、いくつかの疑わしいデータストリームから始まりますが、これらのいずれかに

  2. データ暗号化の技術は何ですか?

    データ暗号化のいくつかのテクニックは次のとおりです- DES −DESはDataEncryptionStandardの略です。データ暗号化規格(DES)アルゴリズムは、1970年代初頭にIBMによって発明されました。 64ビットブロックのプレーンテキストを受け入れ、情報を暗号化するために64ビットキーを必要とする暗号文に変換します。アルゴリズムは、情報を暗号化および復号化するために同じキーを必要とします。 DESは、デジタルデータを暗号化できる対称鍵アルゴリズムです。キーの長さが56ビットと短いため、DESは安全性が低く、暗号化に基づく現在のほとんどのアプリケーションを保護できません。