プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データウェアハウス品質のためのさまざまなツールは何ですか?


データウェアハウスの品質を管理するためのさまざまなツールは次のとおりです-

品質の定義

品質の定義と定量化は、期待値に対するパフォーマンスの割合として示されています。これは、製品が委託されたときから社会に伝えられた損失として品質を定義するために使用されます。社会の完全な喪失は、生産者の喪失とユーザーの喪失の合計と見なすことができます。

製品またはサービスの品質と製造コストの間にはトレードオフがあり、組織はこれら2つのパラメーター間の平衡を発見する必要があることはよく知られています。均衡が失われた場合、組織はとにかく失敗します。

データ品質調査

データ品質の分野で複数の研究が完了しています。研究者と実務家の両方が、一般的に情報の質を改善することによって、意思決定支援システムの質を改善するという問題に直面しています。この領域に関連する作業を示すことができます。これは、データウェアハウスの品質の方法に多かれ少なかれ影響を及ぼしました。

このフレームワークには、管理責任、サービスと保証のコスト、研究開発、生産、流通、人事管理、法務サービスなど、ISO9000規格に準拠した7つの要素が含まれています。このフレームワークは、データ品質に関する文献の重要な部分をレビューしますが、データ品質の研究開発形式のみが、データウェアハウスの品質設計の原因と一致しているように見えます。

この分野に含まれる主な問題は、データ製品のデータ品質手法の分析と設計、データ品質手法を組み合わせたデータ製造システム(DMS)の設計、およびデータ品質指標の定義の3つです。

データ品質システムは、データ品質管理を実現するための組織構造、責任、プロセス、およびリソースを取り囲んでいます。データ品質管理は、データ製品に必要な品質を取得するために使用される一連の運用方法とアクティビティです。データ品質保証には、データ製品が特定の一連の品質仕様を満たすという十分な信頼をサポートするために不可欠な、準備された整然としたサービスがすべて含まれています。

データ品質

ウェアハウスに保存されるデータの品質は、それ自体がプロセスではありません。これは、倉庫環境で行われるすべてのプロセスの影響を受けます。いくつかのデータ品質要因は次のとおりです-

  • 完全性 factorは、ソースとウェアハウスに導入された興味深い実世界のデータの割合を定義します。

  • 信頼性 factorは、データをサポートしたソースの信頼性を定義します。

  • 精度 factorは、ソースに表示されたデータ入力手順の精度を定義します。

  • 一貫性 factorは、論理ルールと制約に関するデータの論理的一貫性を定義します。

  • データの解釈可能性 要因はデータ定義に関係します(つまり、レガシーシステムと外部レコードのデータ設計、リレーショナルデータベースのテーブル定義、主キーと外部キー、エイリアス、デフォルト、ドメイン、コード化された値の説明など)


  1. データキューブ計算の手法は何ですか?

    以下は、データキューブを効率的に計算するための一般的な最適化手法です。- 並べ替え、ハッシュ、グループ化 −関連付けられたタプルを並べ替えてクラスター化するには、ディメンション属性に対して並べ替え、ハッシュ、およびグループ化の操作を使用する必要があります。キューブ計算では、類似したディメンション値のセットを共有するタプルに集計が実装されます。したがって、そのような集計の評価をサポートするために、そのようなデータにアクセスしてグループ化するには、並べ替え、ハッシュ、およびグループ化サービスを分析することが不可欠です。 支店、日、アイテムごとの総売上高を計算できます。タプルまたはセルをブランチ

  2. ステガノグラフィのツールは何ですか?

    ステガノグラフィツールは、いくつかの形式のデータ内のドキュメントを非表示にするために使用されます。これらは、ステガノグラフィを実装するために必要なツールです。 S-Toolsを利用して、音声と画像のステガノグラフィで動作できます。 S-Toolsを使用すると、1つのオブジェクト内の複数のファイルを非表示にできます。ファイルは最初に個別に圧縮され、名前とともに保存されます。したがって、S-Toolsは、保存されたデータの前にランダムなガベージを配置して、復号化を困難にすることができます。 この後、送信者は復号化の鍵となる「パスフレーズ」を選択します。パスフレーズによると、ロット全体が暗号化さ