データウェアハウスのプロセスとは何ですか?
データステージングは、次のサブプロセスを含む主要なプロセスです-
抽出 −抽出ステップは、データウェアハウス環境に情報を取り込む最初のフェーズです。抽出とは、ソースデータの読み取りと学習、および必要な要素のデータステージング領域へのコピーを定義します。
変革 −データはデータステージング領域に抽出されるため、次のようないくつかの可能な変換プロセスがあります-
-
スペルミスを修正し、ドメインの競合(郵便番号と矛盾する都市名を含む)を解決し、欠落しているデータコンポーネントを処理し、標準形式に決定することで、データをクリーンアップできます。
-
データウェアハウスにとって有益ではないレガシーレコードから選択したフィールドを削除するために使用できます。
-
キー値に正確に対応するか、レガシーシステムコードと同じテキストを検索するなど、キー以外の属性にあいまい一致を実装することで、データソースを結合できます。
-
ディメンションデータごとに代理キーを作成して、レガシー定義のキーへの依存を回避できます。代理キー生成プロセスでは、ディメンションテーブルとファクトテーブル間の参照整合性が実装されます。
-
これは、一般的なクエリの動作を強化するための集計を構築するために使用できます。
読み込みとインデックス作成 −変換フェーズの最後に、データはロードデータイメージの設計に含まれます。データウェアハウス環境での読み込みは、通常、ディメンションテーブルとファクトテーブルを反映し、これらのテーブルを各受信者データマートのサイズ読み込み機能に組み込むという形で行われます。
品質保証チェック −各データマートがロードされ、インデックスが作成され、適切な集計が提供されたら、アドバタイズする前の最後のステップは品質保証ステップです。品質保証は、新しくロードされたデータの完全なセットに対して包括的な例外ドキュメントを機能させることで確認できます。
すべてのレポート要素が存在する必要があり、すべてのカウントと合計が適切である必要があります。報告されたすべての値は、それらを予測する同じ値の時系列で信頼できる必要があります。例外ドキュメントは、データマートのエンドユーザードキュメント作成機能を使用して作成されます。
リリース/公開 −各データマートが現在ロードされ、品質が保証されたら、新しいレコードの準備ができたことをユーザーコミュニティに通知する必要があります。パブリッシングはまた、基本的な次元に現れた変更の性質と、測定または計算されたファクトに導入された新しい仮定を結び付けます。
クエリ −クエリとは、エンドユーザーによるアドホッククエリ、ドキュメントの作成、複雑な意思決定支援アプリケーション、モデルからのリクエスト、高度なデータマイニングなど、データマートに情報をリクエストするすべてのアクティビティを含む広い用語です。
-
データウェアハウスのセキュリティの問題は何ですか?
データウェアハウジングは、ビジネスに重要なビジネス洞察を与えるために、複数のソースからデータを収集して処理するために一般的に使用されるアプローチです。データウェアハウスは、管理上の意思決定をサポートするように特別に設計されています。 簡単に言うと、データウェアハウスは、組織の運用データベースから独立して維持されるデータベースを定義します。データウェアハウスシステムは、複数のアプリケーションシステムの統合を可能にします。分析用の統合された履歴情報の強固なプラットフォームを提供することにより、データ処理を提供します。 データウェアハウスは、データを多次元空間で一般化および一元化します。データウ
-
データウェアハウスの設計は何ですか?
データウェアハウジングは、複数のソースから情報を収集および管理して、ビジネスに重要なビジネス洞察をサポートできるアプローチです。データウェアハウスは、サポート管理の意思決定を目的として特別に作成されています。 データウェアハウスは、会社の運用データベースとは別に維持されるデータベースを定義します。データウェアハウスシステムは、複数のアプリケーションシステムの統合を可能にします。分析用の統合された履歴レコードの強固なプラットフォームをサポートすることにより、データ処理をサポートします。 データウェアハウスは、リモートベースエリアで定義されたマテリアライズドビューのグループと見なすことができま