プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データウェアハウスとは何ですか?


データウェアハウジングは、主にさまざまなソースからデータを収集および管理して、ビジネスに有意義なビジネス洞察を与えるために使用される手法です。データウェアハウスは、管理上の意思決定をサポートするように特別に設計されています。

簡単に言うと、データウェアハウスは、組織の運用データベースから独立して維持されるデータベースを定義します。データウェアハウスシステムは、複数のアプリケーションシステムの統合を可能にします。分析用の統合された履歴情報の強固なプラットフォームを提供することにより、データ処理を提供します。

データウェアハウスは、データを多次元空間で一般化および一元化します。データウェアハウスの構築には、データクリーニング、データ統合、データ変換が含まれ、データマイニングの重要な前処理ステップと見なすことができます。

さまざまな粒度の多次元データをインタラクティブに分析するためのオンライン分析処理(OLAP)ツールを提供し、効果的なデータの一般化とデータマイニングを促進します。関連付け、分類、予測、クラスタリングなど、いくつかのデータマイニング機能をOLAP操作と統合して、さまざまな抽象化レベルで知識のインタラクティブなマイニングを構築できます。

データウェアハウスには、主に次の3つのタイプがあります-

エンタープライズデータウェアハウス(EDW) −エンタープライズデータウェアハウスは一元化されたウェアハウスです。データの整理と表現に使用されます。 EDWを使用すると、ユーザーは主題に基づいてデータを分類できます。

運用データストア −オペレーショナルデータストアでは、データウェアハウスがリアルタイムで更新されます。したがって、より一般的には、レコードの保存などの日常的なアクティビティに使用されます。

データマート −データマートは、データウェアハウスのサブセットとして定義できます。販売、財務などのために設計されています。

データウェアハウスの特徴

データウェアハウスには、次のようなさまざまな特徴があります-

  • 主題指向 −データウェアハウスは、意思決定者向けの情報のモデリングと分析を対象としています。したがって、データウェアハウスは通常、意思決定支援プロセスで有益ではない情報を除外することにより、特定の主題の問題の単純で簡潔なビューを提供します。

  • 統合 −データウェアハウスは通常、リレーショナルデータベース、フラットファイル、オンライントランザクションレコードなどの複数の異種ソースを統合することで構築されるため、データクリーニングとデータ統合の手法を使用して、命名規則、エンコードメカニズム、属性測定値に一貫性を持たせる必要があります。 、など。

  • 時変 −データは、履歴の観点(たとえば、過去5〜10年)からのデータを提供するために保存されます。データウェアハウスの各主要メカニズムには、暗黙的または明示的に、時間の要素が含まれています。

  • 不揮発性 −データウェアハウスは常に、運用環境で見つかったソフトウェアデータから変換されたデータの物理的に独立したストアです。この分離により、データウェアハウスはトランザクション処理、リカバリ、および同時実行制御構造を必要としません。通常、データアクセスには2つの操作(データの初期読み込みとデータへのアクセス)のみが必要です。


  1. データウェアハウスのチューニングとは何ですか?

    データウェアハウジングは、複数のソースからデータを収集して処理し、ビジネスに有意義なビジネス洞察を提供できるアプローチです。データウェアハウスは、管理上の意思決定をサポートするように特別に設計されています。 簡単に言うと、データウェアハウスは、組織の運用データベースから独立して維持されるデータベースを定義します。データウェアハウスシステムは、複数のアプリケーションシステムの統合を可能にします。分析用の統合された履歴情報の強固なプラットフォームを提供することにより、データ処理を提供します。 データウェアハウスは、データを多次元空間で一般化および一元化します。データウェアハウスの構築には、デー

  2. データウェアハウスの設計は何ですか?

    データウェアハウジングは、複数のソースから情報を収集および管理して、ビジネスに重要なビジネス洞察をサポートできるアプローチです。データウェアハウスは、サポート管理の意思決定を目的として特別に作成されています。 データウェアハウスは、会社の運用データベースとは別に維持されるデータベースを定義します。データウェアハウスシステムは、複数のアプリケーションシステムの統合を可能にします。分析用の統合された履歴レコードの強固なプラットフォームをサポートすることにより、データ処理をサポートします。 データウェアハウスは、リモートベースエリアで定義されたマテリアライズドビューのグループと見なすことができま