プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データステージングとは何ですか?


データウェアハウジングプロセスでは、データステージングサーバーソフトウェアのデータステージング領域と、抽出、変換、および読み込みアクティビティの結果のデータストアアーカイブ(リポジトリ)が収集されます。

データステージングソフトウェアサーバーは、OLTPデータソースから抽出されたデータを一時的に保存および変更し、アーカイブリポジトリは、データマートおよびデータウェアハウスにロードするために、クリーンアップされ、変換されたデータと属性を保存します。

データステージングプロセスは、情報をストリームまたはファイルとしてインポートし、変更し、統合されたクリーンなデータを生成し、データウェアハウス、データマート、またはオペレーショナルデータストアにロードするためにステージングします。

データステージングツールにアクセスでき、データはデータベースにあります。データフローは、ソースシステムの外に表示され、変換エンジンを介してステージングデータベースに変更されるように開始されます。

2番目の方法では、メインフレームのレガシーシステムから開始し、求められているレコードをフラットファイルに抽出し、ファイルをステージングサーバーに変更し、その内容を変換して、変換された情報をステージングデータベースにロードします。

>

データウェアハウスのステージング領域は、ソースシステムからのデータが複製される一時的な領域です。データウェアハウスアーキテクチャでは、タイミング上の理由から、一般的にステージング領域が必要です。簡単に言うと、データをデータウェアハウスに統合する前に、必要なすべての情報を利用できるようにする必要があります。

さまざまなビジネスサイクル、データ処理サイクル、ハードウェアとネットワークリソースの制限、および地理的要素のため、すべての運用データベースからすべての情報を正確に同時に抽出することはできません。

−売上データを毎日抽出することは合理的ですが、毎日の抽出は、月末の調整手順が必要な財務情報には適していません。同様に、東部標準時の正午にシンガポールのデータベースから「顧客」データを抽出することは適していますが、シカゴのデータベースの「顧客」データには適していません。

データウェアハウス内のデータは、永続的(つまり、長期間存在する)または一時的(つまり、一時的にのみ存在する)にすることができます。すべての企業がデータウェアハウスのステージングエリアを必要としているわけではありません。多くの企業では、ETLを使用して、運用データベースからデータウェアハウスにデータを直接コピーするのが適しています。

データステージングの長所と短所

利点

  • ステージングプロセスは、変換プロセスと並行して制御されます。

  • ステージングテーブルへの書き込み、書き込み、および再抽出のみが行われるため、ディスクI/Oは半分に減少します。

短所

  • 変換プロセスが低下すると、ステージングプロセスも停止します。


  1. データセンターとは何ですか?

    datacenterと綴られることもあるデータセンター (一言)は、多数のコンピュータサーバーと関連機器を含む施設に付けられた名前です。 データセンターは、壁を超えた「コンピュータールーム」と考えてください。会社のユーザー宛てのメール、財務記録、ウェブサイトのデータなど、あらゆる種類のデータを保存できます。 データセンターは何に使用されますか? 一部のオンラインサービスは非常に大きいため、1台または2台のサーバーから実行できません。代わりに、これらのサービスを機能させるために必要なすべてのデータを保存および処理するために、数千または数百万台の接続されたコンピューターが必要です。 たと

  2. シリアル化とは

    最近のプロジェクト更新会議で、私のチームは、シリアライゼーションを使用してこのアプリケーションとの間でデータをやり取りする方法について話しました。 ソフトウェア プロジェクトにもっと関わりたいと考えていたあるエンジニアは、この用語になじみがないと言っていました。 より大規模なプロジェクトに飛び込むまで発生しない、このような重要なプロセスを見落としがちです。ある時点で私がそうであったように、これはこの人に当てはまりました。 だからそれについて書きたかった。その日、私は同僚がシリアライゼーションについて学ぶのを手伝いました。あなたは今日それについて学ぶことになります. シリアライゼーシ