データステージングとは何ですか?
データウェアハウジングプロセスでは、データステージングサーバーソフトウェアのデータステージング領域と、抽出、変換、および読み込みアクティビティの結果のデータストアアーカイブ(リポジトリ)が収集されます。
データステージングソフトウェアサーバーは、OLTPデータソースから抽出されたデータを一時的に保存および変更し、アーカイブリポジトリは、データマートおよびデータウェアハウスにロードするために、クリーンアップされ、変換されたデータと属性を保存します。
データステージングプロセスは、情報をストリームまたはファイルとしてインポートし、変更し、統合されたクリーンなデータを生成し、データウェアハウス、データマート、またはオペレーショナルデータストアにロードするためにステージングします。
データステージングツールにアクセスでき、データはデータベースにあります。データフローは、ソースシステムの外に表示され、変換エンジンを介してステージングデータベースに変更されるように開始されます。
2番目の方法では、メインフレームのレガシーシステムから開始し、求められているレコードをフラットファイルに抽出し、ファイルをステージングサーバーに変更し、その内容を変換して、変換された情報をステージングデータベースにロードします。
>データウェアハウスのステージング領域は、ソースシステムからのデータが複製される一時的な領域です。データウェアハウスアーキテクチャでは、タイミング上の理由から、一般的にステージング領域が必要です。簡単に言うと、データをデータウェアハウスに統合する前に、必要なすべての情報を利用できるようにする必要があります。
さまざまなビジネスサイクル、データ処理サイクル、ハードウェアとネットワークリソースの制限、および地理的要素のため、すべての運用データベースからすべての情報を正確に同時に抽出することはできません。
例 −売上データを毎日抽出することは合理的ですが、毎日の抽出は、月末の調整手順が必要な財務情報には適していません。同様に、東部標準時の正午にシンガポールのデータベースから「顧客」データを抽出することは適していますが、シカゴのデータベースの「顧客」データには適していません。
データウェアハウス内のデータは、永続的(つまり、長期間存在する)または一時的(つまり、一時的にのみ存在する)にすることができます。すべての企業がデータウェアハウスのステージングエリアを必要としているわけではありません。多くの企業では、ETLを使用して、運用データベースからデータウェアハウスにデータを直接コピーするのが適しています。
データステージングの長所と短所
利点
-
ステージングプロセスは、変換プロセスと並行して制御されます。
-
ステージングテーブルへの書き込み、書き込み、および再抽出のみが行われるため、ディスクI/Oは半分に減少します。
短所
-
変換プロセスが低下すると、ステージングプロセスも停止します。
-
データセンターとは何ですか?
datacenterと綴られることもあるデータセンター (一言)は、多数のコンピュータサーバーと関連機器を含む施設に付けられた名前です。 データセンターは、壁を超えた「コンピュータールーム」と考えてください。会社のユーザー宛てのメール、財務記録、ウェブサイトのデータなど、あらゆる種類のデータを保存できます。 データセンターは何に使用されますか? 一部のオンラインサービスは非常に大きいため、1台または2台のサーバーから実行できません。代わりに、これらのサービスを機能させるために必要なすべてのデータを保存および処理するために、数千または数百万台の接続されたコンピューターが必要です。 たと
-
シリアル化とは
最近のプロジェクト更新会議で、私のチームは、シリアライゼーションを使用してこのアプリケーションとの間でデータをやり取りする方法について話しました。 ソフトウェア プロジェクトにもっと関わりたいと考えていたあるエンジニアは、この用語になじみがないと言っていました。 より大規模なプロジェクトに飛び込むまで発生しない、このような重要なプロセスを見落としがちです。ある時点で私がそうであったように、これはこの人に当てはまりました。 だからそれについて書きたかった。その日、私は同僚がシリアライゼーションについて学ぶのを手伝いました。あなたは今日それについて学ぶことになります. シリアライゼーシ