データベース
 Computer >> コンピューター >  >> プログラミング >> データベース

PolyBaseによる統合データプラットフォームとデータ仮想化:パート2

PolyBaseシリーズによるこのUDPデータ仮想化のパート1では、PolyBaseを紹介し、このデモの前提条件を提供しました。この最終回では、デモに飛び込むことができます。

デモ:AzureBLOBからデータをフェッチするようにSQLPolybaseを設定する手順

デモを実施するには、次の手順を実行します。

1。 BLOBに配置された外部テキストファイルにアクセスするようにSQLServer®を設定します

SQL ServerがAzure®BLOBに配置された外部テキストファイルにアクセスできるようにするには、次のクエリを実行します。

EXEC sp_configure @configname = 'hadoop connectivity', @configvalue = 7;
Go
PolyBaseによる統合データプラットフォームとデータ仮想化:パート2

図1


2。 SQL Serverデータベース、データベースマスターキー、および資格情報を設定します

ここで、既存のデータベースを使用するか、新しいデータベースを作成する必要があります。 PolybaseTestDBという名前の新しいものを作成しました このデモ用。

DBを取得したら、次のクエリを使用してデータベースマスターキーと資格情報を作成します。

CREATE MASTER KEY ENCRYPTION BY PASSWORD = 'Welcome@3452';
USE PolybaseTestDB
Go
CREATE DATABASE SCOPED CREDENTIAL [Polybasecred]
WITH
IDENTITY = ‘Polybaseaccount’,
SECRET=’qdfAVoBN+yr2rHN796gXFtpfhxKgAW3JDAtSPi0RnWcWgy9YRSwyGQR7BoINTHSgjiorUFTCmZpLTZspCbXesg==’;

上記のクエリでは、 SECRET 以前に作成したストレージアカウントのアクセスキーです。次の手順を実行することで取得できます:

  1. Azureポータル->ストレージアカウントに移動します 。
  2. ストレージアカウントをクリックします。
  3. 左側のペインで、[アクセスキー]を選択します 。
  4. キーは右側のペインに表示されます。
  5. 前のクエリでそれらをコピーして使用します。

3。作成したクレデンシャルを使用して外部データソースを作成します

次のクエリを実行して、外部データソースを作成します。作成後、DB外部リソースの下に外部データソースを見つけることができます。

CREATE EXTERNAL DATA SOURCE AzureStorage
WITH 
(
  TYPE = HADOOP,             
  LOCATION = 'wasbs://[email protected]',
  CREDENTIAL = [Polybasecred]
);
PolyBaseによる統合データプラットフォームとデータ仮想化:パート2

図2

注: Azure Storage Blobは、Hadoop®DistributedFile System(HDFS)APIの上に構築された拡張機能であるため、 TYPE 上記のクエリにはHadoopがあります 。


4。外部ファイル形式を作成する

次のクエリを実行します:

CREATE EXTERNAL FILE FORMAT TextFileFormat WITH (
FORMAT_TYPE = DELIMITEDTEXT,
FORMAT_OPTIONS (FIELD_TERMINATOR =',',USE_TYPE_DEFAULT = TRUE))             
PolyBaseによる統合データプラットフォームとデータ仮想化:パート2

図3


:カンマ区切りのテキストファイルであるため、 FIELD_TERMINATOR ‘,’


5。外部テーブルを作成する

次のクエリを実行します:

CREATE EXTERNAL TABLE dbo.SQLPolybaseTable (
  [Name] varchar(500),
  [Subject] varchar(500),
  [Education] varchar(500)
)
WITH (
  LOCATION='/Data.txt',          This is the name of the file uploaded to the container.
  DATA_SOURCE=AzureStorage,      The Data Source created in previous steps.
  FILE_FORMAT=TextFileFormat     The File Format Name created in previous steps.
);
PolyBaseによる統合データプラットフォームとデータ仮想化:パート2

図4


6。外部テーブルを照会する

SQL Serverの他のテーブルと同じように、外部テーブルをクエリします。結果は、PolyBaseが外部データのフェッチに役立つことを検証します。次のクエリを実行します:

Select * from <Tablename>
PolyBaseによる統合データプラットフォームとデータ仮想化:パート2

図5


結論

今後の投稿では、次の概念を詳しく調べる予定です。

  • 列指向ストアを介したデータマート
  • HDFSによるデータレイク
  • ビッグデータ、ML、ApacheSparkを介したストリーミング

また、このデモ中にいくつかの問題が発生したため、それらの経験を統合して、今後のブログで紹介したいと思います。

しばらくお待ちください!

データサービスの詳細をご覧ください。

コメントや質問をするには、[フィードバック]タブを使用します。私たちと会話を始めることもできます。


  1. 新しい Outlook プロファイルを作成して Outlook データ (*.PST) をインポートする方法

    場合によっては、現在の Outlook プロファイルの問題を解決するため、または特定の Outlook アカウントに別の個人用ストア データ ファイル (.pst) を指定するために、新しい Outlook プロファイルを作成する必要があります。 このチュートリアルでは、Outlook 2016、2013、2010、2007、および 2003 で新しい Outlook プロファイル (プライマリまたはセカンダリ) を作成するために必要な手順について説明します。このチュートリアルの 2 番目の部分では、インポートする方法を学習します。既存の Outlook 個人用フォルダー データ ファ

  2. Windows および Mac で外付けハード ドライブを再フォーマットする方法

    データのバックアップを外付けハード ドライブに保存していますか?うまくいけば、そうします。これは、データを安全に保つためのインテリジェントな方法です。しかし、外付けドライブが破損した場合はどうなるでしょうか? 心配しないでください。ハード ドライブを再フォーマットしてアクセスできるようにすることはできますが、データはどうでしょうか。繰り返しますが、心配する必要はありません。そのデータも回復できます。しかし、どのように? この投稿では、ドライブを再フォーマットし、フォーマットされたハード ドライブからデータを回復する方法について説明します。 その前に、フォーマットとは何かを知っておきましょ