Redis
 Computer >> コンピューター >  >> プログラミング >> Redis

TectonとRedisEnterpriseCloudを使用した高速機械学習の提供

リアルタイムの機械学習(ML)アプリケーションは、クレジットカード取引の承認から、お気に入りのストリーミングサービスのパーソナライズされた推奨事項の即時生成まで、あらゆる場所にあります。これらのアプリケーションには遅延はありません。超低遅延の推論(100ミリ秒以下)を提供するには、最新のデータにライブアクセスする必要があります。開発者と組織に大規模なMLアプリケーションの費用対効果の高いリアルタイム機能を提供するために、TectonとRedisEnterpriseCloudのファーストクラスの統合を共同で発表できることを嬉しく思います。

Redis Enterprise CloudはRedisの最高のバージョンであり、クラス最高のパフォーマンス、スケーラビリティ、費用対効果をクラウドベンダー全体に提供します。 Redisは、Stack Overflowの年次開発者調査で、5年連続で開発者から最も愛されているデータベースに選ばれています。金融サービス、eコマース、ゲーム業界で人気のあるRedisは、最も厳しいレイテンシ(サブミリ秒)と高可用性の要件を満たした実績があり、リアルタイムMLアプリケーションのニーズに対応するのに最適です。

Tectonは、MLプロジェクトの生産までの時間を短縮しようとしている企業向けの主要な機能ストアです。その基盤は、UberのすべてのMLアプリケーションに電力を供給するプラットフォームであるUberミケランジェロを構築した経験から生まれました。 Tectonは、本番MLアプリケーションのデータパイプラインと機能を運用および管理するためのシステムです。典型的な使用例には、不正検出、リアルタイムの推奨、動的な価格設定、およびパーソナライズが含まれます。

TectonのFeatureStoreがRedisEnterpriseCloudと統合されてオンラインサービスが提供されるようになったため、低レイテンシで高スループットのMLユースケースをこれまでになく簡単かつ費用対効果の高い方法で作成できます。大規模に実行しているTectonユーザーの場合、ベンチマーク分析は、RedisEnterpriseがAmazonDynamoDBよりも3倍速いレイテンシーを達成すると同時に、14倍安価であることを示しています(Tectonのブログで詳細をご覧ください)。この記事では、RedisEnterpriseとTectonがどのように連携するかについて詳しく見ていきます。

TectonとRedisの統合方法

TectonとRedisを組み合わせてリアルタイムMLを実現する場所を理解するために、不正検出などのMLユースケースを作成する手順を見てみましょう。

  • まず、生データが必要です(たとえば、ユーザーのすべての履歴トランザクションと現在のトランザクションをリアルタイムで)。このデータは、企業全体のさまざまなデータウェアハウスおよびデータストリームに拡散している可能性があります。
  • モデルのフィーチャを生成するには、それらのデータソースに接続し、フィーチャを生成するデータ変換を定義して実行する必要があります。たとえば、ある機能では、過去6か月間のユーザーの平均トランザクション量を調べて、現在のトランザクションと比較する場合があります。
  • 最終的には、リアルタイムの予測を行うMLモデルに機能を提供する必要があります。これは、ユーザーが遅延を認識しないように、100ミリ秒未満のレイテンシで実行します。

TectonのFeatureStoreは、これらの手順を処理するように設計されており、機能変換とデータパイプラインを調整するすべての作業を抽象化して、データサイエンスチームとデータエンジニアリングチームがモデルの構築に集中できるようにします。ただし、Tectonはコンピューティングエンジンまたはデータベースではありません。代わりに、顧客がすでに使用しているインフラストラクチャの上に配置されているため、自分に合ったMLスタックを自由に構築できます。

Redis Enterprise Cloudはこれらのインフラストラクチャコンポーネントの1つであり、オンラインストアの新しい高性能オプションを顧客に提供します。 TectonのFeatureStoreで使用されています。

TectonとRedisEnterpriseCloudを使用した高速機械学習の提供

Tectonがオンラインストアとオフラインストアをどのように使用するか

TectonのFeatureStoreは、MLの2つの主要なアクセスパターンをサポートしています。モデルトレーニングのために数百万行の履歴データを取得することと、本番環境で実行されているモデルに機能を提供するために1行を数ミリ秒で取得することです。これらのユースケースは、パフォーマンスとコストのトレードオフの点で非常に異なるため、オフラインとオンラインの機能検索でさまざまなタイプのデータベースをサポートしています。

オフライン機能ストアの場合、TectonはS3をサポートします。これは、モデルトレーニングのニーズに対応するオフライン機能に合わせて拡張できる費用対効果の高いストレージを提供するためです。オンライン機能ストアの場合、Tectonは、DynamoDB(オンデマンドキャパシティモード)とRedisEnterpriseCloudのどちらかを柔軟に選択できるようになりました。

トレーニング-サービングスキューの排除

このデュアルデータベースアプローチがなければ、多くの組織はオフライントレーニングとオンラインサービスのために別々のデータパイプラインを実装します。パイプラインの実装方法にわずかな違いがあると、モデルのパフォーマンスが完全に低下する可能性があります。これは、モデルがトレーニングで確認するデータが、本番環境で検出されるデータと一致しないためです。この不一致はトレーニングサービングスキューと呼ばれ、デバッグには非常に時間がかかります。

TectonのFeatureStoreは、オフライン環境とオンライン環境の間でデータを調整することにより、トレーニング提供の偏りを自動的に解決するため、常に同期されます。ユーザーは、バッチ推論でのみオフラインストアの使用を開始できます。オンライン推論の準備ができたら、コードを1行更新して、オンラインストアへのデータの具体化を開始します。

RedisEnterpriseCloudのTectonユーザー向けの利点

大規模に運用しているTectonユーザーにとって、Redis Enterprise Cloudを使用する主な利点の1つは、パフォーマンスとコストの節約です。ハイスループットでオンライン機能を提供するベンチマーク分析に基づくと、RedisはDynamoDB onTectonよりも3倍高速で、14倍安価でした。

Redis Enterprise Cloudは、現在および将来の低遅延ストレージのニーズに対応できる優れた運用機能も提供します。 99.999%の稼働時間のSLA、複数のデータベースの永続性、バックアップ、およびリカバリのオプションを備えた高可用性を提供します。大規模な機能データセットをお持ちのお客様は、オンライン機能ストアをDRAMおよびSSDに階層化することで、さらにコストを削減できます。

開始方法

まだRedisEnterpriseCloudを使用していない場合は、ここでアカウントにサインアップできます。 TectonはAWSでネイティブに実行され、Redis Enterprise Cloudへのピアリング接続を確立できるため、Tectonユーザーはレイテンシを最小限に抑えるためにRedisEnterpriseCloudをAWSにデプロイすることをお勧めします。将来的には、Tectonは他のクラウドベンダープラットフォームのネイティブサポートを追加する予定です。

Tectonユーザーではなく、詳細を知りたい場合は、ここでTectonの無料トライアルに登録できます。


  1. Nuxt3とサーバーレスRedisの使用を開始する

    はじめに アプリケーションの使用状況を追跡したり、リソースの使用率を制限したり、キャッシュからデータをフェッチしてアプリのパフォーマンスを向上させたりする必要がある場合は、Redisがこれらの要件に対する答えであることがわかります。 Redisは、メモリ内のKey-Valueデータベースです。これはオープンソースであり、RemoteDictionaryServerの略です。 この記事では、Upstash、Redisデータベース、およびVueSSRフレームワークの最近のベータリリースであるNuxt3について説明します。これは、Redisデータベースについて説明する初心者向けの記事で、 Nux

  2. ビッグデータ、データ マイニング、機械学習の違いを理解する

    テクノロジーの急速な進化に伴い、私たちはデータの複雑なネットワークと漠然とした未来に向かっています。一方、世界中の業界は、ビッグデータ、データマイニング、機械学習などの革新的なテクノロジーを採用することで、完全な刷新を試みています。ここで、なぜ世界中のすべての企業がこれらのテクノロジーの採用に熱心なのか、基本的な概念は何なのか、それらは互いにどのように異なるのかという疑問が生じます。調べてみましょう。 ビッグデータ、データ マイニング、機械学習などのテクノロジーが必要なのはなぜですか? データに対する需要の高まりと競争の激化により、各企業はこれらのテクノロジーを自社のサービスに実装すること