Redis ソートセットを使用してインテリジェントオートコンプリートを構築する

入力中に検索ボックスがどのように単語を提案するかに気づいたことがありますか?結局のところ、これらの提案のほとんどは単純なアルファベット順に表示されており、あまり役に立ちません。

しかし、検索ボックスが時間の経過とともにより賢くなる可能性があるとしたらどうでしょうか?

ユーザーが実際にクリックした内容から学び、最も人気のある結果を最初に表示しますか?

これから構築するものは次のとおりです:

Redis Sorted Sets が、ユーザーの行動から学習し、時間の経過とともにより正確になる (人気のある結果を最初に表示する) インテリジェントなオートコンプリートシステムを強化する方法を見ていきます。

スマートオートコンプリートシステムのアイデア

基本的な検索ボックスは、プレフィックスマッチングと呼ばれる方法を使用して、どの結果を最初に表示するかを決定します。

入力すると、一致するものが A-Z の順に表示されます。実際には、人々が実際にどの結果を最も多くクリックしたかは気にしません。

よりスマートにしていきます。私たちの検索ボックスはユーザーの選択から学習します。。ユーザーが検索結果をクリックすると、次回からはその結果が最初に表示されます。

これは、最も人気のある結果を自動的に上部に表示することで、検索が時間の経過とともにさらに改善され、より便利になることを意味します。

これが検索アプリケーションにとって重要な理由

映画検索アプリケーションを考えてみましょう。ユーザーが「int」と入力したときです。彼らは次のことを目にするかもしれません:

「インターセプター」
「州間高速道路 60 号線」
「インターステラー」

「従来の」システムでは、これらはアルファベット順に表示されます。ただし、ユーザーが一貫して「Interstellar」をクリックする場合は、それをオートコンプリート候補の最上位に昇格させたいと考えます。

Redis ソートセットを使用してインテリジェントオートコンプリートを構築する

このスマートなランキングシステムは、以下の場合に非常に効果的です。

ストリーミングサービス Netflix や YouTube など、人々が最も見ているものを表示する
オンラインストア 検索時に人気の商品を最初に表示する
ヘルプセンター 人々から寄せられる最も一般的な質問を表示する
検索機能のあるウェブサイト ほとんどの人が最初にクリックするものを表示する

Redis のソートセットについて

Redis ソートセットがオートコンプリートシステムの構築に最適である理由を理解しましょう。

Redis ソートセットは、次のようなスマートリストのようなものです。

各項目は（セットのように）固有です
各アイテムにはスコアがあります（注文用）
アイテムをスコアに基づいてすばやく並べ替えることができます

オートコンプリートシステムでは、2 つのソートセットを使用します。

<オル>

テキストのプレフィックスを一致させるための 1 つ（例:「int」は「interstellar」と一致します）

各提案の人気を追跡するためのもう 1 つ

これら 2 つのセットは連携して、ユーザーの入力時に最も関連性の高い結果を提案します。

財団:アルファベット順

Redis ソートセットは、すべてのメンバーが同じスコアを持つ場合、アルファベット順を維持します。これは、次のことが可能になるため、検索候補を作成するのに最適です。

<オル>

すべてのプレフィックスを保存する 単一のデータ構造内で検索可能な用語の数

ZRANK を使用します O(log N) 時間で任意のプレフィックスの開始位置を見つける

ZSCAN を使用します その位置から始まるすべての一致を効率的に取得する

ZMSCORE を使用します 各試合の人気スコアを取得する

ZINCRBY を使用します 各試合の人気スコアを増加させる

簡単な例を見てみましょう。映画「INTERSTELLAR」を検索システムに追加すると、次のように分類されます。

スコア:0、メンバー:"I"
スコア:0、メンバー:"IN"
スコア:0、メンバー:"INT"
スコア:0、メンバー:"INTE"
スコア:0、メンバー:「INTER」
スコア:0、メンバー:"INTERSTELLAR$Interstellar" (表示形式付きの完全なエントリ)

$ の使用方法をご覧ください。検索バージョンと表示バージョンを分割するには?こうすることで、ユーザーは大文字か小文字かを気にせずに検索できますが、映画のタイトルは正確に表示されます。

データの保存方法

オートコンプリートを機能させるために、2 つの Redis ソートセットを使用します。

1.映画タイトルリスト

movies というソートされたセットを追跡しましょう。。これは、映画をすばやく見つけるのに役立つ辞書のようなものだと考えてください。誰かが「int」と入力すると、その文字で始まるすべての映画を即座に見つけることができます。

「int」の最初の出現は ZRANK によって検出されます。そして、その位置からワイルドカード INT*$* を使用して完全なムービー名を開始します。

が取得されます。

2.人気の映画リスト

movie-popularity というソートされたセットも追跡しましょう。。これは私たちの「トレンド映画」リストです。

検索結果で映画をクリックするたびに、ZINCRBY を使用してスコアが増加し、その映画の人気が高まります。。最もクリックされた映画が、今後の検索で最初に表示されます。

これは、Netflix がトレンドの映画を表示するのと同じです。視聴する人が増えるほど、おすすめの上位に表示されます。

私たちの場合、INT*$* の完全一致を見つけた後、 movie-popularity でスコアを確認します。最も人気のあるものを取得します。

アルゴリズムフロー

graph TD
 A[User types 'int'] --> B[ZRANK: Find lexicographic position of 'INT']
 B --> C[ZSCAN: Retrieve matches starting from position (movies set)]
 C --> D[Filter: Extract complete terms containing '$']
 D --> E[ZMSCORE: Get popularity scores for all matches (movie-popularity set)]
 E --> F[Rank: Return highest-scored suggestion]
 G[User selects suggestion] --> H[ZINCRBY: Increment popularity score]
 H --> I[Future searches: Higher scored items rank first]
 I --> A

ユーザーが検索して候補をクリックすると、システムが学習して改善します。より多くの人が使用するほど、最も関連性の高い提案が最初に表示されるようになります。

オートコンプリートシステムを構築してみましょう

このオートコンプリートシステムを構築する方法を段階的に見てみましょう。非常にシンプルにしていきます。

ステップ 1:映画のタイトルを Redis に追加する

まず、後で検索できるように、映画のタイトルを Redis に追加する必要があります。データベースやテキストファイルなど、どこからでも映画の単純なリストを作成して始めることができます。それらを追加する方法は次のとおりです。

import { Redis } from "@upstash/redis";
 
const redis = new Redis({
 url: process.env.UPSTASH_REDIS_URL!,
 token: process.env.UPSTASH_REDIS_TOKEN!,
});
 
// Example: your list of titles
const titles = [
 "Interceptor",
 "Interstate 60",
 "Interstellar",
 // ... more titles
];
 
async function populateAutocomplete() {
 // Insert prefixes and full titles into the 'movies' sorted set
 for (const title of titles) {
 let term = title.toUpperCase();
 let terms = [];
 for (let i = 1; i < term.length; i++) {
 terms.push({ score: 0, member: term.substring(0, i) });
 }
 terms.push({ score: 0, member: term });
 terms.push({ score: 0, member: term + "$" + title });
 await redis.zadd("movies", ...terms);
 }
 
 // Insert all titles into the 'movie-popularity' sorted set for popularity tracking
 await redis.zadd(
 "movie-popularity",
 ...titles.map((title) => ({
 score: 0,
 member: title.toUpperCase(),
 })),
 );
}
 
populateAutocomplete();

上記のコードの動作を詳しく見てみましょう。

<オル>

映画のタイトルごとに、以下を保存します。

すべての可能な部分一致 (「Interstellar」の「INT」、「INTE」、「INTER」など)
完全なタイトル自体
表示用にフォーマットされたバージョン

また、再生回数ゼロから始まる各映画の人気を追跡する別のリストも作成します。

これにより、ユーザーが入力したときにスマートな提案を表示し、クリック内容から学習するために必要なすべてが得られます。

ステップ 2:最適な一致を見つける

次に、これらの映画タイトルを検索して一致するものを見つける方法を見ていきます。私たちの matchQuery 関数は面倒な作業をすべて実行します。

export const matchQuery = async (query: string): Promise<string | null> => {
 const upperQuery = query.toUpperCase();
 
 // Step 1: Find starting position using lexicographic ordering
 let rank = await redis.zrank("movies", upperQuery);
 if (rank === null) return null;
 
 // Step 2: Efficiently scan for matches from that position
 const scanResult = await redis.zscan("movies", rank, {
 match: `${upperQuery}*$*`,
 count: 1000,
 });
 
 // Step 3: Extract complete entries and get their popularity scores
 const completeTitles = scanResult[1].filter(
 (el, idx) => idx % 2 === 0 && el.includes("$"),
 );
 
 const baseNames = completeTitles.map((title) => title.split("$")[0]);
 const scores = await redis.zmscore("movie-popularity", baseNames);
 
 // Step 4: Return the highest-scored (most popular) match
 const maxScore = Math.max(...scores);
 const bestMatchIndex = scores.indexOf(maxScore);
 return completeTitles[bestMatchIndex].split("$")[1];
};

ユーザーの選択から学ぶ

誰かが映画のタイトルを選択すると、そのスコアに 1 ポイントが追加されます。ポイントが多い映画ほど、候補リストの上位に表示されます。とても簡単です!

このシステムは、ユーザーが実際に何を選択したかを追跡することで、時間の経過とともに賢くなっていきます。

const onSubmit = async (title: string) => {
 // Handle submit logic here
 await redis.zincrby("movie-popularity", 1, title.toUpperCase());
};

どれくらい速いですか?

各操作にかかる時間を分析して、このソリューションの速度を見てみましょう。

Zランク :O(log N) - 対数検索時間
ZSCAN :O(log N + M) - ここで、M は返される要素の数です
ZMS スコア :O(N) - ここで、N はデータセットの合計サイズではなく、一致した結果の数です
ジンクラビー :O(log N) - 対数複雑度を伴うアトミック増分

さらに映画タイトルを追加しても、パフォーマンスは安定します。

結論:私たちが一緒に構築したもの

AI を使用せずに、時間の経過とともに改善されるスマート検索ボックスを構築する方法を学習しました。

私たちのオートコンプリートは人々が何を選択したかから学習し、その情報を使用してより良い提案を表示します。

高速かつシンプルで、使用する人が増えれば増えるほど便利になります。

Redis の最適化戦略について話したり、独自の実装を共有したりしたいですか? Discord に参加してください!

Mastra と Upstash を使用して AI 論文リサーチアシスタントを構築する

SQL パフォーマンスの向上:Drizzle ORM クエリ用の Upstash Redis キャッシュ

Redis Cache をインストールおよび構成する方法:包括的なガイド
Redis Cache と、それをインストールおよび構成するさまざまな方法について説明します。議題概要キャッシュとは何ですか? Redis キャッシュ Redis キャッシュサーバーのインストール Docker を使用した Redis キャッシュイメージ概要キャッシュはアプリケーションのパフォーマンスとスケーラビリティを向上させるため、現在ソフトウェア業界で非常に人気があります。私たちは Gmail や Facebook などの多くの Web アプリケーションを使用しており、それらの応答性と優れたユーザーエクスペリエンスを確認しています。インターネットを使用するユーザーは
Redis Jedis pubsub-jedisライブラリを使用してpub/subシステムを実装する方法
このチュートリアルでは、Jedisライブラリを使用してredispubサブシステムを実装する方法について学習します。ジェダイライブラリ Jedisは、redisデータストア用のJavaクライアントライブラリです。小さくて非常に使いやすく、redis 2.8.x、3.x.x以降のデータストアと完全に互換性があります。 jedisライブラリの詳細についてはこちらをご覧ください。 Redis Pub / Sub System Redisは、パブリッシュ/サブスクライブメッセージングパラダイムを実装します。このメッセージングパラダイムによれば、メッセージの送信者（発行者）は、メッセージ

Redis ソート セットを使用してインテリジェント オートコンプリートを構築する

スマート オートコンプリート システムのアイデア

これが検索アプリケーションにとって重要な理由

Redis のソート セットについて

財団:アルファベット順

データの保存方法

1.映画タイトルリスト

2.人気の映画リスト

アルゴリズム フロー

オートコンプリート システムを構築してみましょう

ステップ 1:映画のタイトルを Redis に追加する

ステップ 2:最適な一致を見つける

ユーザーの選択から学ぶ

どれくらい速いですか?

結論:私たちが一緒に構築したもの

Redis ソートセットを使用してインテリジェントオートコンプリートを構築する

スマートオートコンプリートシステムのアイデア

Redis のソートセットについて

アルゴリズムフロー

オートコンプリートシステムを構築してみましょう