プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

転置インデックスとフォワードインデックスの違い


転置インデックスと順インデックスは、ドキュメントまたはドキュメントのセット内のテキストを検索するために使用されるデータ構造です。

転置インデックス

転置インデックスは、単語をインデックスとして保存し、ドキュメント名をマップされた参照として保存します。

フォワードインデックス

Forward Indexは、ドキュメント名をインデックスとして保存し、単語をマップされた参照として保存します。

以下は、転置インデックスと順インデックスの重要な違いの一部です。

転置インデックス フォワードインデックス 本の冒頭の目次、DNSルックアップ。
Sr。いいえ。 キー
1 マッピングパターン 転置インデックスは、単語をインデックスとして保存し、ドキュメント名をマップされた参照として保存します。 Forward Indexは、ドキュメント名をインデックスとして、単語をマップされた参照として保存します。
2 インデックス作成プロセス
  • ドキュメントをスキャンし、固有の単語のリストを作成します。

  • すべての一意の単語のインデックスのリストを作成し、それらをドキュメント検索にマップします。

  • すべてのドキュメントに対して上記の手順を繰り返します。

  • ドキュメントをスキャンし、固有の単語のリストを作成します。

  • すべての単語をインデックスとしてドキュメントにマッピングします。

  • すべてのドキュメントに対して上記の手順を繰り返します。

3 インデックス作成 転置インデックスでは、インデックスを作成する前に各単語をチェックする必要があるため、インデックス作成が遅くなります。 フォワードインデックスでは、キーワードが見つかったときに追加されるため、インデックス作成が高速になります。
4 検索 転置インデックスでは、検索は非常に高速です。 フォワードインデックスでは、検索が遅くなります。
5
Word Documents
-------------------------
Welcome doc1
Hello doc1, doc3
Hi doc2
-------------------------
Word Documents
-------------------------
doc1 Welcome, Hello
doc2 Hi
doc3 Hello
-------------------------
6 重複 転置インデックスでは、重複するキーワードはインデックスに保存されません。 フォワードインデックスでは、「Hello」のようなインデックスに重複するキーワードが存在する可能性があります。
7 実際の例 インデックスの最後にある用語集、リバースルックアップ。

  1. アルゴリズムとフローチャートの違い

    この投稿では、フローチャートとアルゴリズムの違いを理解しましょう。 アルゴリズム これは、明確に定義された一連のステップとして定義されます。 これらの手順は、手元にある問題を解決する/解決する方法を提供します。 これは体系的で論理的なアプローチであり、手順は段階的に定義されます。 特定の問題の解決策を提供します。 このソリューションはマシンコードに変換され、システムによって実行されて関連する出力が得られます。 多くの単純な操作を組み合わせて、より複雑な操作を形成します。これは、コンピューターによって簡単に実行されます。 アルゴリズムは、自然言語、フローチャートなどを使用して表すことができます

  2. BFSとDFSの違い

    BFSとDFSはグラフ走査アルゴリズムです。 BFS 幅優先探索(BFS)アルゴリズムは、グラフを横方向に移動し、キューを使用して、反復で行き止まりが発生したときに、次の頂点を取得して検索を開始することを忘れないようにします。 DFS 深さ優先探索(DFS)アルゴリズムは、グラフを深さ方向に移動し、スタックを使用して、反復で行き止まりが発生したときに、次の頂点を取得して検索を開始することを忘れないようにします。 以下は、BFSとDFSの重要な違いです。 Sr。いいえ。 キー BFS DFS 1 定義 BFS、幅優先探索の略です。 DFS、