プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

MBRの要素は何ですか?


MBRには次のようなさまざまな要素があります-

トレーニングセットの選択 −トレーニングセットには、この目標のためのニュース検索サービスによってサポートされた49,652のニュース記事が含まれていました。これらの記事は、約3か月のニュースと約100の複数の情報源から掲載されています。

各ストーリーには、平均して2,700語が含まれ、8つのコードが作成されました。トレーニングセットは特に作成されていないため、トレーニングセットのコードの頻度は大きく異なり、ニュース記事のコードの完全な頻度を模倣しています。

距離関数の選択 −次のフェーズは、距離関数を選択することです。この方法では、距離関数が存在し、関連性フィードバックと呼ばれる概念に依存します。この概念は、含まれる単語に基づいて2つのファイルの類似性を計算します。サイドバーでより完全に定義されている関連性フィードバックは、検索を絞り込む方法として、特定のドキュメントに類似したファイルを返すために作成されました。同じファイルがMBRに使用されるネイバーです。

組み合わせ機能の選択 −次の決定は組み合わせ関数です。ニュース記事に分類コードを作成することは、ほとんどの分類問題とは異なります。いくつかの分類の問題は、単一の最良の解決策を求めています。ただし、ニュースストーリーには、同じ要素からでも複数のコードを含めることができます。 MBRをこの問題に適応させる能力は、その柔軟性を際立たせます。

組み合わせ関数には、加重和アプローチが必要です。最大距離が1であったため、重みは簡単に1から距離を引いたものになりました。したがって、重みは、距離が短い隣人の場合は大きく、距離が遠い隣人の場合は小さくなります。

近隣の数の選択 −調査は、1から11までの最近傍の数を多様化しました。より多くのネイバーを使用すると、最良の結果が得られます。ただし、このケーススタディは、ストーリーごとにいくつかのカテゴリを作成しているため、MBRのいくつかのアプリケーションとは異なります。一般的な問題は、個々のカテゴリまたはコードのみを作成することであり、最良の結果を得るには、より少ないネイバーで十分です。

コーディングにおけるMBRの効果を計算できます。ニュースサービスでは、編集者またはMBRによって200ストーリーに割り当てられたコードを、編集委員会がレビューしました。パネルの過半数によって合意されたいくつかのコードが「正しい」と扱われました。

「正しい」コードと、人間の編集者によって最初に作成されたコードとの比較は興味深いものでした。 (人間によって)ストーリーに対して最初に作成されたコードの88%は正しいものでしたが、人間の編集者は間違いを犯しました。


  1. C言語のキューに挿入する要素は何ですか?

    データ構造は、構造化された方法で編成されたデータのコレクションです。以下に説明するように、2つのタイプに分けられます- 線形データ構造 −データは直線的に編成されます。たとえば、配列、構造、スタック、キュー、リンクリスト。 非線形データ構造 −データは階層的に編成されています。たとえば、ツリー、グラフ、セット、テーブル。 キュー これは線形データ構造であり、挿入は後端で行われ、削除は前端で行われます。 キューの順序はFIFO–先入れ先出しです。 操作 挿入–要素をキューに挿入します。 削除–キューから要素を削除します。 条件 キューオーバーフロー-要素を完全

  2. C#のコメントは何ですか?

    コメントはコードの説明に使用されます。コンパイラはコメントエントリを無視します。 C#プログラムの複数行コメントは、以下に示すように/ *で始まり、文字*/で終わります。 複数行のコメント /* The following is a mult-line comment In C# /* /*...*/はコンパイラによって無視され、プログラムにコメントを追加するために配置されます。 1行のコメント // variable int a = 10; 以下は、単一行コメントと複数行コメントを追加する方法を示すサンプルC#プログラムです- 例 using System; namespace Dem