プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

距離関数とは何ですか?


距離は、MBRが類似性を計算する方法です。いくつかの真の距離メトリックの場合、d(A、B)で示されるポイントAからポイントBまでの距離には、次の4つの特徴があります-

  • 明確に定義された − 2点間の距離は継続的に定義され、非負の実数、d(A、B)≥0です。

  • アイデンティティ − 1つの点からそれ自体までの距離は常にゼロであるため、d(A、A)=0です。

  • 可換性 −方向によって差が生じることはないため、AからBまでの距離は、BからAまでの距離と同様です。d(A、B)=d(B、A)。この機能は、たとえば片道を排除します。

  • 三角不等式 − AからBまでの方法で中間点Cに到達する可能性があるため、距離が圧縮されることはありません。したがって、d(A、B)≥d(A、C)+ d(C、B)。

MBRの場合、ポイントは確かにデータベース内のデータです。この距離の記述は類似性を計算するための基礎ですが、これらの制約のいくつかが少し構成されている場合、MBRは非常にうまく機能します。

たとえば、ニュース記事の定義のケーススタディの距離関数は、ニュース記事Aから別のBまでの距離が、BからAまでの距離と継続的に同じにならないように変更できませんでした。ただし、類似度は分類の目的で有益でした。 。

距離が明確に定義されているという事実は、各データにデータベースのどこかにネイバーがあり、MBRでネイバーが機能する必要があることを意味します。アイデンティティプロパティは、特定のデータに最も類似したデータが初期レコード自体であるという直感的な概念に準拠した距離を作成します。

可換性と三角不等式は、ローカルで明確に定義された最近傍を作成します。データベースに新しいデータを挿入しても、既存のレコードが少し近づくことはありません。類似性は、一度に2つのデータのみに予約されている問題です。距離測度で最近傍を検出できることは明確に定義されていますが、最近傍のセットにはいくつかの固有の機能があります。

ネイバーのセットは、データ距離関数が面積距離関数をどのように組み合わせるかによって異なります。実際、合計関数を使用する2番目に近い近傍は、ユークリッドなどを使用する最も遠い近傍です。これは、合計または正規化されたメトリックと比較され、ユークリッドメトリックは、すべての領域が連想的に近い近傍を優先するように影響します。

合計、ユークリッド、および正規化された関数にも重みを含めることができるため、各領域はデータ距離関数に異なる量を提供します。 MBRは通常、一部の重みが1と同じ場合に良好な結果をもたらします。ただし、分類に大きな影響を与えると疑われる特定のフィールドなど、事前知識を含めるために重みを使用できる場合もあります。


  1. PHPのimplode()関数とは何ですか?

    この記事では、PHP Implode()関数の使用方法を学びます。Implode()関数は、事前定義された組み込みのPHP関数です。 PHP implode関数を使用して配列のコンポーネントを結合することにより、文字列を形成できます。 implode()関数は、選択した区切り文字を使用して、配列のコンポーネントから文字列を作成します。 implode()関数は、2つのパラメーターを確認します。そのうちの1つはオプションで、もう1つは必須です。 それらのパラメータを学びましょう。 構文 implode(separator、array) パラメータ セパレーター これはオプションのパラメー

  2. PHPのheader()関数とは何ですか?

    header()関数は事前定義されたPHPネイティブ関数です。header()HTTP関数を使用すると、他の出力が送信される前に、Webサーバーによってクライアントまたはブラウザーに送信されるデータを制御できます。 ヘッダー関数は、サーバーから提供されたHTTP応答のヘッダーを設定します。 PHPのヘッダー関数を使用して、ページの場所の変更、タイムゾーンの設定、キャッシュ制御の設定など、さまざまなことができます... PHPでのheader()の重要な使用法のいくつかを以下に示します。 ページをリダイレクトします。 これは、PHPのあるWebページから別のWebページにリダイレクトする