プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

k-meansアルゴリズムはどのように機能しますか?


k-meansアルゴリズムは、入力パラメーターkを作成し、n個のオブジェクトのグループをk個のクラスターに分割して、結果として得られるクラスター内の類似性は大きくなりますが、クラスター間の類似性は低くなります。クラスターの類似性は、クラスター内のオブジェクトの平均値に関して計算されます。これは、クラスターの重心または重心と見なすことができます。

k-meansアルゴリズムは、次のように進行します。まず、オブジェクトのkをランダムに選択できます。各オブジェクトは、元々クラスターの平均または中心を定義します。残りのオブジェクトごとに、オブジェクト間の距離とクラスターの平均に応じて、同じクラスターに対してオブジェクトが作成されます。

各クラスターの新しい平均を計算できます。このフェーズは、主関数が収束するまで繰り返されます。一般に、二乗誤差基準は次のように表されます-

$$ \ mathrm {E =\ displaystyle \ sum \ Limits_ {i =1} ^ k \ displaystyle \ sum \ Limits_ {p \ epsilon C_ {i}} | p-m_ {i} | ^ 2} $$

ここで、Eは、データセット内のいくつかのオブジェクトの二乗誤差の合計です。 pは、特定のオブジェクトを定義する空間内の点であり、m i クラスターCiの平均です (pとm iの両方 多次元です)。特に、各クラスター内の各オブジェクトについて、オブジェクトからそのクラスターの中心までの距離が2乗され、距離が推定されます。この基準は、結果として得られるkクラスターを可能な限りコンパクトで独立したものにしようとします。

アルゴリズム: k-means −分割のためのk-meansアルゴリズム。すべてのクラスターの中心は、クラスター内のオブジェクトの平均値によって定義されます。

入力-

k: the number of clusters,
D: a data set including n objects.

出力-

A set of k clusters.

方法-

  • 元のクラスター中心としてDからk個のオブジェクトを任意に選択します。

  • 繰り返す

  • 各オブジェクトを、オブジェクトが同じであるクラスターに(再)割り当てます。これは、クラスター内のオブジェクトの平均値によって異なります。

  • クラスター平均を更新します。つまり、各クラスターのオブジェクトの平均値を計算します。

  • 変化がなくなるまで;

これは、3つのオブジェクトを3つの元のクラスター中心として任意に選択するために使用されます。クラスター中心は「+」で示されます。各オブジェクトがクラスターに配布されるのは、それが便利なクラスターセンターによって異なります。

次に、クラスターセンターが更新されます。各クラスターの平均値は、クラスター内の一般的なオブジェクトに基づいて再計算されます。新しいクラスターセンターを利用することにより、オブジェクトはクラスターに再配布されます。これは、どのクラスターセンターが隣接しているかによって異なります。このような再配布構造は、破線の曲線で囲まれた新しいシルエットです。

パーティショニングを強化するためにオブジェクトをクラスターに繰り返し再割り当てするフェーズは、反復再配置として定義されます。どのクラスターにもオブジェクトの再配布は表示されないため、プロセスは削除されます。結果のクラスターは、クラスタリングフェーズによって復元されます。


  1. Microsoft Edgeパスワードモニターはどのように機能しますか?

    Microsoft Edgeパスワードモニターは、データ侵害による脆弱性について保存されているパスワードを監視するEdgeブラウザーの機能です。オプトインすると、パスワードモニターは、保存されているパスワードを既知のデータ侵害のデータと照合して定期的にチェックし、危険にさらされているかどうかを通知します。 Edge Password Monitorにオプトインする必要があるのはなぜですか? 強力なパスワードを作成、維持、および定期的に変更することは、オンラインセキュリティにとって最も重要な鍵です。 Microsoft Edgeは、強力なパスワードジェネレータを提供することでこの分野を支援

  2. YouTube アルゴリズムの仕組み

    YouTube のおすすめセクションは、視聴者が新しい動画を探すために最も頻繁に訪れる場所です。ここにある動画は、ユーザーが視聴する可能性が最も高いと YouTube が判断した動画をクリックするように、ユーザーに合わせて調整されています。しかし、これらのビデオはどのように選ばれるのでしょうか? ほとんどの人は、このプロセスを YouTube アルゴリズムと呼んでいます。これは、サイトがどの動画をユーザーのおすすめセクションに入れるかを計算する方法です。また、ユーザーの検索結果にも影響します。したがって、このアルゴリズムがどのように機能するかを知ることは、クリエイターがより多くの視聴者にリー