プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

二等分K-Meansとは何ですか?


二等分K-meansアルゴリズムは、基本的なK-meansアルゴリズムの単純な開発であり、Kクラスターの取得、いくつかのポイントのセットの2つのクラスターへの分割、これらのクラスターの1つを選択して分割するなどの単純な概念に依存します。 、Kクラスターが生成されるまで。

k-meansアルゴリズムは、入力パラメーターkを生成し、n個のオブジェクトのセットをk個のクラスターに分割して、結果として得られるクラスター内の類似性は高くなりますが、クラスター間の類似性は低くなります。クラスターの類似性は、クラスター内のオブジェクトの平均値に関して評価されます。これは、クラスターの重心または重心と見なすことができます。

平均の元の値は任意に許可されます。これらはランダムに許可することも、最初のk個の入力項目自体からの値を必要とする場合もあります。収束成分は二乗誤差に基づくことができますが、そうである必要はありません。たとえば、アルゴリズムは複数のクラスターに割り当てられます。他の終了方法は、一定の反復回数でロックされています。コンバージェンスがなくてもショッピングを提供するには、最大反復回数を含めることができます。

次のようなK-Meansを二等分するアルゴリズム-

  • クラスターのリストを初期化して、すべてのポイントなどのクラスターを含めます。

  • 繰り返す

  • クラスターのリストからクラスターを削除します。

  • {選択したクラスターの複数の「試行」二分法を実装します。}

  • for i:1から試行回数まで

  • 基本的なK-meansを利用して選択クラスターを二分します。

  • 終了

  • 合計SSEが最小の二等分線から2つのクラスターを選択します。

  • これらの2つのクラスターをクラスターのドキュメントに挿入します。

  • クラスターのドキュメントにKクラスターが含まれるまで。

分割するクラスターを選択する方法はいくつかあります。各ステップで最も高いクラスターを選択するか、SSEが最も大きいクラスターを選択するか、サイズとSSEの両方に基づいて要素を使用できます。複数の選択肢があると、クラスターが異なります。

基本的なK-meansアルゴリズムの元の重心としてそれらの重心を利用することにより、今後のクラスターを明確にすることができます。 K-meansアルゴリズムは、SSEに関する極小値を定義するクラスタリングを見つけるために保護されていますが、K-meansを二等分する場合、「局所的に」、つまり単一クラスターを二等分するためにK-meansアルゴリズムを使用しているためです。したがって、クラスターの最終セットは、合計SSEに関するローカル最小値であるクラスタリングを定義しません。

最後に、K-meansがクラスターを二等分するように作成された一連のクラスタリングを記録することにより、階層的クラスタリングを作成するためにK-meansを二等分する必要もあります。


  1. 10.0.0.1 IPアドレスとは何ですか?

    10.0.0.1 IPアドレスは、クライアントデバイスで使用されるか、デフォルトのIPアドレスとしてネットワークハードウェアに割り当てられる可能性のあるプライベートIPアドレスです。 10.0.0.1とは何ですか? 10.0.0.1は、ルーターが通常192.168.1.1や192.168.0.1などの192.168.x.xシリーズのアドレスを使用するホームネットワークよりも、ビジネスコンピューターネットワークでよく見られます。ただし、在宅デバイスには引き続き10.0.0.1 IPアドレスが割り当てられている可能性があり、他のデバイスと同じように機能します。 クライアントデバイスのIP

  2. 情報システムとは?

    情報システムは、ビジネス目標を達成するための人々、情報技術、およびビジネスプロセスのグループです。情報システムは、データの収集、処理、保存、および配布を行って、組織内での調整、視覚化、分析、および意思決定を提供するために機能する相互接続された要素のグループです。 情報システムは、ソフトウェア、ハードウェア、および電気通信ネットワークのセットとして表すことができます。これらのネットワークは、一般に組織の設定で、有益なデータを収集、生成、および配布するために人々が作成および使用します。 情報システムは、組織のニーズへのデータの適用に関係する特定の分野または学習部門です。情報システムの範囲には、