プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

STINGとは何ですか?


STINGはStatisticalInformationGridの略です。 STINGは、空間領域が長方形のセルに分割されるグリッドベースの多重解像度クラスタリング手法です。このような長方形のセルには、複数の解決方法に相当するいくつかの方法があり、これらのセルは階層構造を形成します。高レベルの各セルは分離され、次に低いレベルの複数のセルを形成します。

各グリッドセルの属性に関する統計データ(平均値、最大値、最小値を含む)が事前に計算され、保存されます。高レベルのセルの統計パラメータは、低レベルのセルのパラメータから簡単に計算できます。

これらのパラメーターには、次のものが含まれます。属性に依存しないパラメーター、count、および属性に依存するパラメーター、mean、stdev(標準偏差)、min(最小)、max(最大)。セル内の属性値が従う分布のタイプ(通常、均一、指数、またはなし(分布が匿名の場合)を含む)。

レコードがデータベースにロードされると、最下位レベルのセルのパラメーターcount、mean、stdev、min、およびmaxがレコードから直接計算されます。分布のタイプが事前にわかっている場合、またはχ 2 を含む仮説検定によって取得された場合、分布の値はユーザーが割り当てることができます。 テスト。

しきい値フィルタリング手順と組み合わせて、同等の下位レベルのセルの分布タイプの大部分に基づいて評価できる、より大きなレベルのセルの分布のタイプ。低レベルのセルの分布が互いに一致せず、しきい値テストを拒否した場合、高レベルのセルの分布タイプはnoneに設定されます。

グリッドベースのクラスタリング手法は、多重解像度グリッドデータ構造を使用します。オブジェクト空間を複数のセルに量子化し、グリッド構造を形成します。このグリッド構造に、クラスタリングのいくつかの操作が実装されます。この方法の利点は、処理時間が短いことです。これは、一般にデータオブジェクトの数に依存せず、量子化された空間の各次元の複数のセルのみに依存します。

グリッドベースのアプローチの例には、グリッドセルに格納された統計データを探索するSTING、ウェーブレット変換アプローチを使用してオブジェクトをクラスター化するWaveCluster、およびグリッドベースのクラスター化と密度ベースの方法を定義するCLIQUEが含まれます。次元データ領域。

このアプローチの利点は、統計情報がクエリとは独立して存在するため、クエリに依存しないアプローチです。これは、各グリッドセルのデータの通常の説明であり、膨大なクラスのクエリへの回答をサポートするために使用できます。計算の複雑さはO(K)です。ここで、Kは最低レベルのグリッドセルの数です。通常はK<

  1. 多次元勾配分析の制約の種類は何ですか?

    次元の呪いと理解可能な結果の必要性は、キューブグレードの問題に対する効率的でスケーラブルなソリューションを見つけるための深刻な課題をもたらします。これは限定的ですが、制約付き多次元勾配分析と呼ばれるキューブグレード問題の興味深いバージョンです。検索スペースを減らし、興味深い結果を導き出すことができます。 次のような種類の制約があります- 重要性の制約 −これにより、少なくとも定義された数の基本セルまたは少なくとも特定の総売上高を含む、データ内で特定の「統計的有意性」を持つセルのみをテストできるようになります。データキューブのコンテキストでは、この制約は、解釈セットから多数の些細なセルを

  2. .grid()よりも優れたTkinterジオメトリマネージャーは何ですか?

    Geometry Managerは、Tkinterライブラリの特定の機能の1つです。ウィンドウ内のすべてのTkinterウィジェットに構造を提供します。 Geometry Managerは、Tkinterアプリケーションウィンドウでウィジェットのレイアウトと位置をフォーマットするために使用されます。 ウィジェットの外観と外観をフォーマットするために、GeometryManagerには3つの一般的な方法があります。 Pack Geometry Manager グリッドジオメトリマネージャー Place Geometry Manager 各GeometryManagerには、ウィジ