プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

次元削減と数的削減の違いは?


次元削減

次元削減では、データのエンコードまたは変換を使用して、元のデータの縮小または「圧縮」された描写にアクセスします。データを失うことなく元のデータを圧縮データから再生成できる場合、データ削減はロスレスと呼ばれます。再構築されたデータが元のデータの近似値のみである場合、データ削減は不可逆と呼ばれます。

DWTは、正弦と余弦を含む信号処理技術である離散フーリエ変換(DFT)とほぼ関連しています。一般に、DWTはより優れた非可逆圧縮を実現します。つまり、特定のデータベクトルのDWTとDFTに対して同様の数の係数が維持されている場合、DWTバージョンは元のデータのより正確な近似をサポートします。したがって、同等の近似では、DWTはDFTよりも必要な面積が少なくて済みます。

数の削減

数の削減では、代替のより小さな形式のデータ表現を選択することにより、データ量が削減されます。これらの手法は、パラメトリックまたはノンパラメトリックにすることができます。パラメトリック法の場合、モデルはデータを推定できるため、対数線形モデルなどの実際のデータではなく、データパラメーターのみを保存する必要があります。ノンパラメトリック手法は、ヒストグラム、クラスタリング、サンプリングなど、データの縮小表現を保存するために使用されます。

次元削減と数削減の比較を見てみましょう。

次元削減 数の削減
次元削減では、データのエンコードまたは変換を適用して、元のデータの縮小または圧縮された表現を取得します。 数の削減では、データ表現のより小さな形式を交互に選択することにより、データ量が削減されます。
次元削減では、離散ウェーブレット変換(DWT)は線形信号処理技術であり、データベクトルXに使用すると、ウェーブレット係数の数値的に異なるベクトルX’に変更されます。
2つのベクトルは同じ長さです。この手法をデータ削減に適用すると、各タプルをn次元のデータベクトル、つまりX =(x 1 、x 2 、…x n )n個のデータベース属性からタプルに対して行われたn個の測定値を示します。
数の削減では、回帰モデルと対数線形モデルを使用して、指定されたデータを近似できます。線形回帰では、データは直線に合うようにモデル化されます。
たとえば、確率変数y(応答変数として知られている)は、方程式y =wx + bを使用して、別の確率変数x(予測変数として知られている)の線形関数としてモデル化できます。ここで、yの分散は一定であると想定されます。
無関係で冗長な属性を削除するために使用できます。 これは、元のデータをより小さな形式に表現するための手法にすぎません。
この手法では、不適切な一部のデータが失われる可能性があります。 この方法では、データが失われることはありませんが、データ全体がより小さな形式で表されます。

  1. スタックとキューのデータ構造の違い

    スタックとキューの違いの前に、プログラミングにおけるデータ型の概念を理解することをお勧めします。データ型は、データを格納するために変数が作成されるデータの型であると述べています。主に、プリミティブデータ型と非プリミティブデータ型の2種類のデータ型があります。プリミティブデータ型は事前定義されたタイプのデータであり、プログラミング言語でサポートされていますが、非プリミティブデータ型はプログラミング言語で定義されていません。プログラマーによって作成されました。 現在、スタックとキューはどちらも非プリミティブデータ構造ですが、内部実装に基づいて、以下のように、これらのデータ構造の両方の主な違いをい

  2. C#でのHashTableとDictionaryの違い

    HashTableとDictionaryはどちらも、データを格納するために使用されるデータ構造のタイプです。これらのデータ構造は両方とも、保存されたデータをキーと値のペアで保持します。 これらの主要な機能の違いに基づいて、HashTableとDictionaryを次のように区別できます- Sr。いいえ。 キー HashTable 辞書 1 定義 HashTableは、キーと値のペアでデータを格納するために使用される非汎用タイプのコレクションであり、 System.Collectionsで定義されます。 名前空間。 一方、Dictionaryは、 System.Colle