プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

KDDとは何ですか?


KDDは、データベースでのナレッジディスカバリーを表します。これは、データ内の知識を発見する幅広いプロセスを定義し、明確なデータマイニング技術の高レベルのアプリケーションを強調しています。これは、人工知能、機械学習、パターン認識、データベース、統計、専門システムの知識獲得、データの視覚化など、いくつかの分野の研究者が関心を持っている分野です。

KDDプロセスの主な目的は、巨大なデータベースのコンテキストで情報からデータを抽出することです。これは、データマイニングアルゴリズムを利用して、知識と見なされるものを認識することによって行われます。データベースでのナレッジディスカバリーは、巨大なデータリポジトリのプログラムされた探索的分析およびモデリングとして扱われます。 KDDは、大規模で困難なデータセットから有効で有用で理解しやすい設計を認識するための組織化されたプロセスです。

KDDは、データ内の有効で、斬新で、おそらく有用で、基本的に論理的な設計を識別するための重要な手順です。このプロセスは、KDDには、データの準備、パターンの検索、知識の評価、改良など、すべて複数の反復で繰り返される多くのステップが含まれていることを示しています。自明ではないということは、何らかの検索または推論が含まれていることを意味します。つまり、一連の数値の平均値を計算するような、事前定義された数量の簡単な計算ではありません。

データマイニングは、レコードを調査し、モデルを開発し、以前は未知のパターンを発見するアルゴリズムの推測など、KDD手順のルートです。このモデルは、情報から知識を抽出し、情報を分析し、情報を予測するために使用されます。

データマイニングは、データ分析と検出アルゴリズムの適用を含むKDDプロセスのステップであり、許容可能な計算効率の制限の下で、データ全体にパターン(またはモデル)の特定の列挙を行います。

パターンのフィールドは無限であることが多く、パターンの列挙には、この空間での何らかの形式の検索が含まれます。実際の計算上の制約により、データマイニングアルゴリズムで分析できる部分空間に深刻な制限が課せられます。

KDDプロセスには、データベースの使用と、データベースの必要な選択、前処理、サブサンプリング、および変換が含まれます。データマイニング手法(アルゴリズム)を使用して、そこからパターンを列挙します。データマイニングの製品を計算して、知識と見なされる列挙されたパターンのサブセットを認識します。

KDDプロセスのデータマイニングコンポーネントは、レコードからパターンを抽出して列挙するアルゴリズム手法に関係しています。完全なKDDプロセスには、マイニングされたパターンの評価と可能な解釈が含まれており、新しい知識で処理できるパターンを決定します。


  1. データセンターとは何ですか?

    datacenterと綴られることもあるデータセンター (一言)は、多数のコンピュータサーバーと関連機器を含む施設に付けられた名前です。 データセンターは、壁を超えた「コンピュータールーム」と考えてください。会社のユーザー宛てのメール、財務記録、ウェブサイトのデータなど、あらゆる種類のデータを保存できます。 データセンターは何に使用されますか? 一部のオンラインサービスは非常に大きいため、1台または2台のサーバーから実行できません。代わりに、これらのサービスを機能させるために必要なすべてのデータを保存および処理するために、数千または数百万台の接続されたコンピューターが必要です。 たと

  2. シリアル化とは

    最近のプロジェクト更新会議で、私のチームは、シリアライゼーションを使用してこのアプリケーションとの間でデータをやり取りする方法について話しました。 ソフトウェア プロジェクトにもっと関わりたいと考えていたあるエンジニアは、この用語になじみがないと言っていました。 より大規模なプロジェクトに飛び込むまで発生しない、このような重要なプロセスを見落としがちです。ある時点で私がそうであったように、これはこの人に当てはまりました。 だからそれについて書きたかった。その日、私は同僚がシリアライゼーションについて学ぶのを手伝いました。あなたは今日それについて学ぶことになります. シリアライゼーシ