プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

KDDのプロセスは何ですか?


KDDは、データベースでのナレッジディスカバリーを表します。これは、データ内の知識を発見する幅広いプロセスを定義し、明確なデータマイニング技術の高レベルのアプリケーションを強調しています。これは、人工知能、機械学習、パターン認識、データベース、統計、専門システムの知識獲得、データの視覚化など、いくつかの分野の研究者が関心を持っている分野です。

知識発見プロセスは反復的かつインタラクティブであり、9つのステップが含まれます。このプロセスはすべての段階で繰り返され、前のアクションへの変換が必要になる可能性があることを意味します。このプロセスには、1つの式を提示したり、各ステップとアプリケーションタイプの正しい決定のための完全な科学的分類を作成したりできないという意味で、いくつかの想像力に富んだ方法があります。したがって、プロセスと、各段階での複数の要件と可能性を理解する必要があります。

  • 理解を深める −これは基本的な準備ステップです。変換、アルゴリズム、表現などのいくつかの決定で何をすべきかを学ぶためのシーンを作成します。KDDベンチャーを担当する個人は、エンドユーザーと環境の目標を学び、特徴づける必要があります。知識発見プロセスが表示されます(関連する事前知識が含まれます)。

  • ターゲットデータセットの作成 −データセットを選択するか、検出が実装される変数またはデータサンプルのサブセットをターゲットにすることができます。データマイニングはアクセス可能なデータから学習して見つけるため、このプロセスは不可欠です。これは、モデルを構築するための証拠の基盤です。いくつかの重要な属性が欠落している場合、その時点で、この点から調査全体が失敗する可能性があり、より多くの属性が考慮されます。

  • データのクリーニングと前処理 −データクレンジングとは、欠落している値を埋め、ノイズの多いデータを平滑化し、外れ値を特定して排除し、データの不整合を取り除くことによってデータをクリーンアップすることを定義します。

  • 探索的分析とモデルおよび仮説の選択 −データマイニングアルゴリズムの選択と、データパターンの検索に使用する方法の選択が可能です。このプロセスには、適切なモデルとパラメーターを決定し、特定のデータマイニング方法をKDDプロセスの長期的な基準と照合することが含まれます。

  • データマイニング −分類ルールまたはツリー、回帰、およびクラスタリングを含む、特定の表現形式またはそのような表現のセットで関心のあるパターンを検索するために使用されます。ユーザーは、前述の手順を正しく実装することで、データマイニング方法を大幅に支援できます。

  • 発見された知識に基づいて行動する −知識を直接使用して、追加のアクションのために別のシステムに知識を含めるか、単にそれを文書化して関係者に報告します。このプロセスには、以前に受け入れられた(または抽出された)知識との潜在的な競合をチェックして解決することも含まれます。


  1. データウェアハウスの設計は何ですか?

    データウェアハウジングは、複数のソースから情報を収集および管理して、ビジネスに重要なビジネス洞察をサポートできるアプローチです。データウェアハウスは、サポート管理の意思決定を目的として特別に作成されています。 データウェアハウスは、会社の運用データベースとは別に維持されるデータベースを定義します。データウェアハウスシステムは、複数のアプリケーションシステムの統合を可能にします。分析用の統合された履歴レコードの強固なプラットフォームをサポートすることにより、データ処理をサポートします。 データウェアハウスは、リモートベースエリアで定義されたマテリアライズドビューのグループと見なすことができま

  2. ステガノグラフィの用途は何ですか?

    ステガノグラフィは、データを隠す技術であり、埋め込まれたデータの存在を隠すための取り組みです。これは、メッセージの存在ではなくメッセージの内容のみを非表示にする暗号化よりも優れたメッセージ保護方法として機能します。 元のメッセージはキャリア内で表示されていないため、キャリアに表示された変更は明らかではありません。ステガノグラフィにはさまざまな用途があります- ステガノグラフィは、検閲されることなく、またメッセージが妨げられて私たちにさかのぼることを恐れることなく、ニュースやデータを送信するために適用できるソリューションになる可能性があります。 ステガノグラフィを使用して場所にデー