プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データマイニングの制限は何ですか?


データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。

データマイニングは学際的な分野であり、データベースシステム、統計、機械学習、視覚化、データサイエンスなどの一連の分野の集合体です。使用するデータマイニングアプローチに応じて、ニューラルネットワーク、ファジーおよび/またはラフ集合理論、知識表現、帰納論理プログラミング、高性能コンピューティングなど、他の分野の手法を適用できます。

データマイニングはデータサイエンスに似ています。それは、特定の状況で、特定のデータセットに対して、目的を持って人によって実行されます。このフェーズには、テキストマイニング、Webマイニング、オーディオおよびビデオマイニング、画像データマイニング、ソーシャルメディアマイニングなど、いくつかのタイプのサービスが含まれます。シンプルまたは非常に具体的なソフトウェアを介して完成します。

データマイニングをアウトソーシングすることで、すべての作業をより迅速に、低い運用コストで実行できます。特定の企業は、新しいテクノロジーを使用して、手動で見つけることが不可能なデータを保存することもできます。複数のプラットフォームで利用できるデータは大量にありますが、アクセスできる知識は非常に限られています。

主な課題は、データを分析して、問題の解決や企業開発に使用できる重要なデータを抽出することです。データをマイニングし、そこからより良い判断を発見するために利用できる多くの動的な手段と手法があります。

データマイニングの制限は、テクノロジー関連ではなく、主にデータまたは人事関連です。

  • データマイニングソフトウェアは非常に強力なツールですが、自給自足のアプリケーションではありません。それは成功する可能性があり、分析を構造化し、作成された出力を解釈できる熟練した技術および分析の専門家が必要です。

  • データマイニングは、パターンと関係を取得するために使用され、これらのパターンの価値や重要性をユーザーに通知するものではありません。これらのタイプの決定は、ユーザーが行う必要があります。

  • 発見されたパターンの有効性は、これらが実際の状況とどのように比較されるかに依存します。たとえば、多数の個人のプールで潜在的なテロ容疑者を特定するように設計されたデータマイニングアプリケーションの有効性を評価できます。ユーザーは、既知のテロリストに関する情報を含むデータを使用してモデルをテストできます。

  • データマイニングは、行動と変数の間の関係を特定できますが、必ずしも因果関係を特定するわけではありません。たとえば、アプリケーションは、フライトが出発する直前に航空券を購入する傾向などの行動パターンが、収入、教育レベル、インターネットの使用などの特性に関連していることを識別できます。

    >

  1. データマイニングの外れ値の種類は何ですか?

    データマイニングにはさまざまな種類の外れ値があります- グローバル外れ値 −特定のデータセットでは、データオブジェクトが他の情報セットから本質的に逸脱している場合、そのデータオブジェクトはグローバルな外れ値です。グローバル外れ値はポイント異常として知られており、最も簡単なタイプの外れ値です。ほとんどの外れ値の検出方法は、グローバルな外れ値を発見することを目的としています。 グローバルな外れ値を特定できます。重要な問題は、問題のアプリケーションに関する偏差の適切な測定値を見つけることです。いくつかの測定値が提案されており、これらに応じて、外れ値の検出アプローチは複数のカテゴリに分割されます。

  2. プライバシーを保護するデータマイニングの方法は何ですか?

    プライバシー保護データマイニングは、データマイニングにおけるプライバシーセキュリティに対応するデータマイニング研究のアプリケーションです。これは、プライバシーが強化された、またはプライバシーに配慮したデータマイニングと呼ばれます。基本的な機密データ値を開示せずに、真のデータマイニング結果を取得することを扱います。 ほとんどのプライバシー保護データマイニングアプローチでは、データにさまざまな形式の変換を使用してプライバシー保護を実装します。一般に、このような方法では、プライバシーを維持するために説明の粒度が低くなります。 たとえば、単一のユーザーからユーザーグループにデータを一般化できます。