プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データマイニングの手法は何ですか?


データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。

主な課題は、データを分析して、問題の解決や企業開発に使用できる重要なデータを抽出することです。データをマイニングし、そこからより良い判断を発見するために利用できる多くの動的な手段と手法があります。

データマイニングには、次のようなさまざまな手法があります-

分類 −分類は、データセットに要素を作成して、より効率的な予測と分析を支援するデータマイニング手法です。非常に巨大なデータセットの分析を効果的に作成することを目的としたいくつかの方法があります。

分類は、データマイニングで最も重要なタスクの1つです。これは、属性に基づいてインスタンスに事前定義されたクラスラベルを割り当てるプロセスを指します。分類とクラスタリングには類似点があり、見た目は同じですが、違います。分類とクラスタリングの主な違いは、分類には、事前定義されたグループのメンバーシップに従って要素を平準化することが含まれることです。

クラスタリング −物理オブジェクトまたは抽象オブジェクトのセットを類似したオブジェクトのクラスに結合するフェーズは、クラスタリングと呼ばれます。クラスターは、同じクラスター内で互いに同じであり、他のクラスター内のオブジェクトとは異なるデータオブジェクトのセットです。データオブジェクトのクラスターは、複数のアプリケーションで1つのグループとしてまとめて考えることができます。クラスター分析は人間にとって不可欠な活動です。

回帰 -これらのアプローチは、変数が数値である1つ以上の予測子(独立)変数からの応答(従属)変数の値を予測するために使用されます。回帰には、線形、多重、加重、多項式、ノンパラメトリック、ロバストなど、いくつかの形式があります(ロバスト手法は、エラーが正常条件を満たさない場合、またはデータに有意な外れ値が含まれる場合に役立ちます)。

外部検出 −このタイプのデータマイニング手法は、データセット内のデータ項目の観察に関連しており、予想されるパターンまたは予想される動作と一致しません。この手法は、侵入、検出、不正検出などのさまざまなドメインで使用できます。これは、外れ値分析または外れ値マイニングとも呼ばれます。

シーケンシャルパターン −シーケンシャルパターンは、シーケンシャルデータを計算してシーケンシャルパターンを見つけることに特化したデータマイニング手法です。これには、シーケンスのコレクションから興味深いサブシーケンスを見つけることが含まれます。ここでは、シーケンスの賭け金を、長さ、出現頻度などのいくつかの要素の観点から測定できます。


  1. 空間データマイニングのプリミティブは何ですか?

    空間データマイニングは、データマイニングを空間モデルに適用することです。空間データマイニングでは、アナリストは地理データまたは空間データを使用して、ビジネスインテリジェンスまたはさまざまな結果を作成します。これには、地理データを関連性のある有益な形式に変換するための特定の方法とリソースが必要でした。 空間データマイニングには、パターンの認識や、研究プロジェクトを推進する質問に関連するオブジェクトの発見など、いくつかの課題があります。アナリストは、GIS / GPSツールまたは同様のシステムを利用して、大規模なデータベース領域またはその他の完全に巨大なデータセットで表示し、関連するデータのみを

  2. データマイニングの外れ値の種類は何ですか?

    データマイニングにはさまざまな種類の外れ値があります- グローバル外れ値 −特定のデータセットでは、データオブジェクトが他の情報セットから本質的に逸脱している場合、そのデータオブジェクトはグローバルな外れ値です。グローバル外れ値はポイント異常として知られており、最も簡単なタイプの外れ値です。ほとんどの外れ値の検出方法は、グローバルな外れ値を発見することを目的としています。 グローバルな外れ値を特定できます。重要な問題は、問題のアプリケーションに関する偏差の適切な測定値を見つけることです。いくつかの測定値が提案されており、これらに応じて、外れ値の検出アプローチは複数のカテゴリに分割されます。