プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データマイニングの背後にある動機は何ですか?


データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを共有することにより、有用な新しい相関関係、パターン、および傾向を見つける手順です。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。

これは、データベースの所有者にとって明確で有益な結果を得るために、最初は未知である規則性または関係を見つけるための大量の情報の選択、調査、およびモデリングの手順です。

これは、コンピューターアルゴリズムや統計的手法の使用に限定されません。これは、企業の意思決定をサポートするために情報技術と一緒に使用できるビジネスインテリジェンスのプロセスです。

データマイニングはデータサイエンスに似ています。それは、特定の状況で、特定のデータセットに対して、目的を持って人によって実行されます。このフェーズには、テキストマイニング、Webマイニング、オーディオおよびビデオマイニング、画像データマイニング、ソーシャルメディアマイニングなど、いくつかのタイプのサービスが含まれます。シンプルまたは非常に具体的なソフトウェアを介して完成します。

データマイニングは、膨大な量のデータが広く利用可能であり、そのようなデータを有益なデータや知識に変えるために差し迫った必要性があるため、近年、情報市場や社会全体で大きな注目を集めています。得られた情報と知識は、業界分析、不正検出、ユーザー維持から生産管理、科学調査に至るまでのソフトウェアに使用できます。

データマイニングは、データテクノロジーの自然な進歩の結果と見なすことができます。データベースシステム市場は、データ収集とデータベース作成、データ管理、高度なデータ分析など、次の機能の開発における進化の方向性をサポートしてきました。

たとえば、データ収集とデータベース作成構造の最近の開発は、データの保存と取得、およびクエリとトランザクション処理のための効果的な構造のその後の開発に必要でした。クエリとトランザクション処理を一般的な方法として提供するさまざまなデータベースシステムにより、高度なデータ分析が次のオブジェクトに発展しました。

データは、いくつかのタイプのデータベースおよびデータリポジトリに保存できます。データウェアハウスに登場した1つのデータリポジトリ構造。管理上の意思決定をサポートするために、個々のサイトで統一されたスキーマの下に編成された複数の異種データソースのリポジトリです。

データウェアハウステクノロジーには、データクリーニング、データ統合、オンライン分析処理(OLAP)が含まれます。特に、要約、統合、集計などの機能を備えた分析手法と、複数の角度からデータを表示する機能が含まれます。


  1. 時間的データマイニングとは何ですか?

    時間的データマイニングは、時間的データの大規模なセットから、重要で、暗黙的で、潜在的に不可欠なデータを抽出するプロセスを定義します。時間データは一連の主要なデータタイプであり、通常は数値であり、時間データから有益な知識を収集することを扱います。 時間的データマイニングの目的は、時間的シーケンスと呼ばれるアルファベットからの名目上のシンボルのシーケンスと連続的な実数のシーケンスで構成される、より高いシーケンシャルデータの時間的パターン、予期しない傾向、またはいくつかの隠れた関係を見つけることです。機械学習、統計、データベーステクノロジーからの一連のアプローチを利用することにより、時系列と呼ばれ

  2. データマイニングの理論的基礎は何ですか?

    データマイニングの基礎となるいくつかの理論には、次のものがあります- データ削減 −この理論では、データマイニングの基本は、データ表現を減らすことです。データ削減は、巨大なデータベースでのクエリに対する迅速な近似回答を取得する必要性に応じて、速度と確実性を交換します。 データ削減方法には、特異値分解(主成分分析の背後にある駆動コンポーネント)、ウェーブレット、回帰、対数線形モデル、ヒストグラム、クラスタリング、サンプリング、およびインデックスツリーの開発が含まれます。 データ圧縮 −この理論によれば、データマイニングの基本は、ビット、相関ルール、決定木、クラスターなどの観点からエンコード