データマイニングの履歴情報は何ですか?
データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。
これは、データベースの所有者にとって明確で有益な結果を得るために、最初は未知である規則性または関係を見つけるための大量の情報の選択、調査、およびモデリングの手順です。
データマイニングはデータサイエンスに似ています。それは、特定の状況で、特定のデータセットに対して、目的を持って人によって実行されます。このフェーズには、テキストマイニング、Webマイニング、オーディオおよびビデオマイニング、画像データマイニング、ソーシャルメディアマイニングなど、いくつかのタイプのサービスが含まれます。シンプルまたは非常に具体的なソフトウェアを介して完成します。
データマイニングをアウトソーシングすることで、すべての作業をより迅速に、低い運用コストで実行できます。特定の企業は、新しいテクノロジーを使用して、手動で見つけることが不可能なデータを保存することもできます。複数のプラットフォームで利用できるデータは大量にありますが、アクセスできる知識は非常に限られています。
データ内の有用なパターンを見つけるアプローチには、データマイニング、知識抽出、データディスカバリー、データハーベスティング、データ考古学、データパターン処理など、いくつかの名前が付けられています。データマイニングは、統計学者、データアナリスト、および経営情報システム(MIS)コミュニティによって使用されてきました。
また、データベース領域での人気も向上しています。データマイニングでは、決定問題を解決するために大規模なデータベースが分析されます。新製品に関する情報を受け取りたい店主を考えてみましょう。データマイニングプロセスによって操作される情報は、顧客との以前のやり取りの履歴データベースと、年齢、収入、応答などの顧客に関連する機能に含まれています。
データマイニングソフトウェアは、履歴情報を使用して、どの顧客が新製品に反応する可能性が高いかを予測するために使用できる顧客行動のモデルを構築します。履歴情報は、クレジットカード詐欺などの比較的一般的な犯罪の発見の基礎を形成することもできます。
過去のデータと現在のデータのパターンを比較することにより、お客様が変更を加えたかどうかを確認します。履歴情報は、パターンを見つけるためのツールとしてこれらの分野で広く受け入れられており、顧客はこれらのプロセスから経済的利益を享受しています。
-
時間的データマイニングとは何ですか?
時間的データマイニングは、時間的データの大規模なセットから、重要で、暗黙的で、潜在的に不可欠なデータを抽出するプロセスを定義します。時間データは一連の主要なデータタイプであり、通常は数値であり、時間データから有益な知識を収集することを扱います。 時間的データマイニングの目的は、時間的シーケンスと呼ばれるアルファベットからの名目上のシンボルのシーケンスと連続的な実数のシーケンスで構成される、より高いシーケンシャルデータの時間的パターン、予期しない傾向、またはいくつかの隠れた関係を見つけることです。機械学習、統計、データベーステクノロジーからの一連のアプローチを利用することにより、時系列と呼ばれ
-
データマイニングの理論的基礎は何ですか?
データマイニングの基礎となるいくつかの理論には、次のものがあります- データ削減 −この理論では、データマイニングの基本は、データ表現を減らすことです。データ削減は、巨大なデータベースでのクエリに対する迅速な近似回答を取得する必要性に応じて、速度と確実性を交換します。 データ削減方法には、特異値分解(主成分分析の背後にある駆動コンポーネント)、ウェーブレット、回帰、対数線形モデル、ヒストグラム、クラスタリング、サンプリング、およびインデックスツリーの開発が含まれます。 データ圧縮 −この理論によれば、データマイニングの基本は、ビット、相関ルール、決定木、クラスターなどの観点からエンコード