データマイニングシステムとデータベースシステムの統合とは何ですか?
データマイニングシステムは、データベースまたはデータウェアハウスシステムと統合されているため、効果的なプレゼンスでタスクを実行できます。データマイニングシステムは、データベースシステムなどの他のデータシステムと通信するために必要な環境で動作します。これらのシステムを統合できる統合スキームには、次のようなものがあります-
カップリングなし −データマイニングシステムがデータベースまたはデータウェアハウスシステムの機能を使用しないことを定義する結合はありません。特定のソース(ファイルシステムを含む)からデータを取得し、いくつかのデータマイニングアルゴリズムを使用してデータを処理できるため、マイニング結果を別のファイルに保存できます。
このようなシステムは、単純ですが、さまざまな制限により劣化します。まず、データベースシステムは、データの保存、整理、アクセス、および処理において、非常に高い柔軟性と適応性を提供します。データベース/データウェアハウスシステムを使用しなくても、データマイニングシステムは、データの検索、収集、クリーニング、および変更に多くの時間を割り当てることができます。
緩い結合 −このデータマイニングシステムでは、データベースまたはデータウェアハウスシステムの一部のサービスを使用します。データは、これらのシステムによって処理されるデータリポジトリからフェッチされます。データマイニングアプローチを使用してデータを処理し、処理されたデータをファイルに保存するか、データベースまたはデータウェアハウスの指定された領域に保存します。緩い結合は、クエリ処理またはさまざまなシステム機能を使用してデータベースに格納されているデータの一部の領域をフェッチできるため、結合なしよりも優れています。
セミタイトカップリング −この適切な実行では、データベース/データウェアハウスシステムでいくつかの重要なデータマイニングプリミティブをサポートできます。これらのプリミティブには、並べ替え、インデックス作成、集計、ヒストグラム分析、多方向結合、および合計、カウント、最大、最小、標準偏差などのいくつかの重要な統計指標の事前計算を含めることができます。
密結合 −密結合は、データマイニングシステムがデータベース/データウェアハウスシステムにスムーズに統合されることを定義します。データマイニングサブシステムは、情報システムの1つの機能要素と見なされます。
データマイニングクエリと機能は、データベース/データウェアハウスシステムのマイニングクエリ分析、データ構造、インデックススキーム、およびクエリ処理方法で開発および確立されています。データマイニング機能の効果的な実装、高いシステムパフォーマンス、統合されたデータ処理環境をサポートするため、非常に望ましいです。
-
時間的データマイニングとは何ですか?
時間的データマイニングは、時間的データの大規模なセットから、重要で、暗黙的で、潜在的に不可欠なデータを抽出するプロセスを定義します。時間データは一連の主要なデータタイプであり、通常は数値であり、時間データから有益な知識を収集することを扱います。 時間的データマイニングの目的は、時間的シーケンスと呼ばれるアルファベットからの名目上のシンボルのシーケンスと連続的な実数のシーケンスで構成される、より高いシーケンシャルデータの時間的パターン、予期しない傾向、またはいくつかの隠れた関係を見つけることです。機械学習、統計、データベーステクノロジーからの一連のアプローチを利用することにより、時系列と呼ばれ
-
データマイニングの理論的基礎は何ですか?
データマイニングの基礎となるいくつかの理論には、次のものがあります- データ削減 −この理論では、データマイニングの基本は、データ表現を減らすことです。データ削減は、巨大なデータベースでのクエリに対する迅速な近似回答を取得する必要性に応じて、速度と確実性を交換します。 データ削減方法には、特異値分解(主成分分析の背後にある駆動コンポーネント)、ウェーブレット、回帰、対数線形モデル、ヒストグラム、クラスタリング、サンプリング、およびインデックスツリーの開発が含まれます。 データ圧縮 −この理論によれば、データマイニングの基本は、ビット、相関ルール、決定木、クラスターなどの観点からエンコード