プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

科学と工学におけるデータマイニングの役割は何ですか?


科学と工学におけるデータマイニングのさまざまな役割は次のとおりです-

データウェアハウスとデータ前処理 −データ前処理とデータウェアハウスは、データ交換とデータマイニングにとって重要です。倉庫を作るには、複数の環境で複数の期間に収集された一貫性のない、または互換性のない情報を解決するための手段を見つける必要があります。

これには、セマンティクス、参照システム、数学、測定、効率、および精度の調整が必要でした。異種ソースからのデータを統合し、イベントを識別するための方法が必要です。

複雑なデータ型のマイニング −数値データセットは本質的に異種です。これらには通常、マルチメディアデータや地理参照ストリームデータなどの半構造化データと非構造化データ、および高度で深く隠されたセマンティクスを持つデータ(ゲノムレコードやプロテオミクスレコードなど)が含まれます。

時空間データ、生物学的データ、関連する概念階層、および困難な意味関係を管理するには、堅牢で専用の分析方法が必要です。

グラフベースおよびネットワークベースのマイニング −グラフまたはネットワークモデリングでは、マイニングされる各オブジェクトはグラフ内の頂点によって定義され、頂点間のエッジはオブジェクト間の関係を定義します。たとえば、グラフを使用して、化学構造、生物学的経路、および流体の流れのシミュレーションを含む整数シミュレーションによって生成されたデータをモデル化できます。

分類、頻繁なパターンマイニング、クラスタリングなど、いくつかのグラフベースのデータマイニングサービスのスケーラビリティと有効性の向上に基づくグラフまたはネットワークモデリングの成功。

視覚化ツールとドメイン固有の知識 −数学データマイニングシステムには、高レベルのグラフィカルユーザーインターフェイスと視覚化ツールが必要です。これらは、現在のドメイン固有のデータおよびデータシステムと統合して、パターンの検索、検索パターンの表現と視覚化、および意思決定における発見された知識の利用において、研究者と通常のユーザーをモデル化する必要があります。

工学におけるデータマイニングは、科学におけるデータマイニングといくつかの類似点を共有しています。どちらの方法でも、大量のデータが収集され、データの前処理、データウェアハウジング、および困難なタイプのデータのスケーラブルなマイニングが必要になります。どちらも一般的に視覚化を使用し、グラフとネットワークを最大限に活用します。さらに、いくつかのエンジニアリングプロセスではリアルタイムの応答が必要であったため、データストリームをリアルタイムでマイニングすることが重要なコンポーネントになることがよくあります。

私たちの日常生活には、人間とのつながりに関する大量のデータが流れ込んでいます。このようなコミュニケーションは、ニュース、ブログ、記事、Webページ、オンラインディスカッション、製品レビュー、Twitter、メッセージ、ブロードキャスト、コミュニケーションなど、インターネットといくつかの種類のソーシャルネットワークの両方でさまざまな形で存在します。

したがって、社会科学および社会研究におけるデータマイニングはますます有名になっています。さらに、製品、スピーチ、記事に関する顧客や読者のフィードバックを調査して、社会の人々の方向性に関する通常の意見や感情を推測することができます。分析結果は、傾向を予測し、作業を強化し、意思決定をサポートするために使用できます。


  1. 時間的データマイニングとは何ですか?

    時間的データマイニングは、時間的データの大規模なセットから、重要で、暗黙的で、潜在的に不可欠なデータを抽出するプロセスを定義します。時間データは一連の主要なデータタイプであり、通常は数値であり、時間データから有益な知識を収集することを扱います。 時間的データマイニングの目的は、時間的シーケンスと呼ばれるアルファベットからの名目上のシンボルのシーケンスと連続的な実数のシーケンスで構成される、より高いシーケンシャルデータの時間的パターン、予期しない傾向、またはいくつかの隠れた関係を見つけることです。機械学習、統計、データベーステクノロジーからの一連のアプローチを利用することにより、時系列と呼ばれ

  2. 科学と工学におけるデータマイニングの役割は何ですか?

    科学と工学におけるデータマイニングのさまざまな役割は次のとおりです- データウェアハウスとデータ前処理 −データ前処理とデータウェアハウスは、データ交換とデータマイニングにとって重要です。倉庫を作るには、複数の環境で複数の期間に収集された一貫性のない、または互換性のない情報を解決するための手段を見つける必要があります。 これには、セマンティクス、参照システム、数学、測定、効率、および精度の調整が必要でした。異種ソースからのデータを統合し、イベントを識別するための方法が必要です。 複雑なデータ型のマイニング −数値データセットは本質的に異種です。これらには通常、マルチメディアデータや地理参