プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

マイニングシーケンスデータの種類は何ですか?


シーケンスは、イベントの順序付きリストです。シーケンスは、次のように定義するイベントの機能に基づいて、3つのグループに分けることができます-

時系列データの類似性検索

時系列データセットには、時間の繰り返し計算で取得された整数値のシーケンスが含まれます。値は通常、同じ時間間隔(1分、1時間、1日など)で測定されます。

時系列データベースは、株式市場分析、経済および売上予測、予算分析、ユーティリティ調査、在庫調査、収益予測、ワークロード予測、プロセスおよび品質サービスなど、いくつかのアプリケーションで有名です。それらは、自然現象、数学的および工学的実験、および医薬品治療の研究に有益です。

時系列データの回帰分析と傾向分析

時系列データの回帰分析は、データおよび信号分析のアプリケーションで実質的に設計されています。傾向分析は、次の4つの主要な要素または動きを使用して統合モデルを構築し、時系列データを定義します-

トレンドまたは長期的な動き −これらは、時系列グラフが時間の経過とともに変化する一般的な方向を示します。たとえば、加重移動平均と最小二乗アプローチを使用して、破線の曲線を含む傾向曲線を見つけます。

周期的な動き −これらはトレンドラインまたは曲線に関する長期的な振動です。

季節変動 −これらは、ホリデーショッピングシーズンを含む連続する年の同等のシーズン中に時系列がたどるのとほぼ同じパターンです。効率的な傾向分析を行うには、自己相関によって計算された季節指数に基づいてデータを「非季節化」する必要があります。

ランダムな動き −これらは、労働争議や組織内での人事異動の発表などの偶然の出来事による散発的な変化を定義しています。

シンボリックシーケンスでのシーケンシャルパターンマイニング

シンボリックシーケンスには、時間の具体的な概念の有無にかかわらず文書化された、要素またはイベントの順序付けられたグループが含まれます。ユーザーショッピングシーケンス、Webクリックストリーム、プログラム実装シーケンス、生物学的シーケンス、科学と工学、自然および社会の発展におけるイベントのシーケンスを含むシンボリックシリーズのデータ​​を含むいくつかのアプリケーションがあります。

生物学的配列は複雑な意味を与え、いくつかの困難な研究問題を引き起こすため、ほとんどの調査はバイオインフォマティクスの応用に向けられています。

生物学的配列のアラインメント

生物学的配列は、ヌクレオチドまたはアミノ酸の配列を定義します。生物学的配列分析は、生物学的配列を比較、整列、索引付け、および研究するため、バイオインフォマティクスおよび現在の生物学において重要な役割を果たします。

配列アラインメントは、すべての生物が発達によって関連付けられているという事実に依存しています。これは、進化において互いにより近い種のヌクレオチド(DNA、RNA)およびタンパク質配列がより高い類似性を示さなければならないことを示しています。アラインメントとは、配列を並べて最大の同一性レベルを取得する手順であり、配列間の類似度も定義します。


  1. データマイニングの外れ値の種類は何ですか?

    データマイニングにはさまざまな種類の外れ値があります- グローバル外れ値 −特定のデータセットでは、データオブジェクトが他の情報セットから本質的に逸脱している場合、そのデータオブジェクトはグローバルな外れ値です。グローバル外れ値はポイント異常として知られており、最も簡単なタイプの外れ値です。ほとんどの外れ値の検出方法は、グローバルな外れ値を発見することを目的としています。 グローバルな外れ値を特定できます。重要な問題は、問題のアプリケーションに関する偏差の適切な測定値を見つけることです。いくつかの測定値が提案されており、これらに応じて、外れ値の検出アプローチは複数のカテゴリに分割されます。

  2. データの整合性の種類は何ですか?

    データベースの整合性は、格納された情報の有効性と整合性を定義します。整合性は、一般に、データベースが違反することを許可されていない整合性ルールである制約の観点から定義されます。制約は、各属性に適用することも、テーブル間の関係に適用することもできます。 整合性制約により、許可されたユーザーがデータベースに加えた変更(更新の削除、挿入)によってデータの整合性が失われることはありません。したがって、整合性制約はデータベースへの偶発的な損傷を防ぎます。 データの整合性には、次のようなさまざまなタイプがあります- 論理的整合性 −リレーショナルデータベースでは、論理的な一貫性により、いくつかの