プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

CRISP-DMのアプリケーションは何ですか?


データマイニングの業界標準プロセス(CRISP-DM)は、M&V方法論をさらに標準化し、エネルギー節約のより効率的な見積もりを可能にするアプローチとして認識されました。 CRISP-DMには、次のようないくつかのアプリケーションがあります-

ビジネスの理解 − M&Vを支援するためのDMの適用の実現可能性を作成するために、ケーススタディとして生物医学製造施設が選択されました。プロセスのモデリングおよび評価フェーズで結果を実行するには、分析中のビジネスの品質を理解することが重要でした。これは、プロセスウォークスルーを実行し、プロセスフロー図を学習し、配管および計装図を実行することによって実装されました。

このフェーズから、分析の境界内にあるシステムの知識が必要であり、施設のエンジニアリングチームとの間でさらにいくつかの問題を理解しました。分析の境界は、製造施設全体の電気エネルギー消費量でした。

データの理解 − CRISP-DM参照モデルのデータ理解手順は、施設のデータ技術インフラストラクチャの調査を通じて完了しました。エネルギー消費データの流れとそれが保存されたデータベースの理解が得られました。

データの準備 −エネルギー消費データは、メータリングの機能のために計算が複雑です。累積メーターは電気エネルギーに使用されるため、出力されたデータに対して前処理を完了する必要があります。調査中のケースでは、これはユーザーに出力される前に達成されました。

ただし、このデータの事前クレンジングに関係なく、事前クレンジング手順ですべての異常が解消されなかったため、データセットに外れ値が残りました。したがって、データ準備フェーズを使用して、ユーザーに配信されたデータセットに残っている外れ値を排除しました。

2つのデータソースを使用して、オンサイトの電気エネルギー消費者の全体的な分析に必要なデータを収集しました。エネルギー管理アプリケーションと風力タービン管理アプリケーションです。

現場で魅了される電気エネルギーは、累積キロワット時(kWh)メートルで計算されます。このデータの前処理には、メーターエラーによって生成された外れ値の検出と、データをkWhからキロワット(kW)単位の平均電気負荷に変換することが含まれていました。 2番目のステップは、同じ形式と単位でいくつかのデータを分析するために必要でした。

モデリング −データ準備手順から出力されたデータセットは、実装されたデータクレンジングの結果としてクリーンで機能的な形式でした。このケーススタディのgaolsでは、圧縮空気負荷がモデル化するために選択された量でした。これは、利用可能なエネルギーデータのパワーを特徴付けるのに最も適した変数であったためです。

負荷を高レベルで考慮した場合、現場の他の必須エネルギーユーザーとの明確で明らかな相関関係はありませんでした。他の必須エネルギーユーザーは、供給のスケジュール設定と標準的な運用プロセスの存在により、より予測可能でした。


  1. パターンマイニングのアプリケーションは何ですか?

    パターンマイニングには、次のようなさまざまなアプリケーションがあります- パターンマイニングは、一般に、いくつかのデータ集約型アプリケーションでの前処理として、ノイズフィルタリングとデータクリーニングに使用されます。たとえば、数万の次元(たとえば、遺伝子の記述)を含むマイクロアレイデータを探索するために使用できます。 パターンマイニングは、データに隠された固有のメカニズムとクラスターの発見を提供します。たとえば、DBLPデータセットを考えると、頻繁なパターンマイニングでは、共著者クラスター(一般的に共同作業を行う著者を決定する)や会議クラスター(複数の著者と用語の共有を決定する)などの興味

  2. データの整合性の種類は何ですか?

    データベースの整合性は、格納された情報の有効性と整合性を定義します。整合性は、一般に、データベースが違反することを許可されていない整合性ルールである制約の観点から定義されます。制約は、各属性に適用することも、テーブル間の関係に適用することもできます。 整合性制約により、許可されたユーザーがデータベースに加えた変更(更新の削除、挿入)によってデータの整合性が失われることはありません。したがって、整合性制約はデータベースへの偶発的な損傷を防ぎます。 データの整合性には、次のようなさまざまなタイプがあります- 論理的整合性 −リレーショナルデータベースでは、論理的な一貫性により、いくつかの