データマイニングメトリクスとは何ですか?
データマイニングは、知覚モデル、分析モデル、および複数のアルゴリズムを使用して人間の脳の技術をシミュレートする人工知能の形式の1つです。データマイニングは、人間の意思決定を行い、人間の選択を作成するためのマシンをサポートします。
データマイニングツールのユーザーは、マシンのルール、設定、さらには意思決定支援データマイニングメトリックを取得するための経験を指示する必要があります-
有用性 −有用性には、モデルが有用なデータを提供するかどうかを示すいくつかのメトリックが含まれます。たとえば、場所の保存と売り上げを関連付けるデータマイニングモデルは、正確で信頼性の高いものですが、同じ場所に店舗を追加してその結果を一般化できないため、有用ではありません。
さらに、特定の場所の売上が多い理由という基本的なビジネス上の質問には答えていません。また、データの相互相関に依存しているため、成功しているように見えるモデルは無意味であることがわかります。
投資収益率(ROI) −データマイニングツールは、データ内に埋め込まれた興味深いパターンを見つけ、予測モデルを開発します。これらのモデルには、レコードにどの程度適合しているかを示すためのいくつかの基準があります。データマイニング分析の要素として報告されたいくつかの指標に基づいて決定を下す方法は明確ではありません。
データマイニング中に財務情報にアクセスする −財務面で意思決定を組み立てる最も簡単な方法は、財務データも含むように一般的にマイニングされる生の情報を補強することです。一部の組織は、データウェアハウスとデータマートに投資して開発しています。
倉庫またはマートの設計には、予想されるクエリに必要な分析とデータのタイプに関する考慮事項が含まれています。製品属性やユーザープロファイルなどのより一般的なデータへのアクセスとともに、財務情報へのアクセスを可能にする方法で倉庫を設計しています。
データマイニング指標を金銭的条件に変換する −一般的なデータマイニングメトリックは、「リフト」の尺度です。リフトは、モデルが使用されていない基本レートと比較して、特定のモデルまたはパターンを使用することによって達成されるものの尺度です。高い値は、多くが達成されることを意味します。そうすれば、Liftに基づいて簡単に決定を下すことができるように思えます。
精度 −精度は、モデルが結果をサポートされているデータの属性とどの程度相関させるかを示す尺度です。精度にはいくつかの尺度がありますが、すべての正確さの尺度は、使用される情報に依存します。実際には、値が欠落しているか概算であるか、データが複数のプロセスによって変更されている可能性があります。
これは調査と開発の手順であり、特にデータの特性がかなり均一である場合は、データ内の特定の量のエラーを受け入れることを決定できます。たとえば、過去の売上に基づいて特定の店舗の売上を予測するモデルは、その店舗が常に間違った会計手法を使用している場合でも、強力に相関し、非常に正確である可能性があります。したがって、精度の測定は、信頼性の評価によってバランスを取る必要があります。
-
時間的データマイニングとは何ですか?
時間的データマイニングは、時間的データの大規模なセットから、重要で、暗黙的で、潜在的に不可欠なデータを抽出するプロセスを定義します。時間データは一連の主要なデータタイプであり、通常は数値であり、時間データから有益な知識を収集することを扱います。 時間的データマイニングの目的は、時間的シーケンスと呼ばれるアルファベットからの名目上のシンボルのシーケンスと連続的な実数のシーケンスで構成される、より高いシーケンシャルデータの時間的パターン、予期しない傾向、またはいくつかの隠れた関係を見つけることです。機械学習、統計、データベーステクノロジーからの一連のアプローチを利用することにより、時系列と呼ばれ
-
時空間データマイニングとは何ですか?
時空間データマイニングは、時空間データからパターンと知識を見つけるプロセスを定義します。時空間データマイニングの例には、都市や土地の開発履歴の検索、気象設計の発見、地震やハリケーンの予測、地球温暖化の傾向の決定が含まれます。 携帯電話、GPSデバイス、インターネットベースの地図サービス、気象サービス、デジタルアース、衛星、RFID、センサー、ワイヤレス、ビデオテクノロジーの認知度を考えると、時空間データマイニングは重要になり、広範囲にわたる影響があります。 時空間データにはいくつかの種類があり、移動物体データが重要です。たとえば、動物科学者は野生生物の遠隔測定装置を接続して生態学的行動を調