-
OLAPの特徴は何ですか?
FASMIテスト 実行方法を指示することなく、特定の方法でOLAPアプリケーションの特性を表すことができます。 速い −システムは、約5秒以内にユーザーへのほとんどの応答を生成することを目標としており、理解できる分析には1秒以内、ごくわずかでは20秒以上かかると定義されています。 オランダの独立した調査によると、エンドユーザーは、結果が30秒以内に受信されない場合、プロセスが拒否されたと見なし、レポートに時間がかかることがシステムで必要とされない限り、「ALT + Ctrl+Delete」を押すのに適しています。 。 分析 −システムは、アプリケーションとユーザーに適したビジネスロジッ
-
OLAPのWebベースのツールとは何ですか?
次のようなさまざまなWebベースのツールがあります- Arbor Essbase Web −このツールは、ドリルアップ、ドリルダウン、アクロスなどの機能を提供します。スライスとダイス、および強力なレポート、すべてOLAP用。また、完全なマルチユーザー同時書き込み機能などのデータ入力も提供します。 Arbor Essbaseは単なるサーバー製品であり、ユーザーパッケージは存在しないため、独自のデスクトップクライアントバージョン市場を保証します。 Web製品は、管理構造と開発構造を復元しませんが、クエリと更新に対するユーザーアクセスのみを復元します。 Information Advant
-
キューブ計算の戦略は何ですか?
データキューブを効率的に計算するための一般的な最適化手法は次のとおりです- 並べ替え、ハッシュ、グループ化 −関連付けられたタプルを並べ替えてクラスター化するには、ディメンション属性に対して並べ替え、ハッシュ、およびグループ化の操作を使用する必要があります。キューブ計算では、類似したディメンション値のセットを共有するタプル(またはセル)に集計が実装されます。したがって、そのような集計の計算を促進するために、そのようなデータにアクセスしてグループ化するための並べ替え、ハッシュ、およびグループ化サービスを調査することが不可欠です。 たとえば、ブランチ、日、アイテムごとに総売上を評価できます
-
Aprioriベースのマイニングの効率をさらに向上させるにはどうすればよいですか?
次のように、元のアルゴリズムの効率を開発することを目標とする、予測されたAprioriアルゴリズムのいくつかのバリエーションがあります- ハッシュベースの手法(アイテムセットを対応するバケットにハッシュする) −ハッシュベースの手法を使用して、候補のkアイテムセットC k 1の場合。たとえば、データベース内の各トランザクションをスキャンして、頻繁な1アイテムセットを作成する場合、L 1 、候補1-C 1のアイテムセットから 、トランザクションごとに2つのアイテムセットを作成し、それらをハッシュテーブル構造のいくつかのバケットにハッシュ(つまり、マップ)して、同等のバケット数を増やすこ
-
データマイニングにおけるクラスタリングの要件は何ですか?
データマイニングにおけるクラスタリングには、次のような要件があります- スケーラビリティ −一部のクラスタリングアルゴリズムは、数百未満のデータオブジェクトを含む小さなデータセットでうまく機能します。巨大なデータベースには、何百万ものオブジェクトを含めることができます。特定の巨大なデータセットのサンプルでクラスタリングすると、部分的な結果が生じる可能性があります。高度にスケーラブルなクラスタリングアルゴリズムが必要です。 さまざまなタイプの属性を処理する機能 −一部のアルゴリズムは、間隔ベースの(数値)情報をクラスター化するように設計されています。ただし、アプリケーションでは、バイナリ、カ
-
大規模なデータセットでのk-medoidsアルゴリズムはどの程度効率的ですか?
PAMのような古典的なk-medoidsパーティショニングアルゴリズムは、小さなデータセットでは効率的に機能しますが、巨大なデータセットではうまくスケーリングしません。より高いデータセットを処理でき、CLARA(Clustering Large Applications)として知られるサンプリングベースの方法を使用できます。 CLARAの背後にあるアプローチは次のとおりです。サンプルがかなりランダムな方法で選択される場合、元のデータセットを厳密に定義する必要があります。選択された代表的なオブジェクト(medoid)は、データセット全体から選択されたものと同様になります。 CLARAは、データ
-
カメレオンとは何ですか?
カメレオンは、動的モデリングを使用してクラスターのペア間の類似性を判断する階層的クラスタリングアルゴリズムです。これは、ROCKやCUREなどの2つの階層的クラスタリングアルゴリズムで観察された弱点に基づいて変更されました。 ROCKおよび関連する設計では、クラスターの近接性に関するデータを無視しながら、クラスターの相互接続性を強調しています。 CUREおよび関連する設計では、クラスターの近接性を考慮していますが、クラスターの相互接続性は無視しています。カメレオンでは、クラスターの類似性は、クラスター内の適切に接続されたオブジェクトの程度とクラスターの近接性に応じて評価されます。特に、相互接
-
グリッドベースの方法とは何ですか?
グリッドベースのクラスタリング手法は、多重解像度グリッドデータ構造を使用します。オブジェクト領域を有限数のセルに量子化し、グリッド構造を形成します。このグリッド構造に、クラスタリングのすべての操作が実装されます。この方法の利点は、処理時間が短いことです。これは通常、データオブジェクトの数に依存せず、量子化された空間の各次元の複数のセルのみに依存します。 グリッドベースのアプローチの例には、グリッドセルに格納された統計データを探索するSTING、wavelettransformアプローチを使用してオブジェクトをクラスター化するWaveCluster、および高次元データ空間でクラスター化するため
-
データマイニングの歴史とは何ですか?
データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。 これは、データベースの所有者にとって明確で有益な結果を得るために、最初は未知である規則性または関係を見つけるための大量の情報の選択、調査、およびモデリングの手順です。 データマイニングはデータサイエンスに似ています。それは、特定の状況で、特定のデータセットに対して、目的を持っ
-
KDDとは何ですか?
KDDは、データベースでのナレッジディスカバリーを表します。これは、データ内の知識を発見する幅広いプロセスを定義し、明確なデータマイニング技術の高レベルのアプリケーションを強調しています。これは、人工知能、機械学習、パターン認識、データベース、統計、専門システムの知識獲得、データの視覚化など、いくつかの分野の研究者が関心を持っている分野です。 KDDプロセスの主な目的は、巨大なデータベースのコンテキストで情報からデータを抽出することです。これは、データマイニングアルゴリズムを利用して、知識と見なされるものを認識することによって行われます。データベースでのナレッジディスカバリーは、巨大なデータ
-
KDDのプロセスは何ですか?
KDDは、データベースでのナレッジディスカバリーを表します。これは、データ内の知識を発見する幅広いプロセスを定義し、明確なデータマイニング技術の高レベルのアプリケーションを強調しています。これは、人工知能、機械学習、パターン認識、データベース、統計、専門システムの知識獲得、データの視覚化など、いくつかの分野の研究者が関心を持っている分野です。 知識発見プロセスは反復的かつインタラクティブであり、9つのステップが含まれます。このプロセスはすべての段階で繰り返され、前のアクションへの変換が必要になる可能性があることを意味します。このプロセスには、1つの式を提示したり、各ステップとアプリケーション
-
データマイニング方法論に関連するユーザーインタラクションの問題は何ですか?
データマイニングの方法論に関連するさまざまなユーザーインタラクションの問題があります。これらは次のとおりです- データベースでさまざまな種類の知識をマイニングする −さまざまなユーザーがさまざまな種類の知識に興味を持つ可能性があります。したがって、データマイニングは、データの特性評価、識別、関連付け、分類、クラスタリング、傾向と偏差の分析、類似性の分析など、幅広いデータ分析と知識発見のタスクをカバーする必要があります。 複数レベルの抽象化での知識のインタラクティブなマイニング −データベース内で何を見つけることができるかを正確に知ることは複雑であるため、データマイニングプロセスはインタラク
-
データマイニングメトリクスとは何ですか?
データマイニングは、知覚モデル、分析モデル、および複数のアルゴリズムを使用して人間の脳の技術をシミュレートする人工知能の形式の1つです。データマイニングは、人間の意思決定を行い、人間の選択を作成するためのマシンをサポートします。 データマイニングツールのユーザーは、マシンのルール、設定、さらには意思決定支援データマイニングメトリックを取得するための経験を指示する必要があります- 有用性 −有用性には、モデルが有用なデータを提供するかどうかを示すいくつかのメトリックが含まれます。たとえば、場所の保存と売り上げを関連付けるデータマイニングモデルは、正確で信頼性の高いものですが、同じ場所に店舗を
-
データマイニングの社会的影響は何ですか?
データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。 データマイニングシステムは、個人の識別と分類をさまざまなグループまたはセグメントに促進するように設計されています。商業企業の観点から、そしておそらく業界全体の観点から、データマイニングの使用を利益の合理的な検索における差別的な技術として解釈することができます。 データマイニン
-
データマイニングの課題は何ですか?
データマイニングには次のようなさまざまな課題があります- データマイニングアルゴリズムの効率とスケーラビリティ −データベース内の大量のデータから効果的にデータを抽出できます。知識発見アルゴリズムは、効率的で巨大なデータベースに拡張可能である必要があります。具体的には、データマイニングアルゴリズムの実行時間は、巨大なデータベースで予測可能で許容できるものでなければなりません。指数関数的またはチャネル次数の多項式の複雑さを持つアルゴリズムは、効率的に使用できません。 データマイニング結果の有用性、確実性、表現力 −識別された知識は、データベースの内容を正確に描写し、特定のアプリケーションに役
-
クラスタリングとは何ですか?
物理オブジェクトまたは抽象オブジェクトのセットを同じオブジェクトのクラスに結合するプロセスは、クラスタリングと呼ばれます。クラスターは、同じクラスター内で互いに同じであり、他のクラスター内のオブジェクトとは異なるデータオブジェクトのセットです。データオブジェクトのクラスターは、複数のアプリケーションで1つのグループとしてまとめて考えることができます。クラスター分析は人間にとって不可欠な活動です。 クラスター分析は、これらのレコードに対して行われたさまざまな測定に応じて、同じレコードのグループまたはクラスターを形成するために使用されます。重要な設計は、分析の目的に役立つ方法でクラスターを定義す
-
クラスタリングのアプリケーションは何ですか?
クラスタリングには次のようなさまざまな用途があります- スケーラビリティ −一部のクラスタリングアルゴリズムは、200未満のデータオブジェクトを含む小さなデータセットでうまく機能します。ただし、巨大なデータベースには数百万のオブジェクトが含まれる可能性があります。特定の巨大なデータセットのサンプルでクラスタリングすると、結果に偏りが生じる可能性があります。高度にスケーラブルなクラスタリングアルゴリズムが必要です。 さまざまなタイプの属性を処理する機能 −一部のアルゴリズムは、間隔ベースの(数値)レコードをクラスター化するように設計されています。ただし、アプリケーションでは、バイナリ
-
クラスタリングの方法は何ですか?
クラスタリングには次のようなさまざまな方法があります- パーティション分割方法 − n個のオブジェクトまたはデータタプルのデータベースが与えられた場合、パーティショニングメソッドは情報のk個のパーティションをアセンブルします。各パーティションはクラスターを定義し、k
-
HOLAPとは何ですか?
HOLAPはハイブリッドOLAPを表します。 ROLAPのスケーラビリティとMOLAPのクエリ実装の間のトレードオフを管理できます。一部の商用OLAPサーバーは、HOLAP方式に依存しています。この場合、ユーザーはデータのどの部分をMOLAPに保存し、どの部分をROLAPに保存するかを決定します。たとえば、通常、低レベルのデータはリレーショナルデータベースを使用して保存されますが、集計を含む高レベルのデータは独立したMOLAPに保存されます。 HOLAPは、OLAP(リレーショナルOLAP)とMOLAP(多次元OLAP)を組み合わせたもので、OLAPのさまざまな実装です。 HOLAPを使用す
-
最適化されたビットマップフィルタリングはどのように実装されていますか?
ビットマップフィルターは、選択的である場合にのみ有益です。クエリオプティマイザは、最適化されたビットマップフィルタが役立つのに十分な選択性を備えているかどうか、およびフィルタがどの演算子に使用されるかを決定します。オプティマイザーフィールドは、スター結合のすべての部門で最適化されたビットマップフィルターを使用し、原価計算ルールを使用して、計画が最小の推定実装コストをサポートするかどうかを決定します。 最適化されたビットマップフィルターが非選択的である場合、コスト見積もりは一般に高すぎて、計画は拒否されます。プラン内の最適化されたビットマップフィルターを配置する場所を検討する場合、ハッシュ結合