SQL
 Computer >> コンピューター >  >> プログラミング >> SQL

マルチレベルの関連付けルールを発見する:Apriori を使用して製品からカテゴリまで

相関ルール マイニングでは、サポート (頻度) と信頼度 (信頼性) によって測定される「A であれば B」ルールを使用して、データセット内の項目間の関係を検出します。マルチレベル相関ルール マイニングは、これを拡張して、たとえば個々の製品と製品カテゴリの間など、さまざまな粒度レベルでの関係を見つけます。

関連付けルールの基本

Apriori アルゴリズムは、マイニング関連ルールに広く使用されています。候補アイテムセットを繰り返し生成し、サポート/信頼しきい値を下回るアイテムセットを削除します。

電子機器 ラップトップ 電話 タブレット Dell HP レベル 0 レベル 1 レベル 2

タイプ

  • さまざまな次元(製品、地域、時間)にわたる多次元の関係
  • 粒度レベルにわたるマルチレベルの関係(個々のアイテム ↔ カテゴリ)

サポートしきい値アプローチ

アプローチ 説明 トレードオフ 均一なサポートすべてのレベルで同じしきい値シンプルだが、低レベルのパターンを見逃す可能性があるサポートの軽減下位レベルではしきい値が低いより多くのパターンを検出しますが、計算量は多くなりますグループベースのサポートエキスパートはグループ/カテゴリごとにしきい値を設定します最も柔軟で、ドメインの知識が必要です

アプリケーション

  • 小売顧客の購買行動、商品配置の最適化
  • ヘルスケア 疾患パターンの特定、治療の最適化
  • 不正検出 金融および保険における異常検出
  • ウェブマイニング ユーザーの好みの分析、コンテンツのパーソナライゼーション
  • ソーシャル ネットワーク コミュニティの検出、インフルエンサーの特定

課題

  • 高次元性 属性の数が多いと複雑さが増します。
  • 大規模なデータセット レコードの量が多いと処理が遅くなります。
  • スケーラビリティ データセットが大きすぎてメモリに収まらない場合は、分散アプローチが必要です。

結論

マルチレベル相関ルール マイニングは、単一レベル マイニングでは見逃されるさまざまな粒度レベルでの関係を発見します。サポートしきい値アプローチ (均一、削減、またはグループベース) の選択により、パターン検出と計算コストのバランスがとれます。これは、小売、ヘルスケア、不正行為検出、ウェブ マイニングに広く適用されています。

マルチレベルの関連付けルールを発見する:Apriori を使用して製品からカテゴリまで


  1. 基本的な SQL 用語集:データベース言語をマスターするための初心者ガイド

    SQL 用語をしっかりと理解することは、テクノロジー業界に参入するすべての人にとって重要です。 SQL は、ソフトウェア開発者の間で最もよく使用されるプログラミング言語の 1 つです。 SQL 用語のリストは、同僚と効率的にコミュニケーションし、共同作業するために必要な基礎を提供します。 SQL 用語集は、始めるのに最適な場所です。この 5 つの一般的な SQL 用語のリストは、テクノロジーの分野を始めようとする人に役立ちます。あなたが新進気鋭のデータ アナリストであれば、当社の SQL 用語早見表が最適です。これらの高度な用語は、キャリアで大きな成功を収めるために必要な優位性をもたらします

  2. NoSQL をマスターする:最新のデータベース ソリューションの実践ガイド

    最後に Facebook を通じてメッセージを送信したのはいつですか?最近、自宅で「スマート」家電を使用しましたか?どちらの例でも、情報を保存するにはデータベースが必要です。このような場合には、NoSQL データベースがよく使用されます。  NoSQL、つまり「SQL だけではない」は、リレーショナル データベースの代替手段です。リレーショナル データベースでは、情報は他のデータ ポイントとの関係に従って分類されます。 MongoDB、Redis、Cassandra など、人気のある NoSQL データベースがいくつかあります。リレーショナル データベースでは簡単に処理できないデー