プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

マーケットバスケット分析とは何ですか?


マーケットバスケット分析は、個々の方法を表すものではなく、POSトランザクションデータの理解に関連する一連のビジネス上の問題を表します。マーケットバスケットデータは、ユーザー、注文(購入またはバスケット、または学術論文ではアイテムセットとも呼ばれます)、アイテムなど、3つの根本的に異なるエンティティを表すトランザクションデータです。

オーダーは、マーケットバスケットデータのコンポーネントデータ構造です。注文は、ユーザーによる単一の購入イベントを表します。これは、ウェブサイトで複数の商品を注文するユーザー、食料品のバスケットを購入するユーザー、またはカタログからいくつかの商品を購入するユーザーに関連している可能性があります。

これには、購入の合計金額、合計金額、より高い送料、支払いの種類、およびトランザクションに関して効率的ないくつかのデータが含まれます。一貫して、トランザクションには明確な識別子が提供されます。特定の識別子を他のデータから切り離す必要がある場合がありました。

注文内の単一のアイテムは、個別にラインアイテムとして記述されます。このデータには、アイテムに支払われた金額、アイテムの数、税金を請求する必要があるかどうか、場合によってはコスト(マージンの計算に使用できます)が含まれます。

アイテムテーブルは、各製品に関するより説明的な情報を提供する製品参照テーブルにも頻繁に接続されています。この記述データには、分析に役立つことを示すことができる製品階層およびその他のデータが含まれている必要があります。

ユーザーテーブルはオプションのテーブルであり、登録が必要なWebサイトや、トランザクション中にユーザーがアフィニティカードを必要とした場合など、ユーザーを識別できる場合にアクセスできる必要があります。 usersテーブルには興味深い概念がありますが、動的要素はID自体です。これは、時間の経過とともにトランザクションをリンクできるためです。

ユーザーを経時的に追跡することで、たとえば、どの食料品の買い物客が小麦粉やパッケージ済みのケーキミックスの作成者にとって非常に興味深いものを「ゼロから焼く」かを判断できます。そのようなユーザーは、小麦粉、ベーキングパウダー、および同等の材料を購入する頻度、ユーザーの総支出に対するそのような購入の割合、およびパッケージ済みのコンバインとすぐに食べられるデザートへの関心の欠如から特定できます。

これらは、ビジネスに対する幅広い洞察をサポートします。このような場合、リピーターがいるため、ユーザーあたりの注文の割合は1に近くなります。これは、ユーザーあたりの販売数を改善するビジネスチャンスをサポートします。注文ごとの複数の製品は1に近くなる可能性があり、注文の手順中にクロスセリングの機会をサポートします。


  1. STREAMとは何ですか?

    STREAMは、k-中央値問題のために作成された個別パスの定数要素近似アルゴリズムです。 k-medians問題は、ポイントとそれらが割り当てられているクラスター中心との間の二乗和誤差(SSQ)が最小になるように、N個のデータポイントをk個のクラスターまたはグループにクラスター化することです。アイデアは、同じクラスターに同様のポイントを割り当てることです。これらのポイントは、他のクラスターのポイントとは異なります。 ストリームデータモデルでは、データポイントは1回しか表示できず、メモリと時間は制限されています。高品質のクラスタリングを実装できます。STREAMアルゴリズムは、データストリーム

  2. ドキュメントクラスタリング分析とは何ですか?

    ドキュメントのクラスタリングは、教師なしでファイルを整理するための重要な手法です。ドキュメントが用語ベクトルとして表される場合、クラスタリング手法を適用できます。ドキュメントスペースは、数百から数千に及ぶ大きな次元を持ち続けています。 次元の呪いのために、最初にドキュメントを低次元の部分空間に投影することは理にかなっています。そこでは、ドキュメント空間の意味構造が明確になります。低次元のセマンティック領域では、従来のクラスタリングアルゴリズムを使用できます。 ドキュメントクラスタリング分析にはいくつかの方法があります- スペクトルクラスタリング −スペクトルクラスタリング手法は、最初に元