プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

相関ルール学習とは何ですか?


相関ルール学習は、あるデータ要素が別のデータ要素に依存しているかどうかをテストし、費用対効果が高くなるように適切に設計する、一種の教師なし学習手法です。データセットの変数間のいくつかの興味深い関係または関連を発見しようとします。データベース内の変数間の興味深い関係を見つけるには、さまざまなルールに依存します。

相関ルール学習は、機械学習の最も重要なアプローチであり、マーケットバスケット分析、Web使用マイニング、連続生産などで使用されます。マーケットバスケット分析では、複数の大手小売業者が相互の関係を見つけるために使用するアプローチです。アイテム。

Webマイニングは、インターネットへの適応データマイニング手法の適用と見なすことができますが、データマイニングは、知識発見プロセスに固定されたほとんどの構造化データのパターンを発見するアルゴリズムのアプリケーションとして定義されています。

Webマイニングには、複数のデータ型のコレクションをサポートするための独特の特性があります。 Webには、テキストを含むWebページ、ハイパーリンクを介したWebページの接続、Webサーバーログを介したユーザーアクティビティの監視など、マイニングプロセスに複数のアプローチをもたらすいくつかの側面があります。

マーケットバスケット分析では、顧客が買い物かごに入れるさまざまなアイテム間の関連を見つけることによって、顧客の購買習慣を分析します。そのような関連性を発見することにより、小売業者は、どの要素がユーザーによって頻繁に購入されるかを分析することによってマーケティング手法を生み出します。この関連付けは、小売業者が選択的なマーケティングを行い、棚の面積を計画することをサポートすることにより、売り上げの増加につながる可能性があります。

相関ルール学習の種類

次のような相関ルール学習のタイプがあります-

アプリオリアルゴリズム −このアルゴリズムは、相関ルールを生成するために頻繁なデータセットを必要とします。トランザクションを含むデータベースで動作するように設計されています。このアルゴリズムでは、アイテムセットを効率的に計算するために幅優先探索とハッシュツリーが必要です。

これは通常、マーケットバスケット分析と、一緒に購入できる製品を学習するためのサポートに使用されます。医療分野で患者の薬の反応を発見するために使用できます。

Eclatアルゴリズム − Eclatアルゴリズムは、同値類変換を表します。このアルゴリズムでは、トランザクションデータベース内の頻繁なアイテムセットを検出するために、深さ優先探索方式が必要です。 Aprioriアルゴリズムよりも高速な実行を実装します。

F-P成長アルゴリズム −F-P成長アルゴリズムは頻繁なパターンを表します。これは、Aprioriアルゴリズムの拡張バージョンです。これは、頻繁なパターンまたはツリーと呼ばれるツリー構造の形式でデータベースを記述します。この頻繁なツリーは、最も頻繁なパターンを抽出することを目的としています。


  1. アクティブラーニングとは何ですか?

    アクティブラーニングは、データが十分であるが、クラスラベルの取得が不足しているか、コストがかかる状況に関連する、反復型の教師あり学習です。学習アルゴリズムは、ユーザー(たとえば、個人のオラクル)にラベルを注意深く照会できるという点でアクティブです。この方法の概念を理解するために使用される複数のタプルは、通常の教師あり学習で必要な数よりも少なくなります。 これは、コストを抑えるために使用されます。アクティブラーニングの目的は、ラベル付けされた例をできるだけ少なくして、高精度を達成することです。検討中のすべてのデータをDとします。 Dでアクティブラーニングを続けるにはいくつかの方法があります。

  2. PythonのCGIとは何ですか?

    Common Gateway Interface(CGI)は、外部ゲートウェイプログラムがHTTPサーバーなどの情報サーバーとインターフェイスするための標準です。 現在のバージョンはCGI/1.1であり、CGI/1.2は進行中です。 ウェブブラウジング CGIの概念を理解するために、ハイパーリンクをクリックして特定のWebページまたはURLを参照するとどうなるかを見てみましょう。 ブラウザがHTTPWebサーバーに接続し、URL、つまりファイル名を要求します。 WebサーバーはURLを解析し、ファイル名を探します。そのファイルが見つかった場合はブラウザに送り返します。それ以外の場合は、