プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

Web使用マイニングのルールは何ですか?


Webマイニングは、データマイニング技術を使用して、Webベースのレコードとサービス、サーバーログ、およびハイパーリンクから処理することにより、一般にWebの助けを借りて有益なパターンの傾向とデータを抽出するプロセスを定義します。 Webマイニングの目的は、情報を収集および分析して重要な洞察を得ることにより、Webレコードでデザインを見つけることです。

Webマイニングは、インターネットへの適応データマイニングアプローチのソフトウェアと見なすことができますが、データマイニングは、知識発見プロセスに固定された一般的な構造化データのパターンを発見するためのアルゴリズムのアプリケーションとして定義されます。

Webマイニングには、複数のデータ型のセットを提供するための独特の機能があります。 Webには、テキストを含むWebページ、ハイパーリンクを介してリンクされたWebページ、Webサーバーログを介して顧客のアクティビティを監視できるなど、マイニング手順に複数のアプローチをもたらす複数の要素があります。

Web使用マイニングには、次のようなさまざまなルールがあります-

前処理 − Web使用ログは、マイニングアプリケーションがアクセスできる形式ではありません。マイニングアプリケーションで使用される一部のデータでは、データの再フォーマットとクレンジングが必要になる場合があります。特にウェブログの使用に関連するいくつかの問題があります。処理フェーズには、クレンジング、ユーザーID、セッションID、パス完了、フォーマットなど、いくつかのステップが含まれています。

データ構造 − Web使用マイニングプロセス中に識別されたパターンを追跡するために、いくつかの固有のデータ構造が提案されています。使用される基本的なデータ構造はツリーと呼ばれます。ツリーはルートツリーであり、ルートからリーフへの各パスはシーケンスを表します。ツリーは、パターンマッチングアプリケーション用に文字列を保存できます。ツリーの唯一の問題はスペース要件です。

パターンの発見 −クリックストリームデータで使用される最も一般的なデータマイニング手法は、トラバーサルパターンを明らかにする手法です。トラバーサルパターンは、セッションでユーザーが検査するページのグループです。他のタイプのパターンは、Web使用マイニングによって明らかになる可能性があります。パターンは、さまざまな機能をさまざまな目的で発見するために使用されるさまざまな組み合わせを使用して検出されます。

パターン分析 −パターンが発見されたら、その情報をどのように使用できるかを判断するためにパターンを分析する必要があります。一部のパターンは削除でき、関心があると判断されない可能性があります。

パターン分析は、発見活動の結果を表示および解釈するフェーズです。頻繁なタイプのトラバーサルパターンを特定する必要はありませんが、その一意性または統計的特性のために関心のあるパターンを特定する必要もあります。


  1. 属性の一般化のルールは何ですか?

    属性の一般化は、次のルールに依存します。元の作業関係に属性の個別の値の膨大なコレクションがあり、属性に一般化演算子のグループが存在する場合、一般化演算子を選択して属性に使用する必要があります。 。 このルールは、次の理由に依存します。一般化サービスを使用して、作業関係のタプルまたはルール内の属性値を一般化すると、ルールがより多くの初期データタプルをカバーするようになり、定義する概念が一般化されます。これは、インスタンスからの知識で一般化ツリーを登ること、または概念ツリーのアセンションとして定義される一般化ルールに対応します。 これは、含まれている属性またはアプリケーションに基づいており、ユ

  2. Web使用マイニングとは何ですか?

    Web使用状況マイニングは、ウェブログデータから有用なデータ、情報、知識を引き出すために使用され、Webページのユーザーアクセスデザインを特定するのに役立ちます。 ウェブリソースの管理であるマイニングでは、個人がウェブサーバーのログとして構成されたウェブサイトの訪問者のリクエストのデータについて考えています。一連のWebページのコンテンツとメカニズムはページの作成者の意図に従いますが、単一のリクエストは、ユーザーがこれらのページをどのように表示するかを示します。 Web使用マイニングは、ページの設計者によって提案されなかった関係を開示する可能性があります。 Webサーバーは通常、Webペー