プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

ウェブマイニングの方法論は何ですか?


Webマイニングは、知識の学習または導出を目的とした、Webベースのデータへの機械学習(データマイニング)アプローチのアプリケーションです。 Webマイニングの方法論は、次の3つの異なる要素のいずれかに定義できます-

Web使用状況マイニング − Web使用マイニングは、WebページのWebアクセスデータのセットを有効にする一種のWebマイニングです。この使用状況データは、アクセスされたWebページにつながる方向をサポートします。

このデータは、Webサーバーを介して接続ログに自動的に収集されます。 CGIスクリプトは、リファラーログ、ユーザーサブスクリプションデータ、調査ログなどの有用なデータを提供します。このカテゴリは、組織とそのインターネット/イントラネットベースのアプリケーションおよびデータアクセスのためのデータマイニングを完全に使用するために不可欠です。

使用状況マイニングにより、企業はビジネスの保守性の将来に関する生産的なデータを作成できます。生涯のユーザー価値、製品のクロスマーケティングアプローチ、およびプロモーションキャンペーンの有効性に関する集合データから、さまざまなデータを導き出すことができます。

収集された使用状況データは、組織がビジネスの結果をより効率的にし、売上を向上させる機能を提供します。使用記録は、競合他社を売り越し、会社のサービスや製品をより大きなレベルで強化するマーケティングスキルを作成するのにも役立ちます。

Web構造マイニング − Web構造マイニングは、データまたは直接リンク接続によってリンクされたWebページ間の関係を認識できるツールです。この構造情報は、Webページのデータベースアプローチを介してWeb構造スキーマを配置することで検出できます。

この接続により、検索エンジンは、検索クエリに関連するレコードを、コンテンツが置かれているWebサイトから接続しているWebページに直接プルできます。この完了は、スパイダーがWebサイトを閲覧し、ホームページを取得し、参照リンクを介して情報を接続して、目的のデータを含む明確なページを表示する必要があることによって行われます。

構造マイニングの目標は、これまで知られていなかったWebページ間の関係を導き出すことです。このデータマイニングの構造は、ビジネスを使用してWebサイトのデータをリンクし、ナビゲーションとクラスターデータをサイトマップに含めることをサポートします。これにより、ユーザーはキーワードリレーションとコンテンツマイニングを通じて目的のデータにアクセスできるようになります。

Webコンテンツマイニング − Webコンテンツマイニングは、Webページのテキスト、画像、およびグラフを参照およびマイニングして、検索クエリに対するコンテンツの関連性を判断することです。

このブラウジングは、構造マイニングによるWebページのクラスタリングの後に行われ、送信されたクエリとの関連性のレベルに応じて結果をサポートします。ワールドワイドウェブ上でアクセス可能な大量のデータを使用して、コンテンツマイニングは、クエリ内のキーワードとの一連の最大の関連性で検索エンジンへの結果リストをサポートします。


  1. Webマイニングのアプリケーションは何ですか?

    Webマイニングは、データマイニング技術を使用して、Webベースのレコードとサービス、サーバーログ、およびハイパーリンク。 Webマイニングは、データをグループ化して分析し、重要な洞察を受け取ることで、Web情報のデザインを発見することを目的としています。 Webマイニングは、適応されたデータマイニング手法をWebに適用するものと広く見なすことができますが、データマイニングは、知識発見プロセスに固定されたほとんどの構造化データのパターンを見つけるためのアルゴリズムのアプリケーションとして表されます。 ウェブマイニングには次のようなさまざまなアプリケーションがあります- Webマイニング

  2. 統計データマイニングの方法論は何ですか?

    統計データマイニング技術では、一般的に多次元であり、場合によってはいくつかの複雑なタイプの大量のデータを効果的に処理するために作成されます。 データ分析、特に数値データについては、確立された統計手法がいくつかあります。これらの方法は、科学的記録(物理学、工学、製造、心理学、医学の実験からの記録など)や、経済学や社会科学からの情報に広く使用されています。 統計データマイニングにはさまざまな方法論があります- 回帰 −一般に、これらの手法は、変数が数値である新しい予測子(独立)変数から応答(従属)変数の値を予測するために使用されます。回帰には、線形、多重、加重、多項式、ノンパラメトリック、ロ