プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

Webマイニングとは何ですか?


Webマイニングは、適応されたデータマイニング手法をWebに適用するものと広く見なすことができますが、データマイニングは、知識発見プロセスに固定されたほとんどの構造化データのパターンを見つけるためのアルゴリズムの適用として表されます。

Webマイニングには、複数のデータ型の収集をサポートする独自の特性があります。Webには、テキストを含むWebページ、ハイパーリンクを介したWebページの接続、Webを介したユーザーアクティビティの監視など、マイニングプロセスに複数のアプローチをもたらすいくつかの側面があります。サーバーログ。

これは以下の観察に基づいており、Webは効果的なリソースと知識の発見にも大きな課題をもたらします。

Webは、効率的なデータウェアハウジングとデータマイニングには大きすぎるようです − Webのサイズは数百テラバイトのオーダーであり、現在も急速に成長しています。一部の組織や社会では、公開されているいくつかのデータをWeb上に配置しています。 Web上の一部のデータを複製、保存、または統合するためのデータウェアハウスのセットアップに適用できます。

Webページの複雑さは、従来のテキストドキュメントコレクションよりもはるかに複雑です −Webページには統一された構造がありません。それらには、本や他の従来のテキストベースのドキュメントのセットよりもはるかに多くのオーサリングスタイルとコンテンツのバリエーションが含まれています。

Webは巨大なデジタルライブラリとして扱われます。ただし、このライブラリの膨大な数のレコードは、特定の並べ替え順序に従って配置されていません。要素ごと、タイトル、著者、表紙、目次などによる索引はありません。このようなライブラリで必要な情報を検索するのは非常に難しい場合があります。

Webは非常に動的な情報源です − Webが急速に成長するだけでなく、その情報も絶えず更新されます。ニュース、株式市場、天気、スポーツ、ショッピング、会社の広告、およびその他の多数のWebページがWeb上で定期的に更新されます。リンケージ情報とアクセス記録も頻繁に更新されます。

Webはさまざまなユーザーコミュニティにサービスを提供します −インターネットは現在1億台以上のワークステーションに接続しており、そのユーザーコミュニティはまだ急速に拡大しています。ユーザーは、複数の背景、興味、使用目標を持つことができます。

一部のユーザーは、データネットワークの構造について十分な知識を持っておらず、特定の検索の莫大なコストを認識できない場合があります。彼らは、ネットワークの「暗闇」を模索することで簡単に迷子になったり、多くのアクセス「ホップ」を利用して情報を待ち焦がれて退屈したりする可能性があります。


  1. Web使用マイニングとは何ですか?

    Web使用状況マイニングは、ウェブログデータから有用なデータ、情報、知識を引き出すために使用され、Webページのユーザーアクセスデザインを特定するのに役立ちます。 ウェブリソースの管理であるマイニングでは、個人がウェブサーバーのログとして構成されたウェブサイトの訪問者のリクエストのデータについて考えています。一連のWebページのコンテンツとメカニズムはページの作成者の意図に従いますが、単一のリクエストは、ユーザーがこれらのページをどのように表示するかを示します。 Web使用マイニングは、ページの設計者によって提案されなかった関係を開示する可能性があります。 Webサーバーは通常、Webペー

  2. 時空間データマイニングとは何ですか?

    時空間データマイニングは、時空間データからパターンと知識を見つけるプロセスを定義します。時空間データマイニングの例には、都市や土地の開発履歴の検索、気象設計の発見、地震やハリケーンの予測、地球温暖化の傾向の決定が含まれます。 携帯電話、GPSデバイス、インターネットベースの地図サービス、気象サービス、デジタルアース、衛星、RFID、センサー、ワイヤレス、ビデオテクノロジーの認知度を考えると、時空間データマイニングは重要になり、広範囲にわたる影響があります。 時空間データにはいくつかの種類があり、移動物体データが重要です。たとえば、動物科学者は野生生物の遠隔測定装置を接続して生態学的行動を調