プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

リンクマイニングのタスクは何ですか?


リンクマイニングには、次のようないくつかのタスクがあります-

  • リンクベースのオブジェクト分類 −従来の分類アプローチでは、オブジェクトは、それらを定義する属性に従って分類されます。リンクベースの分類は、オブジェクトのカテゴリがその属性だけでなく、そのリンク、およびリンクされたオブジェクトの属性にも依存することを予測します。

    Webページの分類は、リンクベースの分類のよく識別されたインスタンスです。単語の外観(ページに表示される単語)とアンカーテキスト(ハイパーリンクの単語、つまり、リンクをクリックできるときにクリックできる単語)に基づいて、Webページの分類を予測します。どちらも機能します。属性として。さらに、分類は、ページ間のリンクと、ページおよびリンクのさまざまな属性によって異なります。

  • オブジェクトタイプの予測 −これは、オブジェクトの属性とリンク、およびオブジェクトに接続されているオブジェクトの属性に応じて、オブジェクトのタイプを予測します。書誌領域では、出版物の開催地タイプを会議、ジャーナル、またはワークショップのいずれかとして予測する必要がある場合があります。接続ドメインでは、同じタスクは、接続の連絡先が電子メール、電話、またはメールのいずれであるかを予測することです。

  • リンクタイプの予測 −これは、含まれているオブジェクトのプロパティに応じて、リンクのタイプまたは目標を予測します。たとえば、疫学データがあれば、お互いを理解している2人が家族、同僚、知人のいずれであるかを予測することができます。

  • リンクの存在を予測する − 2つのオブジェクト間に接続が存在することを理解でき、そのタイプを予測する必要があるリンクタイプ予測とは異なり、2つのオブジェクト間にリンクが存在するかどうかを予測する必要があります。例には、2つのWebページ間にリンクがあるかどうか、およびある論文が別の論文を引用するかどうかの予測が含まれます。

  • リンクカーディナリティの推定 −リンクカーディナリティ推定には2つの形式があります。まず、オブジェクトへのリンクの数を予測できます。これは、たとえば、Webページへのリンク(リンク内)の数に応じてWebページの信頼性を予測する場合に役立ちます。同様に、複数のアウトリンクを使用して、ハブとして機能するWebページを認識することができます。ハブは、同じケースの複数の信頼できるページを指す1つまたは一連のWebページです。

  • オブジェクトの調整 −オブジェクト調整では、機能は、属性とリンクに基づいて、2つのオブジェクトが文字通り同じであるかどうかを予測することです。この機能は、情報抽出、重複の削除、オブジェクトの統合、引用の接続で一般的であり、レコードのリンクまたはIDの不確実性とも呼ばれます。


  1. データマイニングインターフェイスとは何ですか?

    データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。 事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。 これは、データベースの所有者にとって明確で有益な結果を得るために、最初は未知である規則性または関係を見つけるための大量の情報の選択、調査、およびモデリングの手順です。 データマイニングをアウトソーシングすることで、すべての作業をより迅速に、低い運用コストで実行できます。特

  2. Webマイニングのアプリケーションは何ですか?

    Webマイニングは、データマイニング技術を使用して、Webベースのレコードとサービス、サーバーログ、およびハイパーリンク。 Webマイニングは、データをグループ化して分析し、重要な洞察を受け取ることで、Web情報のデザインを発見することを目的としています。 Webマイニングは、適応されたデータマイニング手法をWebに適用するものと広く見なすことができますが、データマイニングは、知識発見プロセスに固定されたほとんどの構造化データのパターンを見つけるためのアルゴリズムのアプリケーションとして表されます。 ウェブマイニングには次のようなさまざまなアプリケーションがあります- Webマイニング