プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データマイニングの社会的影響は何ですか?


データマイニングは、統計的および数学的手法を含むパターン認識技術を使用して、リポジトリに保存された大量のデータを転送することにより、有用な新しい相関関係、パターン、および傾向を見つけるプロセスです。事実に基づくデータセットを分析して、疑わしい関係を発見し、論理的でデータ所有者に役立つ新しい方法でレコードを要約します。

データマイニングシステムは、個人の識別と分類をさまざまなグループまたはセグメントに促進するように設計されています。商業企業の観点から、そしておそらく業界全体の観点から、データマイニングの使用を利益の合理的な検索における差別的な技術として解釈することができます。

データマイニングには、次のようなさまざまな社会的影響があります-

プライバシー −これはロードされた問題です。近年、商人、保険会社、および政府機関が個人記録を含む倉庫を蓄積するにつれて、プライバシーの懸念がアメリカ社会でより重要な役割を果たしています。

このデータのグループに対する人々の懸念は、通常、データに使用されるいくつかの分析機能にまで及びます。データマイニングのユーザーは、このテクノロジーの使用がプライバシーに関連する法的な問題によってどのように影響を受けるかについて考え始める必要があります。

プロファイリング −データマイニングとプロファイリングは、この情報化時代のデータの急増を整理、理解、分析、推論、および使用しようとする発展途上の分野です。このプロセスには、アルゴリズムと経験を使用して、認識が非常に複雑、困難、または時間がかかる設計や異常を抽出することが含まれます。

Microsoftの探査チームの創設者は、複雑なデータマイニングアルゴリズムを使用して、数年間天文学者を悩ませてきた問題を解決しました。 30年以上にわたって記録された20億個の空のオブジェクトを確認、説明、および分類する問題。アルゴリズムは、関連するデザインを抽出して、星や銀河などの空のオブジェクトを割り当てました。アルゴリズムは、空のオブジェクトを星や銀河として表す特徴を抽出することができました。データマイニングとプロファイリングのこの発展途上の分野には、それを使用できるいくつかのフロンティアがあります。

不正使用 −マーケティング目標またはその他の倫理的目標に使用するように設計されたデータマイニングを通じて得られたトレンドは、悪用される可能性があります。非倫理的な企業や人々は、データマイニングを通じて取得したデータを使用して、脆弱な人々に利益をもたらしたり、特定の人々のグループを差別したりする可能性があります。さらに、データマイニング手法は100%正確ではありません。したがって、重大な結果をもたらす可能性のある間違いが発生します。


  1. データマイニングの外れ値の種類は何ですか?

    データマイニングにはさまざまな種類の外れ値があります- グローバル外れ値 −特定のデータセットでは、データオブジェクトが他の情報セットから本質的に逸脱している場合、そのデータオブジェクトはグローバルな外れ値です。グローバル外れ値はポイント異常として知られており、最も簡単なタイプの外れ値です。ほとんどの外れ値の検出方法は、グローバルな外れ値を発見することを目的としています。 グローバルな外れ値を特定できます。重要な問題は、問題のアプリケーションに関する偏差の適切な測定値を見つけることです。いくつかの測定値が提案されており、これらに応じて、外れ値の検出アプローチは複数のカテゴリに分割されます。

  2. プライバシーを保護するデータマイニングの方法は何ですか?

    プライバシー保護データマイニングは、データマイニングにおけるプライバシーセキュリティに対応するデータマイニング研究のアプリケーションです。これは、プライバシーが強化された、またはプライバシーに配慮したデータマイニングと呼ばれます。基本的な機密データ値を開示せずに、真のデータマイニング結果を取得することを扱います。 ほとんどのプライバシー保護データマイニングアプローチでは、データにさまざまな形式の変換を使用してプライバシー保護を実装します。一般に、このような方法では、プライバシーを維持するために説明の粒度が低くなります。 たとえば、単一のユーザーからユーザーグループにデータを一般化できます。