プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

データマイニングで統計が必要なのはなぜですか?


統計は、データから学ぶ科学です。これには、一連のレコードの計画とその後のデータ管理から、データと呼ばれる数値的事実からの推論の引き出しや結果の提示など、最終的な活動まですべてが含まれています。統計は、必要とされる最も重要な人物、つまり地球について、そして革新と不確実性に直面して地球がどのように機能するかを発見する必要性に関係しています。

情報は知識の伝達です。データは、それ自体の知識ではなく、大まかなデータと呼ばれます。データから知識への順序は次のとおりです。データから情報へ(データが決定問題に関連するようになると、データは情報に発展します)。情報から事実へ(データがそれをサポートできる場合、情報は事実になります)、最後に、事実から知識へ(事実は、意思決定プロセスの競争の成功に使用される場合、知識になります)。

統計は、体系的な証拠に基づいて知識を配置する必要性から生じました。これには、確率の法則の研究、データのプロパティと関係の計算の開発などが必要でした。

統計は、すべてのデータマイニングアルゴリズムの重要な要素である数値レコードの分析と表示を定義します。大量のデータを処理するためのツールと分析方法をサポートします。統計には、調査結果の計画、設計、情報収集、分析、および報告が組み込まれています。これらの統計は数学に定義されているだけでなく、ビジネスアナリストも統計を使用してビジネスの問題を解決しているためです。

推論統計は、母集団のパラメータの値を推定するためのサンプルに使用されます。仮説検定を実行して、2つのデータセットが類似しているか異なるかを確認できます。因果関係を説明するために線形回帰分析または重回帰分析を実行するために使用されます。

仮説検定では、2つのデータセットを数値的に比較できます。たとえば、この販売量は主要な競合他社と同じか、それよりも優れていると感じる(仮説を立てる)ことができます。仮説検定を使用して、この仮定を数学的に確認または拒否できます。

相関分析は、関心のある変数をいくつかの確率変数から分離するためのシンプルなツールであり、多くの場合、巨大なデータセットで観察され、どのビジネス変数が望ましいビジネス成果に大きく影響するかを確認します。

シューハート管理図や管理図(どちらもグループの要約統計量を表示)など、いくつかの統計を使用して品質管理用の管理図を作成できます。これらの統計には、平均、標準偏差、範囲、カウント、移動平均、移動標準偏差、および移動範囲が含まれます。


  1. 時空間データマイニングとは何ですか?

    時空間データマイニングは、時空間データからパターンと知識を見つけるプロセスを定義します。時空間データマイニングの例には、都市や土地の開発履歴の検索、気象設計の発見、地震やハリケーンの予測、地球温暖化の傾向の決定が含まれます。 携帯電話、GPSデバイス、インターネットベースの地図サービス、気象サービス、デジタルアース、衛星、RFID、センサー、ワイヤレス、ビデオテクノロジーの認知度を考えると、時空間データマイニングは重要になり、広範囲にわたる影響があります。 時空間データにはいくつかの種類があり、移動物体データが重要です。たとえば、動物科学者は野生生物の遠隔測定装置を接続して生態学的行動を調

  2. なぜデータ暗号化が必要なのですか?

    データ暗号化は、情報を別の形式またはコードに変換する方法であり、データへのアクセスは、適切な復号化キー(またはパスワード)を持つユーザーのみに定義されます。暗号化されたデータは暗号文としても定義されます。これは、情報セキュリティの最も一般的で広範な形式の1つです。暗号化は、デジタル情報をWeb上を移動するときにスクランブリングするか、データが「保存中」またはコンピュータに保存されているときにスクランブリングすることにより、デジタル情報を保護するためのアプローチです。 これにより、許可されたユーザーのみがデータを復号化(スクランブル解除)して使用できるようになります。暗号化により、データの整合