プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

分類と予測とは何ですか?


分類

分類は、データインスタンスのチームメンバーシップを予測するために使用されるデータマイニング方法です。分類には、所得階層を含むターゲットカテゴリ変数があります。たとえば、高所得、中所得、低所得などの3つのクラスまたはカテゴリに分類できます。

データマイニングモデルは、膨大なレコードのセットを分析します。各レコードには、ターゲット変数と入力変数または予測変数のセットに関するデータが含まれます。たとえば、表にあるデータセットからの抜粋を考えてみましょう。

収入を分類するためのデータセットからの抜粋

Subject 年齢 性別 職業 インカムブラケット
001 47 女性 ソフトウェアエンジニア
002 28 男性 コンサルタント
003 35 男性 失業者

研究者は、年齢、性別、職業など、その人に関連する他の特性に応じて、データベースに存在しない人の所得階層を分類するのに十分であると考えます。このタスクは分類タスクです。これは、データマイニングの方法と手法に非常に適しています。

アルゴリズムはおおよそ次のように進行します。まず、予測変数と(以前に分類された)ターゲット変数である収入ブラケットの両方を含むデータセットを検討します。

この方法では、アルゴリズムは変数のどの組み合わせがどの所得階層に関連しているかを理解します。たとえば、年配の女性は高所得層に関係している可能性があります。このデータセットはトレーニングセットと呼ばれます。

ビジネスおよび研究における分類タスクの例には、-

が含まれます。
  • 特定のクレジットカード取引が不正であるかどうかを判断している可能性があります。

  • 特定の要件に関する特定のトラックに新しい候補者を見つけることができます。

  • 住宅ローンのソフトウェアが信用リスクの良し悪しであるかどうかを確認するために使用できます。

  • 特定の病気が表示されているかどうかを調査している可能性があります。

  • 特定の経済的または個人的な行動がテロの脅威の可能性を示しているかどうかを判断している可能性があります。

予測

予測は分類と同じですが、予測の場合、結果が将来誤って表示される点が異なります。

ビジネスおよび研究における予測タスクの例には、-

が含まれます。
  • 3か月後の株式の価値を予測している可能性があります。

  • 制限速度が引き上げられた場合、来年の交通事故死者数の増加率を予測することができます。

  • チームの統計の類似性によっては、この秋の野球ワールドシリーズの勝者を予測している可能性があります。

  • 創薬における特定の分子が製薬組織にとって有益な新薬を開始するかどうかを予測することができます。


  1. C ++の変数と変数の種類は何ですか?

    変数は、プログラムが操作できる名前付きストレージを提供します。 C ++の各変数には特定のタイプがあり、変数のメモリのサイズとレイアウトを決定します。そのメモリ内に格納できる値の範囲。変数に適用できる一連の操作。変数の非常に単純な例は-です。 int my_val = 5; ここでは、int(integer)型の変数my_valがあり、値は5です。より一般的には、変数は-として定義されます。 type variable_name; または、それらも初期化したい場合- type variable_name = value; 変数の名前は、文字、数字、および下線文字で構成できます。文字またはア

  2. C#の文字列および文字列データ型とは何ですか?

    StringはSystem.Stringを表しますが、stringはSystem.StringのC#のエイリアスです- 例- string str = "Welcome!"; 必須ではありませんが、通常、クラスを操作するときに文字列が使用されます- string str = String.Format("Welcome! {0}!", user); stringはSystem.Stringのエイリアスであるため。他のデータ型のエイリアスは-です 例 object: System.Object string: System.String bool: