プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

ROCとは何ですか?


ROCは、受信者動作特性曲線の略です。これは、分類器の真陽性率と偽陽性率の間のトレードオフを示すためのグラフィカルな方法です。 ROC曲線では、真陽性率(TPR)がg軸の前にプロットされ、偽陽性率(FPR)がr軸に表示されます。曲線の前方の各ポイントは、分類子によって説得されたモデルの1つと相関していました。

ROC曲線に沿って、よく知られた解釈を持ついくつかの重要なポイントがあります-

(TPR:O、FPR:0)-モデルは、すべてのインスタンスが負のクラスであると予測します。

(TPR:l、FPR:I)-モデルは、すべてのインスタンスがポジティブクラスであると予測します。

(TPR:l、FPR:O)-理想的なモデル。

最良の分類モデルは、左上に可能な限り近くに配置する必要がありますが、ランダムな推測を作成するモデルは、主対角線に沿って存在し、ポイント(TPR:0、FPR:0)と(TPR:I、FPR: 1)。ランダム推測では、属性セットに関係なく、レコードが固定確率pの正のクラスとして定義されることを定義します。

ROC曲線を描くことができます。分類器は、正のクラスとして定義される可能性が最も高いデータから最も可能性が低いデータまで、予測のランク付けに使用できる連続値の出力を作成できる必要があります。これらの出力は、ベイズ分類器によって生成された事後確率、または人工ニューラルネットワークによって開発された数値出力と相関させることができます。次のプロセスを使用して、ROC曲線を作成できます-

連続値の出力が正のクラスに対して表されていることを考慮しており、テストデータを出力値の昇順で並べ替えています。

ランクが最も低いテストデータ(つまり、出力値が最も低いデータ)を選択できます。選択したデータとそれに続いてランク付けされたデータをポジティブクラスに割り当てることができます。この方法は、すべてのテストデータをポジティブクラスとして定義することに似ています。すべてのポジティブインスタンスが正しく定義され、ネガティブインスタンスが誤って分類されているため、TPR:FPR:I。

ソートされたリストから次のテストデータを選択できます。選択されたデータとそれに続いてランク付けされたデータを正として定義し、その下にランク付けされたデータを負として定義します。以前に選択したデータの実際のクラスラベルを判別することにより、TPおよびFPのカウントを更新できます。

以前に選択したデータが正のクラスである場合、TPカウントは減少し、FPカウントは以前と同じままです。以前に選択したデータが負のクラスの場合、FPカウントは減少し、TPカウントは以前と同じままです。

手順3を繰り返し、ランク付けされた最大のテストデータが選択されるまで、それに応じてTPカウントとFPカウントを更新します。

分類器のFPRと反対のTPRを選択できます。


  1. ROC曲線とは何ですか?

    ROCはReceiverOperatingCharacteristicの略です。 ROC曲線は、2つの分類モデルを分析するための便利な視覚的ツールです。 ROC曲線は、第二次世界大戦中にレーダー画像を検索するために作成された信号検出理論から得られたものです。 ROC曲線は、特定のモデルの真陽性率または感度(認識された正のタプルの割合)と偽陽性率(誤って陽性として認識された負のタプルの割合)の間のトレードオフを示します。 2つのクラスの問題がある場合、モデルが「はい」のケースを正確に識別できる速度と、複数の「部分」で「いいえ」のケースを「はい」と誤って認識する速度との間のトレードオフを予測で

  2. ステガノグラフィの用途は何ですか?

    ステガノグラフィは、データを隠す技術であり、埋め込まれたデータの存在を隠すための取り組みです。これは、メッセージの存在ではなくメッセージの内容のみを非表示にする暗号化よりも優れたメッセージ保護方法として機能します。 元のメッセージはキャリア内で表示されていないため、キャリアに表示された変更は明らかではありません。ステガノグラフィにはさまざまな用途があります- ステガノグラフィは、検閲されることなく、またメッセージが妨げられて私たちにさかのぼることを恐れることなく、ニュースやデータを送信するために適用できるソリューションになる可能性があります。 ステガノグラフィを使用して場所にデー