プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

バギングとブースティングの違いは何ですか?


バギング

バギングは、ブートストラップ集約とも呼ばれます。これは、ノイズの多いデータセット内の分散を減らすために一般的に使用されるアンサンブル学習方法です。バギングでは、トレーニングセット内のデータのランダムなサンプルが置換されて選択されます。つまり、単一のデータポイントを複数回選択できます。

いくつかのデータサンプルが生成された後、これらの弱いモデルは個別にトレーニングされ、タスクの回帰または分類の要素に依存します。たとえば、これらの予測の平均により、より効率的な見積もりが得られます。

ランダムフォレストは、バギングの延長です。レコードのランダムなサブセットを予測するには、もう1つのステップが必要です。また、すべての機能を使用してツリーを開発する代わりに、機能のランダムな選択を作成します。複数のランダムツリーを持つことができる場合、それはランダムフォレストとして知られています。

バギングは、金融市場のディープラーニングモデルでも活用されており、不正検出、信用リスクの計算、オプション価格の問題などの重要な機能を自動化しています。

この調査は、いくつかの機械学習手法間のバギングがローンのデフォルトリスクを生み出すためにどのように活用されているかを示しています。この調査では、銀行や金融機関でのクレジットカード詐欺を回避することで、バギングがリスクの最小化をどのようにサポートしているかを理解しています。

ブースト

ブースティングは、一連の予測子を作成するためのもう1つのアンサンブルプロセスです。別の言い方をすれば、連続するツリー、通常はランダムなサンプルに適合でき、すべてのフェーズで、前のツリーからの正味誤差を解決することが目的です。

ブースティングは、一般に、教師あり学習手法の偏りと分散を減らすために使用されます。これは、弱い学習者(基本学習者)を強い学習者に変更するアルゴリズムのファミリーを定義します。弱い学習者は実際の分類とわずかにしか正しくない分類器であり、強い学習者は実際の分類とよく相関している分類器です。

バギングとブースティングの比較を見てみましょう。

バギング ブースト
バイアスではなく、分散を減らすことを目的としています。 分散ではなくバイアスを減らすことを目的としています。
各モデルは独立して構築されています。 新しいモデルは、以前に開発されたモデルの実装の影響を受けます。
これは、同様のタイプに属する予測を接続する最も簡単な方法です。 これは、複数のタイプに属する予測を接続する方法です。
バギングは過剰適合の問題に対処しようとします。 ブーストはバイアスを減らしようとします。
いくつかのトレーニングデータサブセットは、トレーニングデータセット全体から置き換えられてランダムに抽出されます。 新しいサブセットにはそれぞれ、以前のモデルによって誤って分類されたコンポーネントが含まれています。
バギングは過剰適合の問題を解決できます。 ブーストは過剰適合の問題を後押しする可能性があります。

  1. DirectX11とDirectX12の違いは何ですか?

    DirectXは、マルチメディアコンテンツをレンダリングし、グラフィカルハードウェアと通信するためにソフトウェアによって使用されるAPIまたはアプリケーションプログラミングインターフェイスのコレクションです。 DirectXの主要コンポーネントAPIであるDirect3Dは、ソフトウェアとグラフィックスハードウェア間の通信を処理します。すべてのハードウェアが異なるため、関数と呼び出しの標準化されたライブラリを使用してグラフィックカードと通信すると、ゲーム開発がスピードアップします。これはハードウェアアブストラクションと呼ばれ、APIの主な仕事です。 車について考えてみましょう。1台の車を運転

  2. |の違いは何ですかおよび||またはC#の演算子?

    |オペレーター |演算子は、そのオペランドの論理ORを計算します。 xの結果| xまたはyのいずれかがtrueと評価された場合、yはtrueです。それ以外の場合、結果はfalseになります。 |演算子は、左側のオペランドがtrueと評価された場合でも両方のオペランドを評価するため、右側のオペランドの値に関係なく、演算結果はtrueになります。 ||オペレーター 条件付き論理OR演算子||は、「短絡」論理OR演算子とも呼ばれ、そのオペランドの論理ORを計算します。 xの結果|| xまたはyのいずれかがtrueと評価された場合、yはtrueです。それ以外の場合、結果はfalseです。 x