プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

一般化線形モデルとは何ですか?


一般化線形モデルは、線形回帰を使用してカテゴリ別応答変数のモデリングを行うことができる理論上の権限を定義します。一般化線形モデルでは、応答変数yの分散は、yの分散が一定である線形回帰とは異なり、yの平均値の関数です。

一般化線形モデル(GLM)は、従来の線形モデルを拡張したものです。このアルゴリズムは、対数尤度を最大化することにより、一般化線形モデルを情報に適合させます。エラスティックネットペナルティは、パラメーターの正則化に使用できます。モデルフィッティングの計算は並列で完全に高速であり、係数がゼロ以外の予測子が一定数あるモデルに対して完全に適切にスケーリングされます。

一般化線形モデルには、ロジスティック回帰とポアソン回帰の2種類があります。ロジスティック回帰は、さまざまなイベントが予測変数のグループの線形関数として現れる確率をモデル化します。計数データは頻繁にポアソン分布を表示し、通常はポアソン回帰を使用してモデル化されます。

対数線形モデルは、離散的な多次元確率分布を正確に示します。これらは、データキューブセルに関連する確率値を計算するために使用できます。たとえば、属性city、item、ye​​ar、salesのデータが与えられたとします。対数線形アプローチでは、すべての属性がカテゴリである必要があるため、連続値の属性(売上など)は離散化する必要があります。

このアプローチを使用して、特定の属性の4Dベース直方体の各セルの確率を計算できます。これは、都市とアイテム、都市と年、都市と売上、および3D直方体の2D直方体に依存します。アイテム、年、および売上について。この方法では、反復アプローチを使用して、下位のデータキューブから上位のデータキューブを作成できます。

この方法は、いくつかの次元を可能にするために適切にスケールアップします。予測とは別に、対数線形モデルは、データ圧縮(通常、低次の直方体がベースの直方体よりも占有する領域が少ないため)およびデータの平滑化(セルが低次の直方体で計算するため、サンプリングの変動への依存度が低いため)に役立ちます。セルは基本直方体で計算されます。

デシジョンツリーの帰納は、クラスラベルの代わりに、連続(順序付けされた)値を予測するのに適しています。予測回帰ツリーとモデルツリーには、2種類のツリーがあります。回帰ツリーは、CART学習システムの要素として提案されました。

すべての回帰ツリーリーフは、連続値の予測を保存します。これは、リーフを把握するトレーニングタプルの予測属性の平均値です。対照的に、モデルツリーでは、すべての葉が回帰モデルと予測属性の多変量線形方程式に影響を与えます。単純な線形モデルでデータが適切に定義されていない場合、回帰とモデルツリーは線形回帰よりも効率的になるように影響します。


  1. C#のインデクサーとは何ですか?

    インデクサーを使用すると、配列などのオブジェクトにインデックスを付けることができます。 構文を見てみましょう- element-type this[int index] {    // The get accessor.    get {       // return the value specified by index    }    // The set accessor.    set {       // set the

  2. C#の名前空間とは何ですか?

    名前空間は、ある名前のセットを別の名前のセットから分離する方法を提供するためのものです。名前空間の定義は、次のように、キーワードnamespaceで始まり、その後に名前空間名が続きます- namespace namespace_name {    // code declarations } 名前空間を定義する- namespace namespace_name {    // code declarations } 以下は、C#で名前空間を使用する方法を示す例です- 例 using System; namespace first_space {