プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

回帰とは何ですか?


回帰は、連続値の属性を予測するために使用できる教師あり機械学習アプローチのタイプを定義します。回帰は、ターゲット変数と予測変数の関連付けを調査するためのビジネス組織を提供します。これは、金銭的予測と時系列モデリングに使用できるデータを調査するために不可欠なツールです。

回帰などの関数にデータを適合させることにより、データを平滑化できます。線形回帰には、2つの属性(または変数)に適合する「最良の」線を見つけることが含まれるため、一方の属性を使用してもう一方の属性を予測できます。いくつかの線形回帰は線形回帰の進歩であり、2つ以上の属性が含まれ、データは多次元空間に適合します。

線形回帰では、データは直線に合うようにモデル化されます。たとえば、確率変数y(応答変数と呼ばれる)は、方程式y =wx + bを使用して、別の確率変数x(予測変数と呼ばれる)の線形関数としてモデル化できます。ここで、yの分散は考慮されます。一定である。

回帰の問題は、入力値に配置された出力値の計算で管理されます。分類に使用する場合、入力値はデータベースからの値であり、出力値はクラスを表します。回帰は、分類の問題を調査するために使用できますが、予測などの複数のアプリケーションに使用できます。回帰の基本構造は、1つの予測子と1つの予測のみを含む単純な線形回帰です。

回帰を使用して、次の2つの方法を使用して分類を実行できます-

  • 分割 −データはクラスにある領域に分割されます。

  • 予測 −出力クラスの値を予測するための式が作成されます。

これらのメソッドは、変数が整数である1つ以上の予測子(独立)変数から応答(従属)変数の値を予測するために使用されます。回帰には、線形、複数、加重、多項式、ノンパラメトリック、ロバストなど、複数の形式があります(ロバスト手法は、エラーが正常条件を必要としない場合、またはデータに有意な外れ値が含まれている場合に役立ちます)。

回帰は、個別の変数の式で定義されたいくつかの依存データセットを予測でき、トレンドは一定期間アクセス可能です。回帰は変数を予測するための優れた方法をサポートしますが、変数の独立性、変数の固有の正規分布など、特定の制限と仮定があります。

各回帰ツリーリーフには、連続値の予測が格納されます。これは、リーフをカバーするトレーニングセットの予測属性の平均コストです。対照的に、モデルツリーでは、各リーフは、予測された属性の回帰モデルと多変量連続方程式になりがちです。データが簡単な線形モデルで適切に表現されていない場合、回帰とモデルツリーは線形回帰よりも効果的です。


  1. データセンターとは何ですか?

    datacenterと綴られることもあるデータセンター (一言)は、多数のコンピュータサーバーと関連機器を含む施設に付けられた名前です。 データセンターは、壁を超えた「コンピュータールーム」と考えてください。会社のユーザー宛てのメール、財務記録、ウェブサイトのデータなど、あらゆる種類のデータを保存できます。 データセンターは何に使用されますか? 一部のオンラインサービスは非常に大きいため、1台または2台のサーバーから実行できません。代わりに、これらのサービスを機能させるために必要なすべてのデータを保存および処理するために、数千または数百万台の接続されたコンピューターが必要です。 たと

  2. シリアル化とは

    最近のプロジェクト更新会議で、私のチームは、シリアライゼーションを使用してこのアプリケーションとの間でデータをやり取りする方法について話しました。 ソフトウェア プロジェクトにもっと関わりたいと考えていたあるエンジニアは、この用語になじみがないと言っていました。 より大規模なプロジェクトに飛び込むまで発生しない、このような重要なプロセスを見落としがちです。ある時点で私がそうであったように、これはこの人に当てはまりました。 だからそれについて書きたかった。その日、私は同僚がシリアライゼーションについて学ぶのを手伝いました。あなたは今日それについて学ぶことになります. シリアライゼーシ