なぜナイーブベイジアンはナイーブと呼ばれる分類ですか?
ベイジアン分類器は統計的分類器です。特定のサンプルが特定のクラスに属する確率など、クラスメンバーシップの確率を予測できます。ベイジアン分類器は、大規模なデータベースに適用した場合にも高い精度と速度を示しました。
クラスが定義されると、システムは分類を管理するルールを推測する必要があります。したがって、システムは各クラスの説明を見つけることができるはずです。説明は、トレーニングセットの予測属性のみを参照する必要があります。これにより、否定的な例ではなく、肯定的な例のみが説明を満たす必要があります。ルールの説明がすべての肯定的な例をカバーし、クラスの否定的な例のいずれもカバーされていない場合、ルールは正しいと言われます。
すべての属性による寄与は独立しており、それぞれが分類問題に等しく寄与していると想定しています。これは、ナイーブベイズ分類と呼ばれる単純な分類スキームです。各「独立した」属性の寄与を分析することにより、条件付き確率が決定されます。分類は、さまざまな属性が行われる予測に与える影響を組み合わせて行われます。
ナイーブベイズ分類は、クラスの条件付き独立を前提としているため、ナイーブと呼ばれます。特定のクラスに対する属性値の影響は、他の属性の値とは無関係です。この仮定は、計算コストを削減するために行われるため、ナイーブと見なされます。
ベイズの定理 −Xをデータタプルとします。ベイズの用語では、Xは「証拠」と見なされます。データタプルXが指定されたクラスCに属するなど、Hをいくつかの仮説とします。確率P(H | X)は、データを分類するために決定されます。この確率P(H | X)は、「証拠」または観測されたデータタプルXが与えられた場合に仮説Hが成り立つ確率です。
P(H | X)は、Xを条件とするHの事後確率です。たとえば、データタプルの世界が、それぞれ属性年齢と収入で記述される顧客に限定され、XがRsを持つ30歳の顧客であるとします。 20,000の収入。 Hが、顧客がコンピューターを購入するという仮説であると仮定します。次に、P(H | X)は、顧客の年齢と収入がわかっている場合に、顧客Xがコンピューターを購入する確率を反映します。
P(H)は、Hの事前確率です。たとえば、これは、年齢、収入、またはその他の情報に関係なく、特定の顧客がコンピューターを購入する確率です。事後確率P(H | X)は、Xに依存しない事前確率P(H)よりも多くの情報に基づいています。
同様に、P(X | H)は、Hを条件とするXの事後確率です。これは、顧客Xが30歳で、Rsを獲得する確率です。 20,000。
P(H)、P(X | H)、およびP(X)は、与えられたデータから推定できます。ベイズの定理は、P(H)、P(X | H)、およびP(X)から事後確率P(H | X)を計算する方法を提供します。それは
によって与えられます$$ P(H | X)=\ frac {P(X | H)P(H)} {P(X)} $$
-
Windows 10が無料なのはなぜですか?
2015年1月下旬、Microsoftのシステムチーフは、Windows7とWindows8.1を使用しているユーザー向けの無料アップグレードとしてWindows10が提供されると発表しました。これは多くの人、特にマイクロソフトが新しいバージョンをリリースするたびに新しいバージョンのWindowsにお金を払わなければならないことに慣れている人にとっては驚きでした。この変更とは何ですか?そして、マイクロソフトは本当に無料でアップグレードできる人の中に海賊も含まれていますか?これは少し寛大に聞こえるので、私は主題を調査し、それについて人間的に可能なすべてを見つけることにしました! アップグレードを
-
Windows 10 がダメな理由
Windows 10 オペレーティング システムは世界的に有名であり、定期的な更新により独自性と信頼性を高めています。すべてのアプリとウィジェットは完璧ではありませんが、それでもかなり便利です。ただし、その設定と機能は改善される可能性があります。 Microsoft は、世界中で約 13 億人の Windows 10 ユーザーのユーザー ベースを楽しんでいます。多くの人が Windows 10 は最悪だと考えています。それは、ポップアップするさまざまな問題のためです。たとえば、ファイル エクスプローラーの破損、VMWare との互換性の問題、データの削除などの問題に直面する可能性があります。ま