プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

RIPPERアルゴリズムとは何ですか?


これは、RIPPERと呼ばれる広く使用されているルール誘導アルゴリズムです。このアルゴリズムは、いくつかのトレーニングインスタンスにほぼ線形にスケーリングし、過負荷のクラス分布を持つデータセットからモデルを構築するのに特に適しています。 RIPPERは、検証セットを使用してモデルの過剰適合を防ぐため、ノイズの多いデータセットでもうまく機能します。

RIPPERは、デフォルトクラスとしてマジョリティクラスを選択し、マイノリティクラスを識別するためのルールを理解しています。マルチクラス問題の場合、クラスは頻度に応じて系列になります。

(y 1 y 2 ... y c )順序付けられたクラスであり、y 1 最も頻度の低いクラスであり、y c 最も頻繁なクラスです。最初の反復中に、y 1に属するインスタンス は肯定的な例としてIabeledであり、他のクラスに属するものは否定的な例としてラベル付けされています。

シーケンシャルカバーリングアプローチを使用して、ポジティブな例とネガティブな例を区別するルールを作成できます。次に、RIPPERはy 2を区別するルールを抽出します 他の残りのクラスから。このプロセスは、y cが残るまで繰り返されます。 これはデフォルトのクラスとして指定されています。

RIPPERは、一般から特定の方法を使用してルールを増やし、FOILのデータゲイン測定を使用して、ルールの先行詞に挿入するのに最適な結合を選択します。ルールがネガティブインスタンスをカバーし始めると、結合の挿入を停止します。

新しいルールは、検証セットでの実装に応じてプルーニングされます。次のメトリックは、プルーニングが必要かどうかを判断するために計算されます-(p-n)/(p + n)、ここでp(n)は、ルールの対象となる検証セット内の正(負)の例の数です。

このメトリックは、検証セットでのルールの精度に単調に関連しています。したがって、剪定後にメトリックが拡張されると、結合が削除されます。剪定は、ルールに挿入された最後の結合から開始して完了します。たとえば、ルールABCD→yが与えられた場合、RIPPERはDを最初にプルーニングし、次にCD、BCDなどをプルーニングするかどうかをチェックします。最初のルールはポジティブインスタンスのみをカバーしますが、プルーニングされたルールはトレーニングセット内のいくつかのネガティブインスタンスをカバーできます。

ルールを作成した後、ルールの対象となるいくつかのポジティブインスタンスとネガティブインスタンスが削除されます。次に、ルールは、最小記述長の原則に基づく停止条件に違反しない限り、ルールセットに追加されます。

新しいルールがルールセットの合計表現長を最小dビット改善すると、RIPPERはルールセットへのルールの挿入を停止します(デフォルトでは、dは64ビットに選択されています)。 RIPPERが使用するもう1つの停止条件は、検証セットのルールのエラー率が50%を超えてはならないことです。 RIPPERは、より多くの最適化手順を実装して、ルールセット内のいくつかの既存のルールをより多くの代替ルールで復元できるかどうかを判断します。


  1. Blowfishアルゴリズムの操作は何ですか?

    Blowfishは対称ブロック暗号アルゴリズムであり、一度に64ビットのブロック情報を暗号化します。これはFeistelネットワークに従い、このアルゴリズムの作業手順は2つの部分に分かれています。 サブキーの生成 −このプロセスは、最大448ビット長のキーを4168ビットを追加するサブキーに変換します。 データ暗号化 −データ暗号化プロセスでは、16回のネットワークを繰り返します。各ラウンドには、キーに依存する順列、およびキーとデータに依存する置換が含まれます。アルゴリズムの演算は、32ビットワードのXORまたは加算です。追加の操作は、ラウンドごとに4つのインデックス付き配列情報ル

  2. Blowfish暗号化アルゴリズムとは何ですか?

    Blowfish暗号化アルゴリズムは、低速で不確実なDESアルゴリズムで実現するように設計された対称ブロック暗号です。 Blowfishは、1993年にブルースシュナイアーによって発明され、パブリックドメインにあるキー付きの対称暗号ブロック暗号です。 対称暗号化では、個々の暗号化キーを使用して、情報の暗号化と復号化の両方を行います。機密情報と対称暗号化キーは、機密情報を暗号文に変換するために暗号化アルゴリズム内で使用されます。 Blowfishは、SplashIDなどの膨大な数の暗号スイートと暗号化製品に含まれています。 ブロック暗号は通常、ある程度のプレーンテキストを受け取り、それをコー