プログラミング
 Computer >> コンピューター >  >> プログラミング >> プログラミング

傾向分析とは何ですか?


傾向分析は、ノイズによってわずかにまたは完全に隠される可能性のある時系列の動作のモデルを抽出するための手法を定義します。傾向分析の方法は、一般に、病気の発生と予期しない増加または減少の検出、病気の傾向の監視、病気の制御プログラムとポリシーの有効性の評価、およびヘルスケアプログラムとポリシーの成功の評価などに使用されてきました。

アイテムシリーズの傾向を検出するために、さまざまな手法を使用できます。平滑化は、時系列で見られる非体系的な動作を削除するために使用されるアプローチです。平滑化は通常、特定の時点の前後の時間枠が与えられた場合に、属性値の移動平均を見つけるという形をとります。

この時点で見つかった特定の値の代わりに、すべての属性値のローカル平均が使用されます。外れ値の影響を受けにくいため、通常は平均値ではなく中央値が使用されます。平滑化により、ノイズと外れ値を除外できます。結果のデータは既知の関数(線形、対数、指数など)に適合しやすいため、将来の値を予測するために使用できます。

時系列データの季節パターンを検出することはより困難です。 1つの方法は、均等に分散された間隔で属性間の相関を見つけることです。たとえば、12番目ごとの値(月次売上データ)の間に相関関係が見つかる場合があります。関連するアイテム間の時間差はラグと呼ばれます。

自己相関関数を生成して、異なるラグ間隔でのデータ値間の相関を決定できます。コレログラムは、いくつかのラグ値の自己相関値をグラフィカルに表示します。

共分散は、2つの変数がどのように一緒に変化するかを測定します。これは、2つの時系列または1つの時系列の季節的傾向の間の関係を決定するための基礎として使用できます。自己相関係数rk 時系列値間の相関を特定の距離、ラグk、離れて測定します。

自己相関にはいくつかのアプローチが使用されています。正の値は両方の変数が一緒に増加することを示し、負の値は一方が増加すると他方が減少することを示します。

ゼロに近い値は、2つの変数間にほとんど相関関係がないことを示します。相関を計算するための典型的な式の1つは、相関係数rであり、ピアソンのrとしても知られています。

XとYの2つの時系列があり、それぞれがn個の要素を持つX'とY'を意味する場合、rの式は次のようになります。

$$ \ mathrm {\ frac {\ sum(x_i-X')(y_i-Y')} {\ sqrt {\ sum(x_i-X)^ 2(y_i-Y')^ 2}}} $$

これを適用して、時系列X =(x 1 )でラグk、rkの相関係数を見つけます。 、x 2 、…x n )は簡単です。最初の時系列はX'=(x 1 、x 2 、…x n-k )、2番目の時系列はX'' =(x k + 1 、x k + 1 、…x n


  1. 漸近解析

    漸近解析 漸近解析を使用すると、入力サイズに基づいてアルゴリズムのパフォーマンスについてのアイデアを得ることができます。正確な実行時間を計算する必要はありませんが、実行時間と入力サイズの関係を見つける必要があります。入力のサイズが大きくなるときは、実行時間を追跡する必要があります。 スペースの複雑さについては、アルゴリズムを完了するためにメインメモリ内のどのくらいのスペースが占有されているかという関係または関数を取得することが目標です。 漸近的振る舞い 関数の場合f(n) 漸近的な振る舞いは、nが大きくなるにつれてf(n)が大きくなることです。小さい入力値は考慮されません。私たちの仕事は

  2. 償却された複雑さ

    償却分析 この分析は、時折の操作が非常に遅い場合に使用されますが、非常に頻繁に実行される操作のほとんどは高速です。データ構造では、ハッシュテーブル、互いに素なセットなどの償却分析が必要です。 ハッシュテーブルでは、ほとんどの場合、検索時間の複雑さはO(1)ですが、O(n)操作を実行することもあります。ほとんどの場合、ハッシュテーブルで要素を検索または挿入する場合、タスクは一定時間かかりますが、衝突が発生すると、衝突を解決するためにO(n)回の操作が必要になります。 集計方法 総コストを見つけるために集計方法が使用されます。大量のデータを追加する場合は、この式で償却原価を見つける必要があり