Habrahabrに関する記事へのコメントには、これらのパッケージが最終的な数字をどのように取得するかについての質問があります。 一般的に、複雑なことはありません-それは単なる統計です。 読者がこれらの数字を取得する魔法に興味がある場合は、カットをお願いします。多くのブナや数式があります。
できれば、準備ができていないユーザーのためにプレゼンテーションをできる限り明確にしたいので、不正確な部分や省略された定義はご容赦ください。
一般的なスキーム
統計的シーケンス分析は、原則として2段階で行われます。
- 最初の段階は準備段階と呼ばれますが、これは最も時間がかかり、計算の大部分がここで実行されます。
1.1。 調査したジェネレータを使用して、ランダムシーケンスが形成されます。
1.2。 各シーケンスについて、テスト統計が計算されます。 一連のテストが機能する場合(複数のテストが一度に実行される場合)、各テストについてシーケンスの統計が計算されます。
1.3。 各シーケンスについて、有意確率が計算されます。
1.4。 受信した統計と有意確率は保存されます。 - 第2段階では、結果の処理が実行されます。
2.1。 受け入れ基準を使用して、統計の分布と仮説の分布に対する有意性の確率の対応に関する仮説がテストされます。
2.2。 テストに合格したシーケンスの数が決定されます。 最後の値の信頼区間が構築されます。
2.3。 テストに合格したかどうかが決定されます。
2.4。 最終的な結論。
概略的に、このプロセスは次のように表すことができます。

統計生成
各テストの目的は、テストシーケンスの分布が均一であるという仮説をテストすることです。 より厳密に言えば、各記号
そして、テスト統計の公式はどこから来たのですか? NISTパッケージの周波数テストの例を見てみましょう。
各統計的検定は、仮説を満足するランダムシーケンスが持つべき特定のプロパティに関する何らかの仮定をチェックします。
NISTテストスイートの周波数テストの場合、この仮定は次のステートメントです。「シーケンスが仮説を満たしている場合
調査中のシーケンスの文字の合計が見つかった場合、最終結果はランダム変数になります。これを呼び出しましょう
数学的期待値からのユニット数(ゼロ)の偏差に関心があるため、ランダム変数を検討します。
研究中のシーケンスに応じて、ランダム変数が取得されました。 仮説の下でのこの確率変数の分布関数
どこで
特定のシーケンスXから計算された値Sは、「統計」と呼ばれます。 NISTテストの説明を見ると、テスト統計を計算するためのこの公式を正確に見つけることができます。
同様の考慮事項を使用して、他のテストの式が表示されます。
「良い」シーケンスと「悪い」シーケンスを区別する方法は?
統計Sがゼロから大幅に逸脱しているかどうかを判断する必要があります。
偏差は「大きすぎる」べきではありません。 「あまりにも」という言葉は、行動のための具体的な指示を提供するものではありません。 したがって、いくつかの重要なレベルを選択します

言い換えれば
統計調査パッケージでは、多くの場合、同等の別の意思決定方法が使用されます。 統計Sに従って、確率確率pが計算されます。
通常
さらなる調査結果
すぐに問題が発生します:「シーケンスの一部が不良で一部が良好である場合に(疑似)乱数のジェネレーターを拒否する方法は?」
実際、ランダムシーケンスジェネレーターは常に、テストに失敗したシーケンスの一部を生成します。 すべてのシーケンスがテストに合格した場合、これは非常に疑わしいとさえ言えます。
したがって、結果を処理します。
最初の段階で、長さnのVシーケンスが生成されます-
第2段階では、取得したサンプルの処理が実行されます。
まず、同意基準がこれらのシーケンスに適用されます。 サンプリング
一般に、これらの基準の適用は、上記の統計的検定に似ています。 違いは、適用された統計のみです。
ピアソン基準の適用
のために
Pの可能な値の範囲(セグメント[0,1])は、T個の同一のセグメントに分割されます。 Tの値は、通常、10や20など、それほど大きくないものを選択します。Pが均一な分布を持っていると仮定すると、平均でV / T値は各間隔に分類されます(ちなみに、TはV / T> 5になるように選択する必要があります)。
サンプルPからヒストグラムが作成されます
統計用
テストに合格するシーケンスはいくつですか?
次に、テストに合格したシーケンスの数が調べられます。
有意確率は区間[0,1]に均等に分布しているため、平均検定は合格するはずです
テストに合格したシーケンスの一部の信頼区間を指定します。
シーケンス
中心極限定理によると、ベルヌーイテストシーケンスの成功数の分布は、テストに合格したシーケンスの数と一致し、数学的な期待値で正常と見なすことができます。

信頼のレベルを選択した場合
図では、信頼区間は緑の領域の下のx値です。
初期シーケンスが均一な分布を持っているという仮定の下で、確率でテストに合格したシーケンスの割合
「ルール」を使用する場合
シーケンスの計算された割合が信頼区間内にある場合、テストは合格とみなされます。
テストバッテリーはどのように機能しますか?
上記は、1つのテストのテストの説明です。 バッテリーに複数のテストが含まれている場合、説明されている調査は各テストに対して実行されます。
出力には、テストに合格したタブレットと合格したテストの割合が表示されます。
文学
- NIST(暗号化アプリケーションのランダムおよび擬似乱数ジェネレーターの統計テストスイート)、 http://csrc.nist.gov
- Ivchenko G.I.、Medvedev Yu.I. 数学統計:教科書。 高専のための手当。 -M。:より高い。 1984年。
- Knut D.プログラミングの技術:3t。 -M。:ミール、1992
- Van der Varden B.L.、数学統計。 -M。:外国文学の出版社、1960