🚷 👩‍👧‍👧 🚵🏽 素数の構造とランダム性 🤘🏾 🏖️ 🔷

素数は風によって散らばる種のように数軸に沿って散らばっていますか？もちろんそうではありません。単純さは偶然の問題ではなく、初等算術の結果です。数が素数であるのは、ユニティ以外の正の整数がそれを完全に分割しない場合のみです。

しかし、話はこれで終わりではありません。素数の分布は不規則に見え、不均等なギャップとクラスターが混chaとしています。スキームが存在する場合、それは理解不能です。実際、素数はサイコロをプレイできるほどランダムに見えます。連続する素数のリストを作成し（たとえば、11、13、17、19、...で始まる）、7を法として除算します。つまり、各素数を7で除算し、残りのみを保存します。結果は、セット{1、2、3、4、5、6}からの整数のシーケンスになります。これは、通常のボーンのいくつかのスローの結果のように見えます。

b e g i n a l i g n * 11 b m o d 7 ＆ r i g h t a r r o w 4 q q u a d 47 b m o d 7 r i g h t a r r o w 5 13 b m o d 7 ＆ r i g h t a r r o w 6 q q u a d 53 b m o d 7 r i g h t a r r o w 4 17 b m o d 7 ＆ r i g h t a r r o w 3 q q u a d 59 b m o d 7 r i g h t a r r o w 3 19 b m o d 7 ＆ r i g h t a r r o w 5 q q u a d 61 b m o d 7 r i g h t a r r o w 5 23 b m o d 7 ＆ r i g h t a r r o w 2 q q u a d 67 b m o d 7 r i g h t a r r o w 4 29 b m o d 7 ＆ r i g h t a r r o w 1 q q u a d 71 b m o d 7 r i g h t a r r o w 1 31 b m o d 7 ＆ r i g h t a r r o w 3 q q u a d 73 b m o d 7 r i g h t a r r o w 3 37 b m o d 7 ＆ r i g h t a r r o w 2 q q u a d 79 b m o d 7 r i g h t a r r o w 2 41 b m o d 7 ＆ r i g h t a r r o w 6 q q u a d 83 b m o d 7 r i g h t a r r o w 6 43 b m o d 7 ＆ r i g h t a r r o w 1 q q u a d 89 b m o d 7 r i g h t a r r o w 5 e n d 整 列 *

$\ begin {align *} 11 \ bmod 7＆\ rightarrow 4 \ qquad 47 \ bmod 7 \ rightarrow 5 \\ 13 \ bmod 7＆\ rightarrow 6 \ qquad 53 \ bmod 7 \ rightarrow 4 \\ 17 \ bmod 7＆ \ rightarrow 3 \ qquad 59 \ bmod 7 \ rightarrow 3 \\ 19 \ bmod 7＆\ rightarrow 5 \ qquad 61 \ bmod 7 \ rightarrow 5 \\ 23 \ bmod 7＆\ rightarrow 2 \ qquad 67 \ bmod 7 \ rightarrow 4 \\ 29 \ bmod 7＆\ rightarrow 1 \ qquad 71 \ bmod 7 \ rightarrow 1 \\ 31 \ bmod 7＆\ rightarrow 3 \ qquad 73 \ bmod 7 \ rightarrow 3 \\ 37 \ bmod 7＆\ rightarrow 2 \ qquad 79 \ bmod 7 \ rightarrow 2 \\ 41 \ bmod 7＆\ rightarrow 6 \ qquad 83 \ bmod 7 \ rightarrow 6 \\ 43 \ bmod 7＆\ rightarrow 1 \ qquad 89 \ bmod 7 \ rightarrow 5 \\ \ end {整列*}$

より大きなサンプルで作業した（最初の100万個以上の素数

10^{7}

$10 ^ 7$ ）、7を法とする6つの可能な剰余（7を法とする6つの可能な合同クラスとしても知られています）のそれぞれの素数をカウントしました。また、100万のヘクスロールをシミュレートしました。これらの2つの結果を見て、どちらが何であると言えますか？

                1 2 3 4 5 6
          166787166569569714714166573166 665166692
              120-98 47-94-2 25

                1 2 3 4 5 6
          166768166290290166412166638638167282166610
              101 -377 -255 -29 615 -57

各テーブルの最初の行は、結果の数を示しています。

x

$x$ 6つのクラスのそれぞれ。 2行目は違いを示しています

x - b a r x

$x-\ bar {x}$ どこで

b a r x

$\ bar {x}$ -平均値

$inline$ 。どちらの場合も、明らかな偏りはなく、数字はかなり均等に分布しているようです。最初の表は、7を法とする除算の素数の残りを示しています。それらの分布は、シミュレートされた骨に比べてわずかに平坦であり、平均からの偏差が小さくなっています。 2つのサンプルの標準偏差はそれぞれ84と346ですこれらの表から判断すると、通常のサイコロゲームで必要なランダム性を提供するために、どのプロセスも使用できるようです。

しかし、ランダム性の条件は、許容可能な間隔での結果の均一な分布だけではありません。さらに、シーケンス内の個々のイベントは互いに独立している必要があります。骨の1つのロールは、次のロールの結果に影響を与えません。独立性を検証するために、連続するイベントを見ることができます。 1つのユニットは何回、または2回、3回など続きますか？マトリックスに書く

6 \times 6

$6×6$ 36の可能なすべてのペアの数。プロセスが本当にランダムな場合、わずかな統計的変動を考慮に入れない場合、36ペアすべてが同じ周波数を持つ必要があります。マトリックスを「ヒートマップ」色に変えることができます。このマップでは、平均を超える量のセルはピンクと赤の暖かい色合いで表示され、平均以下のセルは冷たい色合いの青で塗りつぶされます。（入力された金額は有効な数量ではありません。

x

$x$ 、正規化された変数

w = （ x_{i 、 \、 j} - b a r x 、 / \、 b a r x

$w =（x_ {i、\、j}-\ bar {x}、/ \、\ bar {x}$ どこで

b a r x

$\ bar {x}$ この場合も平均値です

$inline$ 。）これは、シミュレートされた通常の骨のヒートマップです。

図1

ここには興味深いものは何もありません。ほとんどすべての量が平均に非常に近いため、マトリックスセルはニュートラルグレーであるように見えますが、淡いピンクまたは青であることがわかったのはごくわずかです。これは、連続するボーンロールが相互に相関しておらず、すべての可能なペアが等しく発生する可能性がある場合に期待する結果です。

7を法とする連続した素数の対応する行列に移りましょう：

図2

わあ！ランダムランドから離れたようです。ここでは、古い灰色の映画館がテクニカラーに変わりました。メインの対角線（左上から右下）に沿ってヒートマップ上に青いバーが表示されました。これは、7で除算して同じ剰余を持つ連続する素数のペアが発生する可能性が非常に低いことを意味します。言い換えれば、カップル

（ 1 、 1 ） 、 （ 2 、 2 ） 、 l d o t s （ 6 、 6 ）

$（1、1）、（2、2）、\ ldots（6、6）$ 本当にランダムなシーケンスで発生するよりも頻繁に発生しません。対角線上（主対角線の真上）の色は明るい青色です。それはカップルを意味します

（ i 、 j ）

$（i、j）$ どこで

j = i + 1

$j = i + 1$ 平均頻度よりも少し少ない頻度で発生します。例えば

（ 2 、 3 ）

$（2、3）$ そして

（ 5 、 6 ）

$（5、6）$ わずかに負の正規化された周波数値を持ちます。一方、（メインの対角線の下の）サブ対角線は完全にピンクと赤です。のようなカップル

（ 3 、 2 ）

$（3、2）$ または

（ 5 、 4 ）

$（5、4）$ どこで

j = i - 1

$j = i-1$ 平均以上の頻度で発生します。対角線から離れると、右上隅と左下隅にパステルのチェスパターンが表示されます。

色付きの正方形ではなく、数値を扱う場合、値のマトリックスは次のとおりです。

           連続する素数のペアmod 7
                    1 2 3 4 5 6
           1 15656 24376 33891 29964 33984 28916
           2 37360 15506 22004 32645 25095 33959
           3 25307 41107 14823 22747 32721 30009
           4 32936 26183 37129 14681 21852 33791
           5 24984 34207 26231 41154 15560 24529
           6 30543 25190 32636 25382 37453 15488

均一性からの逸脱は何でも呼ぶことができますが、「取るに足らない」ものではありません。たとえば、3行目では、7の素数のシーケンスで3と出会った場合、次の数は2であり、他の3ではない可能性が高いことは明らかです。素数からサイコロでゲームをプレイする場合、そのようなシフトは結果に大きな影響を与えます。素数の骨は「充電された」骨です！

ペアでのこれらの非常に強い相関関係は、スタンフォード大学のロバート・J・レムケ・オリバーとカンナン・スンダララジャンによって発見されました。彼らは、今年3月にarXivで公開されたプレプリントでそれらについて議論しました。私にとって、この発見について最も驚くべきことは、長年にわたって誰もこれらの構造に気付いていなかったことです。どこを見るか知っていれば、それらはかなり明白です。

ユークリッドを見つけられなかったと非難することはできないと思います。古代では、チャンスと確率のアイデアは開発されていませんでした。しかし、ガウスはどうですか？彼は素数表の鑑識家であり、数千の素数のリストを作成しました。若い頃、彼は次のように書いています。「私の最初のプロジェクトの1つは、数千の素数を計算する素数の減少頻度を観察することでした...」さらに、ガウスは合同クラスとモジュラー算術のアイデアを実際に発明しました。しかし、明らかに、彼は、連続した素数のペアの一致に奇妙な何かがあるのではないかと疑っていません。

1850年代、ロシアの数学者Pafnutii Lvovich Chebyshevは、素数のわずかな歪みを指摘しました。 4を法とする奇数の素数の除算は、それらを2つのサブセットに分割します。系列5、13、17、29、37、...のすべての素数は、4を法とする合同1です。シリーズ3、7、11、19、23、31、...では、4を法とする合同3です。チェビシェフは、2番目のカテゴリの素数がより多く見えることに気付きました。たとえば、最初の10,000個の奇数素数には、4,943個の合同1と5,057個の合同3があります。ただし、この効果は、連続する素数のペアに見られる不規則性と比較して小さいです。

最近、数人の著者が連続した素数の現象のヒントを見てきました。 Lemke-OliverとSoundararajanは、そのような3つの証言に言及しています。（記事の最後にある参考文献のリストを参照してください。）1950年代および60年代に、スタニスラフ・ナポウスキーとパル・トゥランは、 mを法とする素数の除算の剰余のさまざまな側面を調査しました。 1977年に死後に出版された論文で、彼らは残基1または3で4を法とする連続素数の除算を調べました。彼らは、同じ剰余を持つ連続するペアと異なる残基を持つペアは「等しくない」と示唆しました。 2002年に、Chun-Ming Koは一連の連続した素数（それらのペアだけでなく）を研究し、変化する周波数に基づいて精巧なフラクタルパターンを作成しました。その後、2011年に、Avner Ashと同僚は、対角線の減少がはっきりと目立ついくつかのマトリックスを含む、「残留素数の連続するペアの周波数」の詳細な分析を公開しました。

これらの先例から、レムケ=オリバーとスンダララジャンは本当に連続した素数の発見者でしたか？私の意見では、答えはイエスでなければなりません。他の人はこれらのパターンを以前に見たことがありますが、数学的コミュニティの意識に固定されるようにそれらを説明しませんでした。実際、Lemke-OliverとSundararajanが調査結果を発表したとき、反応は不信感に接する驚きでした。エリカ・クララライヒは、 クアンタの記事で、オックスフォード数論者ジェームズ・メイナードの反応を引用しました：

スンダララジャンが最初にペアのオープンについてメイナードに語ったとき、メイナードは言った。オフィスに戻ったらすぐに、数値実験を行って自分でこれを確認しました。」

明らかに、これは一般的な反応でした。 Natureの記事で、 Evelyn Lambはスンダララジャンを引用しています。「私たちがこれについて話し合った人は誰でも、最終的に自分で見るために彼自身のコンピュータープログラムを書きました。」

私もそうしました。過去数週間にわたって、 mを法とする素数の除算を分析するためのコード行をたくさん書いてきました。私の記事は、これらのパターンがどこから来たかを把握しようとする試みの報告です。私の方法は数学的よりも計算的で視覚的であり、何も証明できません。 Lemke-OliverとSoundararajanは、より厳密で分析的なアプローチを取りました。この記事の最後で、それらの結果についてもう少し説明します。

独自の調査を開始する場合は、私のコードを基礎として使用できます。 Juliaプログラミング言語で記述され、 Jupyterノートブックにパッケージ化され、 GitHubで入手できます。（たまたまこのプログラムはジュリアとの最初の重要な実験でした。別の記事では、この言語での私の仕事について詳しく説明します。）

上記のすべての例で、素数の除算は7を法として与えられますが、7の間に特別なものはありません。 6つの可能な残基{1、2、3、4、5、6}が通常の立方体の骨の面に対応するため、単純に選択しました。他のモジュールでも同様の結果が得られます。 Lemke-OliverとSundararajanは、ほとんどの解析を3を法とする素数の除算に費やしました。2つの合同クラスのみです。3より大きい素数は、3で除算すると1または2の剰余になります。

10^{7}

$10 ^ 7$ ：

                              1 2
                     1 218578 281453
                     2 281454 218514

図3

パターンはかなりミニマルですが、それでも認識できます：シーケンスの対角線から外れた要素

（ 1 、 2 ）

$（1、2）$ そして

（ 2 、 1 ）

$（2、1）$ 対角線上の要素以上

（ 1 、 1 ）

$（1、1）$ そして

（ 2 、 2 ）

$（2、2）$ 。

10を法とするモジュロには4つの合同クラスがあります。1、3、7、9です。これを確認するには、10進表記で作業するため、算術すら必要ありません。数値が10を基数として書かれている場合、5より大きいすべての素数の最終桁は1、3、7、または9になります。16ペアの連続する最終桁の頻度は次のとおりです。

                           1 3 7 9
                  1 43811 76342 78 170 51644
                  3 58922 41148 71824 78049
                  7 64070 68542 40971 76444
                  9 83164 63911 59063 43924

図4

青い対角線は主対角線に沿ってはっきりと見えますが、マトリックスの他の場所ではパターンがわずかに弱くぼやけています。

連続する素数間の相関は、モジュール自体が素数であり、小さすぎないときに最も顕著であることがわかりました。連続する素数mod 13およびmod 17のヒートマップを見てください：

図5

図6

モジュール31はどうですか？

図7

これらのマトリックスは、キルトやモザイクの床に最適なパターンを作成しますか？そして、それらのすべてに興味深いパターンが表示されます。斜めのストライプは、主な対角線だけでなく、マトリックス全体でも目立ちます。このようなストライプは、市松模様も作成します。通常、セルの行または列に沿って赤と青が交互に表示されます。より目に見えない特徴は、 反対の対角線に沿ったおおよその左右対称です（左下から右上へ）。この線に沿って正方形を追加すると、接続されたセルはほぼ同じ色になります。（この事実はAshと彼の共著者によって気づかれました。）

さらに分析するために、mod 19の連続する素数に焦点を合わせることにしました。モジュールは、明確に区別されるストライプを生成するのに十分な大きさですが、マトリックスを巨大にするほど大きくはありません。

図8

私たちが見ているものの意味を理解するには？サンプルのすべての素数が奇数であるため、これらの素数間のすべての間隔が偶数であることを観察することから始めます。任意の単純な

p

$p$ 素数のタイトルの次の候補は

p + 2 、 p + 4 、 p + 6 、 l d o t s

$p + 2、p + 4、p + 6、\ ldots$ 。これはどういうわけかチェス盤のパターンと関連していますか？素数間のステップが2の倍数でなければならない場合、これにより、列または行の2番目のセル間に相関関係が確実に作成されます。（そして実際、セルとの相関関係は時々はっきりと見えるはずです-モジュールが偶数の場合、すべての偶数要素はゼロでなければなりません。セルを埋めるには、マトリックスの端を奇数の境界に「循環」するだけです。）

マトリックスの斜めのストライプは、特定の数値間隔で区切られたすべてのペア間の強い相関関係を示唆しています。たとえば、最も暗い青色の対角線と最も明るい赤色の対角線は、 j軸に沿って6つの要素で区切られたセルで構成されます。最初の行には、セル1と7、次に2と8、3と9などが含まれます。対角線が列になるようにマトリックスが「曲がっている」場合、この関係は知覚しやすいように思えました。アイデアは、各行に循環シフトを適用することです。行のすべての値は左にシフトし、左端から「落ちた」値は右に挿入されます。最初の行はゼロの位置、次の行は1つの位置などにシフトされます。（このような変換の名前はありますか？単に「曲げ」と呼びます。）

次に、この変換用のコードを作成しましたが、その結果、期待どおりの結果が得られませんでした。

図9

逆対角線に沿ったこれらのジグザグは何ですか？私は間違いを犯したと仮定し、1つ余分な要素をシフトしました。そして、問題の根本は本当にこれであることが判明しましたが、「バグ」はアルゴリズムではなく、データ自体にあります。前の図で私が示した行列は部分的なものにすぎず、空の合同クラスを破棄します。特に、19を法とする素数の行列は、19を法とする0に一致するすべての素数を、そのような素数がないという論理的根拠に基づいて無視します。最後に

p > 19

$p> 19$ そして

p e q u i v 0 b m o d 19

$p \ equiv 0 \ bmod 19$ それから

p

$p$ 19で割り切れるので、単純にすることはできません。ただし、行と列は

p e q u i v 0 b m o d 19

$p \ equiv 0 \ bmod 19$ 行列の実部です。それらを追加すると、色分けされたスコアボードは次のようになります。

図10

ヌルの行と列が存在すると、曲げをより正確に定義できます。各行に対して

i

$i$ 巡回左シフトを適用する

i

$i$ 場所結果の曲線マトリックスも見た目がきれいです。

図11。

これらの縦縞は何を示していますか？元のマトリックス要素

i 、 j

$i、j$ 頻度を表した

i b m o d 19

$i \ bmod 19$ すべき

j b m o d 19

$j \ bmod 19$ 。ここのセルの色

i 、 j

$i、j$ 周波数を示します

i b m o d 19

$i \ bmod 19$ すべき

（ i + j ） b m o d 19

$（i + j）\ bmod 19$ 。つまり、各列は、2つの素数間のmod 19の同じ間隔の要素を組み合わせます。たとえば、左端の列には、長さの間隔で区切られたすべてのペアが含まれます

0 b m o d 19

$0 \ bmod 19$ 、および明るい赤色の列

j = 6

$j = 6$ 連続する素数が互いに分離されているすべての場合を考慮します

6 b m o d 19

$6 \ bmod 19$ 。

カラーコーディングは、どの間隔が多かれ少なかれ出現するかを定性的に示します。より正確な定量的測定のために、列に沿って要約し、結果を棒グラフで表示できます。

図12

3つの観察：

上記の偶数/奇数の不均一性は、グラフ上ではっきりと見えます。 0を除いて、偶数の各間隔は、奇数の隣接から際立っています。
6に等しいmod 19の素数の間隔は、最も人気があります。 6の倍数（つまり、12と18）も頻繁に発生しますが、それほどではありませんが。
0に等しい素数mod 19の間隔は、特に一般的ではありません 。これらは元の行列の主対角線に沿った要素であるため、それらの合計が下にあることは驚くことではありませんが、赤字は予想よりも強いです。

これらのパターンのソースを把握したかったのです。間隔6が連続する素数のペアにとって非常に魅力的である理由と、ほとんどすべての素数が不十分な間隔0を避けているのはなぜですか？

私はすでに6の人気について遠い推測を持っています。1990年代に、Andrew Odlizhko、Michael Rubinstein、およびMarek Wolfeは、素数間の「ジャンプチャンピオン」の計算研究を行いました。

D , ≤ x x .

最小の素数（xは約600未満）の中で、ジャンプチャンピオンは通常2ですが、6に勝って番号軸のかなり長い間隔を支配します。周り

x = 10^{35}

$x = 10^{35}$ 数6は、数30のチャンピオンシップよりも劣っていますが、時間の経過とともに210よりも劣っています。

x = 10^{425}

$x = 10^{425}$ 。この一連のジャンプチャンピオンの数-2、6、30、210、...-はプライマリです。n番目のプライマリは、最初のn個の素数の積です。

なぜプライマリは連続するプライム間の優先間隔になるのですか？もし

p

$p$ は十分に大きい素数であり、

p + 2

$p + 2$ は2で割ることはできません

p + 6

$p + 6$ は2と3で除算できません

p + 30

$p + 30$ は、2、3、5で割ることはできません。一般的には

p + P_{n}

$p + P_{n}$ どこで

P_{n}

$P_{n}$ はn番目の原色であり、最初のn個の素数のいずれでも割り切れません。もちろん

p + P_{n}

$p + P_{n}$ は、まだ大きな素数で割ることができます。または、間に別の素数がある場合があります

p

$p$ そして

p + P_{n}

$p + P_{n}$ （素数間の間隔が素数であることが保証されないように）。しかし、これらの間隔は他の申請者よりも有利です。

100万個の8ビット素数のリストの連続する要素間の差をとり、グラフにその頻度をプロットすることにより、この正当化の動作を確認できます。

図13.

再び、間隔6は明確に区別され、全体の13.7％を占めています。6のより大きな倍数も、すぐ隣にある間で際立っています。分布の一般的な形式に注意する価値があります。左側のクラスター（番号6にピークがある）に続いて徐々に減少します。この傾向はポアソン分布に似ており、実際、これは真の説明と見なすことができます。

カラースキームは多くのデータを分数にカットします各19個の値。 0から18までの長さの素数間の間隔を含む青い部分は、100万個の素数のサンプルに存在するすべての間隔の68％を占めます。ゴールドシェアはさらに23％増加します。残りの9パーセントは広く均等に分布しています。すべての間隔がグラフに表示されるわけではありません：スペクトルは210まで続きます（サンプル内の連続する素数の1ペアの距離は210、つまり20 831 323と20 831 533です）。

図13は、19を法とする連続した素数のパターンのほとんどを示しているようです。簡単な変更を加えることで、スケジュールをさらに有益なものにすることができます。 19の要素の各端数を、0の端数と揃うまでシフトし始め、1つの列にある列に集まります。 2番目（金色）の共有は列19が列0に揃うまで左に移動し、3番目（ピンク）の共有は列38を列0に接続します。 19を法とする素数の間隔

図14.

明るすぎる色に注意を払わない場合、図14は図12に似ています：すべての列の高さが一致します。これは驚くべきことではありません。図12では、19を法とする素数を除算し、連続する分離された素数間の差を取ります。図14では、素数自体の差を取り、それらの差を19を法として除算しています。2つの手順は似ています。

(p mod 19 - q mod 19) mod 19 = (p - q) mod 19.

$(p \bmod 19 - q \bmod 19) \bmod 19 = (p - q) \bmod 19.$

色を勉強したら、パズルのすべてのピースを所定の位置に配置できます。 mod 19の素数がなぜ6で区切られることが多いのですか？実際、mod 19はそれとはほとんど関係ありません。このサンプルの番号6自体は、素数間の最も頻繁な間隔です。その他の唯一の重要な貢献

δ \equiv 6 mod 19

$\delta \equiv 6 \bmod 19$ 距離44における素数の特にいくつかのペア、第三の画分から出て

最初の部分の優位性は、また、偶数と奇数の間隔の不一致を説明しています。最初のビートのすべての間隔は必然的に偶数であり、奇数の間隔（mod 19）は2番目のビート（19から37までの間隔）でのみ出現し始め、この理由により頻度が少なくなります。 8桁の素数の場合、サンプルは19単位よりも近い連続したペアの3分の2以上であるため、最初の端数になります。（素数間の距離の中央値は12です。平均間隔は16.68であり、これは16.72の理論的予測に近い値です。）

最後に、図14は間隔0 mod 19の希少性について説明します。38の距離または38の倍数で分離されない限り、2つの連続する素数が同じ合同クラスmod 19に分類されることはありません。 3拍目の開始前にステージに上がると、あまり多くのビートはありません。 100万個の素数のサンプルには、距離が38-全体の1パーセント未満の8 384個の連続したペアが含まれています。そして、これが同じ顔で2回連続して素数の骨がめったに抜け落ちない主な理由です。これが、すべてのマトリックスに青い斜めのストリップが表示される理由です。

詳細を説明することなく、また素数の特別な性質を考慮することなく、mod mの連続素数のパターンについて説明できることは非常に興味深いと思います。実際、素数をまったく使用せずにパターンの重要な部分を再作成できます。

200年前、ガウスとルジャンドルは、数字の次に

x

$x$ 素数であるすべての整数

小数部はおよそ

1 / \log x

$1 / \log x$ 。1936年に、スウェーデンの数学者Harald Kramerは、この割合を確率として解釈することを提案しました。すべての整数を順番に調べて、それぞれを

x

$x$ 確率付き

1 / \log x

$1 / \log x$ 。受け入れられたセットの数は、偶然による場合を除いて素数ではありませんが、素数の分布と同じ大規模な分布になります。ランダム選択プロセスが開始される、これらの100万個の「Cramer素数」のリストの最初のいくつかの要素を次に示します。

x = 10^{7}

$x = 10^7$ ：

ここで、素数に適用したのと同じメカニズムを介してこれらの数値を渡すと仮定します。19を法とする各Cramer素数を除算し、その後の数の行列を作成します

19 \times 19

$19 × 19$ ：

図15.

顕著な対角線の特徴は似ていますが、対応する素数グラフよりもはるかに単純です。どのプライムクラマーのために、pは 19、最も可能性の高い後継国防省のp + 19のmod、および劣勢1 - P +モッズ19をのみいくつかのマイナーな変動の可能性が高いことができますされて、これらの両極端の間19は、周波数や確率のスムーズな勾配であります統計ノイズを相殺します。

このマトリックスには、チェッカーボードパターンのみが欠落しています。「半単純なクラマー番号」と呼ぶ新しい番号のセットを生成することにより、その構造を部分的に復元できます。それらは同じ確率的な整数のふるい分けによって作成されますが、今回は奇数のみを候補と見なし、確率を

2 / \log x

$2\, / \log x$ は同じ密度を維持し

：

図16.

それは良いことです！シーケンスから偶数を除外する場合、半単純な数字の最小間隔は2であり、これは最も可能性の高い場所でもあります。

別の変更を追加することにより、真の素数の行列のシミュレーションにさらに近づくことができます。 2の倍数であるすべての整数を削除することに加えて、3の倍数を取り除き、それに応じてサンプルの確率を変更します。結果の数字を「半準単純なクラマー番号」と呼びます。

図17.

6 mod 19は、半準単純なCramer数と真の素数の間で最も可能性の高い間隔であり、間隔12と18で同じエコーが存在することに注意してください。 10（真の素数に対応するグラフ）は、19を法とする0に一致する数の列と行にあります。素数の中には、そのような数はありません。 Cramer数からそれらを削除すると、2つの行列はほとんど区別できなくなります。ここに両方があります：

図18.

よく見ると、違いを見つけることができます-行1、列15から南東への対角線の延長を見てください-しかし、一般に、これらの変更されたCramer数は驚くほど素数を模倣しています。両方の図で、逆対角線に関する対称性でさえ顕著です。また、これらの2つのセットには合計で値の19パーセントしか含まれていないことを忘れないでください。Cramerの数値には189,794個の真の素数が含まれています。

この話に別のプロットのひねりを加えたいです。上記の例はすべて、8桁の10進数の素数（またはそれらの類似体）、または言い換えると、

10^{7}

$10 ^ 7$ 。より高い値の素数でも同じ結果が有効ですか？モジュロ19で取られた100万の40ビット素数のシーケンシャルペアから作成されたテーブルを考えてみましょう。パターンはおなじみですが、より淡いものになります。

図19

次に、19を法として除算された400桁の素数に進みましょう。ほとんど認識できないほど色が薄くなります。

図20

メインの対角線上の青いバーはほとんど区別できず、残りのフィーチャは単純なランダムスポットに変わります。

したがって、連続する素数のペアでは、サイズが問題になるようです。この理由を理解するために、40ビットのサンプルで連続する素数の違いのグループを見てみましょう。

図21

8桁の素数の間隔の分布（図13）と比較すると、スペクトルははるかに広く平坦です。この形式では、グラフは240の間隔で切り捨てられます。実際、長い「テール」は右に伸びており、連続する素数間の最大ギャップは1,328です。また、オディルコと彼の同僚が予測したように、40ビット素数の最も頻繁な間隔は6ではなく30です。

間隔の分布が広くなるため、8桁の素数間で最初の分数がシステムの動作を支配することはできません。 mod 19のシェアを互いの上に配置し始めると（下の図22）、最初の6または8のシェアが大きく貢献します。偶奇の不均一性は依然として存在しますが、これらの振動の振幅は大幅に減少します。グラフの左端の列は、19を法とする0に一致する間隔を表しており、成長は遅れていますが、それほど大きくありません。

図22

100万個の400ビット素数のサンプルでは、スペクトルの整列がさらに顕著になります。

図23。

現在、素数間のギャップは15,080まで拡大しており、mod 800のほぼ800のシェアを作成しています（ただし、13のみが表示されています）。そして、ここの山塊には非常に興味深い尾根構造があります。一般に、6の倍数である数値の列は、最近傍の高さの約2倍であり、最小の素数2および3の継続的な影響を示しています。シーケンス42、84、126、168、210、...の値も大きな貢献をします。これらの数値は、

42 = 2 \times 3 \times 7

$42 = 2×3×7$ 。また、6 と 30 と 42の倍数である210が新しいチャンピオン間隔であり、これもオドリジコの予測を裏付けています。

このすべての内部構造にもかかわらず、柱がmod 19の互いの上に配置されている場合、800ローブの混合物は非常にきれいなので、高さはほとんど同じです。残る唯一のものは、偶奇のわずかな不均一性です。

400桁の素数の差分6567379スタックmod 19

図24。

そして、19を法とする合同0の慢性的に人気のないクラスは、最終的に同等であることがわかりました。列の高さの大部分は、1ダースの初期ローブからではなく、228から15 080の間の間隔を表す数百のローブから得られます（それらはすべてグラフの青緑色の領域に蓄積されます）。

素数の大きい実験では、もっともらしい仮定を立てることができます：素数のサイズが無限になる傾向があるため、相関の痕跡はすべて徐々に消え、素数の連続したペアは理想的なボーンスローと同じくらいランダムになります。しかし、そうですか？この仮説に懐疑的であるいくつかの理由があります。第一に、素数の大きさとともにモジュールmを増やして、大きさを素数間の中央ギャップに匹敵させるようにすると、相関関係が現れ続けます。 40ビットのサンプルでは、素数間の中央値のギャップは66であるため、mod 61の連続するペアのマトリックスを見てみましょう（統計ノイズを制限するために、1つではなく1,000万の40ビット素数からのサンプルで計算を実行します）。

図25。

バンドが帰ってきた！実際、6の間隔でおなじみの明るい赤のストライプに加えて、周期30のピンクと青の周波数がより多く散らばっています。単純な400ビット数のマトリックスを見てみたいと思います。期間6、30、および210で相互作用する波を使用します。残念ながら、この写真は表示できません。 400ビット素数間のギャップの中央値は約640であるため、この間隔の素数に等しい値、たとえば641をmに割り当てる必要があります。

641 \times 641

$641×641$ 約10億の連続した400ビットの数字が必要になりますが、これは私が計算できる以上です。

素数が増えると相関が完全になくなることを疑う他の理由があります。図21と23で顕著であるリッジ構造は、小さい素数への可分性の規則がmod mの大きい素数の分布に強く影響し、この効果は数が増えても消えないことを示しています。さらに、 mが素数間の中央間隔よりはるかに小さい場合でも、青いバーはほとんど見えません。連続する400ビットmod 3素数のペアのマトリックスは次のとおりです。

                              1 2
                     1 248291 251128
                     2 251 127 249453

対角線上の要素と対角線の外側の要素の差は、8桁の素数の場合よりもはるかに小さくなります（図3と比較）が、偏差はランダムな変動のようには見えません。

素数のサイズの関数として相関がどのように変化するかをより明確に把握するために、1桁から400ビットの数値までの範囲全体で素数のサンプルを作成することにしました。このプロジェクトでは、ガウスよりもうまくやることに決めました。彼は、チリド（1,000のグループ）のテーブルに素数を入れ、無数（10,000のグループ）の素数を計算しました。 mod mの素数間の相関を測定するために、マトリックスの対角要素の平均値と対角線の外側の要素の平均を計算し、対角線の外側/の比を取りました。連続する素数がまったく相関しない場合、比率は1になる傾向があります。

図26は、797種類の素数mod 3の結果を示しています。曲線は上向きに湾曲しており、最初は急激に減少し、その後はより平坦なセグメントになります。約100桁から開始して、比率が1未満のサンプルがあります。これは、対角線が対角線の外側の領域よりも密集していることを意味します。しかし、400桁であっても、ほとんどの比率は1を超えています。曲線はゆっくりと比率1に近づいていますか、それとも1よりわずかに大きい制限値がありますか？残念ながら、計算実験では決定的な答えは得られません。

図26。

この記事では、Lemke-OliverとSounararajanが他のツールを使用しています。彼らは数値研究を使用していますが、彼らの目標は分析的な解決策を見つけることです。目標は、入力データが4つの正の整数である数学関数または数式です。mはモジュール、 aとbは素数mod mの合同クラス、 xは素数のサイズの上限です。この式は、 x未満のすべての素数の中で、 aがbに続く頻度を示しています。このような式がある場合、連続した数字のマトリックス内のすべての正方形に色を付けることができます

m \times m

$m×m$ xまでの素数自体を計算する必要さえありません。

xまでのすべての素数の振る舞いを記述することは、 xの近傍で素数のサンプルを取るよりもはるかに複雑なタスクです。分析的アプローチは他の理由で複雑です。CPU計算のサイクルだけでなく、アイデアが必要です。しかし、報酬は潜在的にはるかに価値がある可能性があります。たとえば、方程式を計算することにより

A = p i r^{2}

$A = \ pi r ^ 2$ 、すべての円の真の値を取得します。これは、有限数の計算（

p i

$\ pi$ ）これは、厳密な決定だけでなく、洞察の出現を約束します。

残念ながら、Lemke-OliverとSundararajanの分析を読んで洞察を得ることができませんでした。私の解析的数論の知識のギャップは大部分のせいになっていますが、記事の一部では数学が非常に素晴らしいと言っても過言ではないと思います。以下の方程式は、基本的なLemke-OliverおよびSundararajan予想です。（表記を少し修正し、方程式の1つの側面を簡略化しました：オリジナルは一連のr個の連続する素数に適用できますが、私のバージョンではペアのみが記述されています。

r = 2

$r = 2$ ）

p i （ x; m 、 a 、 b ） = f r a c m a t h r m l i （ x ） p h i （ m ）^{2} l e f t （ 1 + c_{1} （ m; a 、 b ） f r a c l o g l o g x l o g x + c_{2} （ m; a 、 b ） f r a c 1 l o g x + O B i g （ f r a c 1 （ l o g x ）^{7 / 4} B i g ） r i g h t ）

$\ pi（x; m、a、b）= \ frac {\ mathrm {li}（x）} {\ phi（m）^ 2} \ left（1 + c_1（m; a、b）\ frac { \ log \ log x} {\ log x} + c_2（m; a、b）\ frac {1} {\ log x} + O \ Big（\ frac {1} {（\ log x）^ {7 / 4}} \ Big）\ right）$

私の説明を提供するためにここで何が起こっているのか、私は非常によく理解しているように思えます。等号の左側

p i （ x; m 、 a 、 b ）

$\ pi（x; m、a、b）$ はカウント関数を示し、

p i （ x ）

$\ pi（x）$ 素数を数える

x

$x$ 、

p i （ x; m 、 a 、 b ）

$\ pi（x; m、a、b）$ 連続する素数のペアの数です

m

$m$ 合同クラスに分類される

a

$a$ そして

b

$b$ 。等号の右側にある主要な係数

m a t h r m l i （ x ） / p h i （ m ）^{2}

$\ mathrm {li}（x）/ \ phi（m）^ 2$ 連続する素数間の相関なしに素数がランダムに均等に分布した場合のペアの平均数または予想数です。

m a t h r m l i （ x ）

$\ mathrm {li}（x）$ 対数積分です

x

$x$ 近似

p i （ x ）

$\ pi（x）$ 、そして

p h i （ m ）^{2}

$\ phi（m）^ 2$ \（m \）の合同可能なクラスの数の2乗をカウントするオイラー関数、つまり、連続した数値の行列内の要素の数です。

大きな括弧内の主な用語は

1

$1$ 、したがって、メイン係数の値を添付します

m a t h r m l i （ x ） / p h i （ m ）^{2}

$\ mathrm {li}（x）/ \ phi（m）^ 2$ ; したがって、ペアの平均数

（ a 、 b ）

$（a、b）$ カウント関数の最初の近似になります。次の3つの用語は、この最初の近似の改良として使用されます。大きいために

x

$x$ 彼らは小さくなる必要があります

l o g l o g x / l o g x g t 1 / l o g x g t 1 / （ l o g x ）^{7 / 4}

$\ log \ log x / \ log x \ gt 1 / \ log x \ gt 1 /（\ log x）^ {7/4}$ で

x g t e^{e} \約 15

$x \ gt e ^ e \約15$ 。

これら3つの資格条件のオッズはどうですか？記録

O c d o t

$O \ cdot$ 最小の用語については、用語の大きさの程度にのみ関心があることを意味します。

x

$x$ 小さくなります。係数

c_{1}

$c_1$ で

r = 2

$r = 2$ 次の形式を取ります。

c_1（m; a、b）= \ frac {1} {2}-\ frac {\ phi（m）} {2}（\＃\ {a \ equiv b \ bmod m \}）

$c_1（m; a、b）= \ frac {1} {2}-\ frac {\ phi（m）} {2}（\＃\ {a \ equiv b \ bmod m \}）$

表現

\＃\ {a \ equiv b \ bmod m \}

$\＃\ {a \ equiv b \ bmod m \}$ ケースの数を数えます

a

$a$ そして

b

$b$ 同じ合同クラスmodに属する

m

$m$ 。つまり、用語の重要性は（正しく理解した場合）、行列の対角線に沿った総数を減らすことです。

a e q u i b b b m o d m

$a \ equib b \ bmod m$ 。

係数は

c_{2}

$c_2$ そして、Lemke-OliverとSounararajanは、「一般的な場合、彼は複雑に見える」と指摘している。そして彼らは正しい。この時点で、私はオリジナルの記事を自分で読むためにもっと知りたい読者に助言すべきです。

数学的記述の複雑さは私を困惑させますが、非常に多くの場合、単純に定式化された問題には深く複雑な解決策が必要です。追加の作業の後、技術的な詳細の一部が破棄され、主要なアイデアがより明確になることを期待できます。当面は、グラフィックスのドロップだけでなく、最も単純なコンピューティングツールの助けを借りて、数論の楽しさと長い隠れたコーナーをまだ探求することができます。

「神は宇宙でサイコロを振ることはできませんが、素数では奇妙なことが起こります」と、PalErdösやMark Katz がKarl Pomeranceの助けを借りて言いました。奇妙なことは、素数の助けを借りてサイコロをプレイするときに最も奇妙に現れます。

追加。 7を法とする素数の分布は、通常の骨を投げた結果よりも平坦または均一に近いように見えることを上で述べました。ジョン・D・クックはデータを使用してカイ二乗チェックを実行しましたが、それらが均一な分布に均等に収まりすぎて、ランダムなプロセスの妥当な結果ではないことが判明しました。彼の最初の投稿では、7を法とする素数の具体的なケースが考慮されています。 2番目の投稿では、他のモジュールについて説明します。

参照資料

Ash、Avner、Laura Beltis、Robert Gross、およびWarren Sinnott。 2011.プライム残基の連続したペアの頻度。 実験数学 20（4）：400-411。

チェビシェフ、パフヌティ・リボヴィッチ。 1853.レット・ド・M・ル・プロフェッサー・テビチェフ・ア・M.・フス・シュル・ヌ・ヌーヴォーサンペテルスブール 11：208。 Googleブックス

クラメル、ハラルド。 1936年。連続する素数間の差の大きさ。 Acta Arithmetica 2：23–46。 PDF

ダービーシャー、ジョン。 2002. チェビシェフのバイアス。

アンドリュー、グランビル。 1995.ハラルドクラメルと素数の分布。ハラルドクラメルシンポジウム、ストックホルム、1993年。 スカンジナビアアクチュアリージャーナル 1：12–28。 PDF

グランビル、アンドリュー、グレッグマーティン。 2004.素数レース。 arXiv

ハムザ、カイス、フィマ・クレバナー。 2012.プライムの統計的独立性について。 数学科学者 37：97–105。

クラライヒ、エリカ。 2016.数学者は主要な陰謀を発見します。量子

Knapowski、S。、およびP.Turán。 1977.素数について？ 1件 3 mod 4. 数論と代数：ヘンリー・B・マン、アーノルド・E・ロス、オルガ・タウスキー・トッドに捧げられた論文集 、pp。 157–165。ハンス・ザッセンハウスが編集。ニューヨーク：アカデミックプレス。

コ、チョンミン。 2002.素数の単位桁の分布。 カオスソリトンフラクタル 13（6）：1295–1302。

子羊、エブリン。 2016。「ランダムな」素数に見られる特異なパターン。 Nature doi：10.1038 / nature.2016.19550

Lemke Oliver、Robert J.、およびKannan Soundararajan。 2016プレプリント。連続する素数の分布における予期しないバイアス。 arXiv

Odlyzko、Andrew、Michael Rubinstein、Marek Wolf。 1999年。ジャンプチャンピオン。 実験数学 8（2）：107–118。

ルービンシュタイン、マイケル、ピーターサーナック。 1994.チェビシェフのバイアス。 実験数学 3：173–197。プロジェクトユークリッド

タオ、テレンス。素数の構造とランダム性。 PDF

素数の構造とランダム性

More articles: