素数の構造とランダム性







素数は風によって散らばる種のように数軸に沿って散らばっていますか? もちろんそうではありません。単純さは偶然の問題ではなく、初等算術の結果です。 数が素数であるのは、ユニティ以外の正の整数がそれを完全に分割しない場合のみです。



しかし、話はこれで終わりではありません。 素数の分布は不規則に見え 、不均等なギャップとクラスターが混chaとしています。 スキームが存在する場合、それは理解不能です。 実際、素数はサイコロをプレイできるほどランダムに見えます。 連続する素数のリストを作成し(たとえば、11、13、17、19、...で始まる)、7を法として除算します。つまり、各素数を7で除算し、残りのみを保存します。 結果は、セット{1、2、3、4、5、6}からの整数のシーケンスになります。これは、通常のボーンのいくつかのスローの結果のように見えます。







 beginalign11 bmod7 rightarrow4 qquad47 bmod7 rightarrow513 bmod7 rightarrow6 qquad53 bmod7 rightarrow417 bmod7 rightarrow3 qquad59 bmod7 rightarrow319 bmod7 rightarrow5 qquad61 bmod7 rightarrow523 bmod7 rightarrow2 qquad67 bmod7 rightarrow429 bmod7 rightarrow1 qquad71 bmod7 rightarrow131 bmod7 rightarrow3 qquad73 bmod7 rightarrow337 bmod7 rightarrow2 qquad79 bmod7 rightarrow241 bmod7 rightarrow6 qquad83 bmod7 rightarrow643 bmod7 rightarrow1 qquad89 bmod7 rightarrow5 end







より大きなサンプルで作業した(最初の100万個以上の素数 107 )、7を法とする6つの可能な剰余(7を法とする6つの可能な合同クラスとしても知られています)のそれぞれの素数をカウントしました。 また、100万のヘクスロールをシミュレートしました。 これらの2つの結果を見て、どちらが何であると言えますか?



                1 2 3 4 5 6
          166787166569569714714166573166 665166692
              120-98 47-94-2 25

                1 2 3 4 5 6
          166768166290290166412166638638167282166610
              101 -377 -255 -29 615 -57


各テーブルの最初の行は、結果の数を示しています。 x 6つのクラスのそれぞれ。 2行目は違いを示しています x barx どこで  barx -平均値 1,000,000ドル/ 6 = 166,667ドル 。 どちらの場合も、明らかな偏りはなく、数字はかなり均等に分布しているようです。 最初の表は、7を法とする除算の素数の残りを示しています。それらの分布は、シミュレートされた骨に比べてわずかに平坦であり、平均からの偏差が小さくなっています。 2つのサンプルの標準偏差はそれぞれ84と346ですこれらの表から判断すると、通常のサイコロゲームで必要なランダム性を提供するために、どのプロセスも使用できるようです。



しかし、ランダム性の条件は、許容可能な間隔での結果の均一な分布だけではありません。 さらに、シーケンス内の個々のイベントは互いに独立している必要があります。 骨の1つのロールは、次のロールの結果に影響を与えません。 独立性を検証するために、連続するイベントを見ることができます。 1つのユニットは何回、または2回、3回など続きますか? マトリックスに書く 6×6 36の可能なすべてのペアの数。 プロセスが本当にランダムな場合、わずかな統計的変動を考慮に入れない場合、36ペアすべてが同じ周波数を持つ必要があります。 マトリックスを「ヒートマップ」色に変えることができます。このマップでは、平均を超える量のセルはピンクと赤の暖かい色合いで表示され、平均以下のセルは冷たい色合いの青で塗りつぶされます。 (入力された金額は有効な数量ではありません。 x 、正規化された変数 w=xi\、j barx/\、 barx どこで  barx この場合も平均値です 1,000,000ドル/ 36 = 27,778ドル 。)これは、シミュレートされた通常の骨のヒートマップです。



ヒートマップフェアダイ






図1



ここには興味深いものは何もありません。 ほとんどすべての量が平均に非常に近いため、マトリックスセルはニュートラルグレーであるように見えますが、淡いピンクまたは青であることがわかったのはごくわずかです。 これは、連続するボーンロールが相互に相関しておらず、すべての可能なペアが等しく発生する可能性がある場合に期待する結果です。



7を法とする連続した素数の対応する行列に移りましょう:



ヒートマップ8桁素数1000001 mod 7






図2



わあ! ランダムランドから離れたようです。ここでは、古い灰色の映画館がテクニカラーに変わりました。 メインの対角線(左上から右下)に沿ってヒートマップ上に青いバーが表示されました。これは、7で除算して同じ剰余を持つ連続する素数のペアが発生する可能性が非常に低いことを意味します。 言い換えれば、カップル 1122 ldots66 本当にランダムなシーケンスで発生するよりも頻繁に発生しません。 対角線上(主対角線の真上)の色は明るい青色です。 それはカップルを意味します ij どこで j=i+1 平均頻度よりも少し少ない頻度で発生します。 例えば 23 そして 56 わずかに負の正規化された周波数値を持ちます。 一方、(メインの対角線の下の)サブ対角線は完全にピンクと赤です。 のようなカップル 32 または 54 どこで j=i1 平均以上の頻度で発生します。 対角線から離れると、右上隅と左下隅にパステルのチェスパターンが表示されます。



色付きの正方形ではなく、数値を扱う場合、値のマトリックスは次のとおりです。



           連続する素数のペアmod 7
                    1 2 3 4 5 6
           1 15656 24376 33891 29964 33984 28916
           2 37360 15506 22004 32645 25095 33959
           3 25307 41107 14823 22747 32721 30009
           4 32936 26183 37129 14681 21852 33791
           5 24984 34207 26231 41154 15560 24529
           6 30543 25190 32636 25382 37453 15488


均一性からの逸脱は何でも呼ぶことができますが、「取るに足らない」ものではありません。 たとえば、3行目では、7の素数のシーケンスで3と出会った場合、次の数は2であり、他の3ではない可能性が高いことは明らかです。素数からサイコロでゲームをプレイする場合、そのようなシフトは結果に大きな影響を与えます。 素数の骨は「充電された」骨です!






ペアでのこれらの非常に強い相関関係は、スタンフォード大学のロバート・J・レムケ・オリバーとカンナン・スンダララジャンによって発見されました。 彼らは、今年3月にarXivで公開されたプレプリントでそれらについて議論しました。 私にとって、この発見について最も驚くべきことは、長年にわたって誰もこれらの構造に気付いていなかったことです。 どこを見るか知っていれば、それらはかなり明白です。



ユークリッドを見つけられなかったと非難することはできないと思います。古代では、チャンスと確率のアイデアは開発されていませんでした。 しかし、ガウスはどうですか? 彼は素数表の鑑識家であり、数千の素数のリストを作成しました。 若い頃、 彼は次のように書いています。「私の最初のプロジェクトの1つは、数千の素数を計算する素数の減少頻度を観察することでした...」さらに、ガウスは合同クラスとモジュラー算術のアイデアを実際に発明しました。 しかし、明らかに、彼は、連続した素数のペアの一致に奇妙な何かがあるのではないかと疑っていません。



1850年代、ロシアの数学者Pafnutii Lvovich Chebyshevは、素数のわずかな歪みを指摘しました。 4を法とする奇数の素数の除算は、それらを2つのサブセットに分割します。 系列5、13、17、29、37、...のすべての素数は、4を法とする合同1です。 シリーズ3、7、11、19、23、31、...では、4を法とする合同3です。チェビシェフは、2番目のカテゴリの素数がより多く見えることに気付きました。 たとえば、最初の10,000個の奇数素数には、4,943個の合同1と5,057個の合同3があります。ただし、この効果は、連続する素数のペアに見られる不規則性と比較して小さいです。



最近、数人の著者が連続した素数の現象のヒントを見てきました。 Lemke-OliverとSoundararajanは、そのような3つの証言に言及しています。 (記事の最後にある参考文献のリストを参照してください。)1950年代および60年代に、スタニスラフ・ナポウスキーとパル・トゥランは、 mを法とする素数の除算の剰余のさまざまな側面を調査しました。 1977年に死後に出版された論文で、彼らは残基1または3で4を法とする連続素数の除算を調べました。彼らは、同じ剰余を持つ連続するペアと異なる残基を持つペアは「等しくない」と示唆しました。 2002年に、Chun-Ming Koは一連の連続した素数(それらのペアだけでなく)を研究し、変化する周波数に基づいて精巧なフラクタルパターンを作成しました。 その後、2011年に、Avner Ashと同僚は、対角線の減少がはっきりと目立ついくつかのマトリックスを含む、「残留素数の連続するペアの周波数」の詳細な分析を公開しました。



これらの先例から、レムケ=オリバーとスンダララジャンは本当に連続した素数の発見者でしたか? 私の意見では、答えはイエスでなければなりません。 他の人はこれらのパターンを以前に見たことがありますが、数学的コミュニティの意識に固定されるようにそれらを説明しませんでした。 実際、Lemke-OliverとSundararajanが調査結果を発表したとき、反応は不信感に接する驚きでした。 エリカ・クララライヒは、 クアンタの記事で 、オックスフォード数論者ジェームズ・メイナードの反応を引用しました:



スンダララジャンが最初にペアのオープンについてメイナードに語ったとき、メイナードは言った。 オフィスに戻ったらすぐに、数値実験を行って自分でこれを確認しました。」


明らかに、これは一般的な反応でした。 Natureの記事で Evelyn Lambはスンダララジャンを引用しています。「私たちがこれについて話し合った人は誰でも、最終的に自分で見るために彼自身のコンピュータープログラムを書きました。」



私もそうしました。 過去数週間にわたって、 mを法とする素数の除算を分析するためのコード行をたくさん書いてきました。 私の記事は、これらのパターンがどこから来たかを把握しようとする試みの報告です。 私の方法は数学的よりも計算的で視覚的であり、何も証明できません。 Lemke-OliverとSoundararajanは、より厳密で分析的なアプローチを取りました。この記事の最後で、それらの結果についてもう少し説明します。



独自の調査を開始する場合は、私のコードを基礎として使用できます。 Juliaプログラミング言語で記述され、 Jupyterノートブックにパッケージ化され、 GitHubで入手できます 。 (たまたまこのプログラムはジュリアとの最初の重要な実験でした。別の記事では、この言語での私の仕事について詳しく説明します。)






上記のすべての例で、素数の除算は7を法として与えられますが、7の間に特別なものはありません。 6つの可能な残基{1、2、3、4、5、6}が通常の立方体の骨の面に対応するため、単純に選択しました。 他のモジュールでも同様の結果が得られます。 Lemke-OliverとSundararajanは、ほとんどの解析を3を法とする素数の除算に費やしました。2つの合同クラスのみです。3より大きい素数は、3で除算すると1または2の剰余になります。 107



                              1 2
                     1 218578 281453
                     2 281454 218514 


ヒートマップ8桁素数1000001 mod 3






図3



パターンはかなりミニマルですが、それでも認識できます:シーケンスの対​​角線から外れた要素 12 そして 21 対角線上の要素以上 11 そして 22



10を法とするモジュロには4つの合同クラスがあります。1、3、7、9です。これを確認するには、10進表記で作業するため、算術すら必要ありません。 数値が10を基数として書かれている場合、5より大きいすべての素数の最終桁は1、3、7、または9になります。16ペアの連続する最終桁の頻度は次のとおりです。



                           1 3 7 9
                  1 43​​811 76342 78 170 51644
                  3 58922 41148 71824 78049
                  7 64070 68542 40971 76444
                  9 83164 63911 59063 43924 




ヒートマップ8桁素数1000001 mod 10






図4



青い対角線は主対角線に沿ってはっきりと見えますが、マトリックスの他の場所ではパターンがわずかに弱くぼやけています。



連続する素数間の相関は、モジュール自体が素数であり、小さすぎないときに最も顕著であることがわかりました。 連続する素数mod 13およびmod 17のヒートマップを見てください:



ヒートマップ8桁の素数1000001 mod 13






図5



ヒートマップ8桁の素数1000001 mod 17






図6



モジュール31はどうですか?



ヒートマップ8桁の素数1000001 mod 31






図7



これらのマトリックスは、キルトやモザイクの床に最適なパターンを作成しますか? そして、それらのすべてに興味深いパターンが表示されます。 斜めのストライプは、主な対角線だけでなく、マトリックス全体でも目立ちます。 このようなストライプは、市松模様も作成します。 通常、セルの行または列に沿って赤と青が交互に表示されます。 より目に見えない特徴は、 反対の対角線に沿ったおおよその左右対称です(左下から右上へ)。 この線に沿って正方形を追加すると、接続されたセルはほぼ同じ色になります。 (この事実はAshと彼の共著者によって気づかれました。)



さらに分析するために、mod 19の連続する素数に焦点を合わせることにしました。モジュールは、明確に区別されるストライプを生成するのに十分な大きさですが、マトリックスを巨大にするほど大きくはありません。



ヒートマップ8桁の素数1000001 mod 19






図8



私たちが見ているものの意味を理解するには? サンプルのすべての素数が奇数であるため、これらの素数間のすべての間隔が偶数であることを観察することから始めます。 任意の単純な p 素数のタイトルの次の候補は p+2p+4p+6 ldots 。 これはどういうわけかチェス盤のパターンと関連していますか? 素数間のステップが2の倍数でなければならない場合、これにより、列または行の2番目のセル間に相関関係が確実に作成されます。 (そして実際、セルとの相関関係は時々はっきりと見えるはずです-モジュールが偶数の場合、すべての偶数要素はゼロでなければなりません。セルを埋めるには、マトリックスの端を奇数の境界に「循環」するだけです。)



マトリックスの斜めのストライプは、特定の数値間隔で区切られたすべてのペア間の強い相関関係を示唆しています。 たとえば、最も暗い青色の対角線と最も明るい赤色の対角線は、 j軸に沿って6つの要素で区切られたセルで構成されます。 最初の行には、セル1と7、次に2と8、3と9などが含まれます。 対角線が列になるようにマトリックスが「曲がっている」場合、この関係は知覚しやすいように思えました。 アイデアは、各行に循環シフトを適用することです。行のすべての値は左にシフトし、左端から「落ちた」値は右に挿入されます。 最初の行はゼロの位置、次の行は1つの位置などにシフトされます。 (このような変換の名前はありますか?単に「曲げ」と呼びます。)



次に、この変換用のコードを作成しましたが、その結果、期待どおりの結果が得られませんでした。



ツイストNZヒートマップ8桁素数1000001 mod 19






図9



逆対角線に沿ったこれらのジグザグは何ですか? 私は間違いを犯したと仮定し、1つ余分な要素をシフトしました。 そして、問題の根本は本当にこれであることが判明しましたが、「バグ」はアルゴリズムではなく、データ自体にあります。 前の図で私が示した行列は部分的なものにすぎず、空の合同クラスを破棄します。 特に、19を法とする素数の行列は、19を法とする0に一致するすべての素数を、そのような素数がないという論理的根拠に基づいて無視します。 最後に p>19 そして p equiv0 bmod19 それから p 19で割り切れるので、単純にすることはできません。ただし、行と列は p equiv0 bmod19 行列の実部です。 それらを追加すると、色分けされたスコアボードは次のようになります。



ヒートマップ8桁の素数1000001 mod 19






図10



ヌルの行と列が存在すると、曲げをより正確に定義できます。各行に対して i 巡回左シフトを適用する i 場所 結果の曲線マトリックスも見た目がきれいです。



ツイストヒートマップ8桁の素数1000001 mod 19






図11。



これらの縦縞は何を示していますか? 元のマトリックス要素 ij 頻度を表した i bmod19 すべき j bmod19 。 ここのセルの色 ij 周波数を示します i bmod19 すべき i+j bmod19 。 つまり、各列は、2つの素数間のmod 19の同じ間隔の要素を組み合わせます。 たとえば、左端の列には、長さの間隔で区切られたすべてのペアが含まれます 0 bmod19 、および明るい赤色の列 j=6 連続する素数が互いに分離されているすべての場合を考慮します 6 bmod19



カラーコーディングは、どの間隔が多かれ少なかれ出現するかを定性的に示します。 より正確な定量的測定のために、列に沿って要約し、結果を棒グラフで表示できます。



列合計のツスト8桁素数1000001 mod 19






図12



3つの観察:





これらのパターンのソースを把握したかったのです。 間隔6が連続する素数のペアにとって非常に魅力的である理由と、ほとんどすべての素数が不十分な間隔0を避けているのはなぜですか?



私はすでに6の人気について遠い推測を持っています。1990年代に、Andrew Odlizhko、Michael Rubinstein、およびMarek Wolfeは、素数間の「ジャンプチャンピオン」の計算研究を行いました。



D , ≤ x x .


最小の素数(xは約600未満)の中で、ジャンプチャンピオンは通常2ですが、6に勝って番号軸のかなり長い間隔を支配します。周りx=1035数6は、数30のチャンピオンシップよりも劣っていますが、時間の経過とともに210よりも劣っています。x=10425この一連のジャンプチャンピオンの数-2、6、30、210...-プライマリです。n番目のプライマリは、最初のn個の素数の積です



なぜプライマリは連続するプライム間の優先間隔になるのですか?もし pは十分に大きい素数であり、p+2は2で割ることはできませんp+6は2と3で除算できませんp+30は、2、3、5で割ることはできません。一般的にはp+Pn どこで Pnn番目の原色であり、最初のn個の素数のいずれでも割り切れませんもちろん p+Pnは、まだ大きな素数で割ることができます。または、間に別の素数がある場合がありますp そして p+Pn(素数間の間隔が素数であることが保証されないように)。しかし、これらの間隔は他の申請者よりも有利です。



100万個の8ビット素数のリストの連続する要素間の差をとり、グラフにその頻度をプロットすることにより、この正当化の動作を確認できます。



8桁の素数の差分1000001色






図13.



再び、間隔6は明確に区別され、全体の13.7%を占めています。6のより大きな倍数も、すぐ隣にある間で際立っています。分布の一般的な形式に注意する価値があります。左側のクラスター(番号6にピークがある)に続いて徐々に減少します。この傾向はポアソン分布に似ており、実際、これは真の説明と見なすことができます。



カラースキームは多くのデータを分数にカットします各19個の値。 0から18までの長さの素数間の間隔を含む青い部分は、100万個の素数のサンプルに存在するすべての間隔の68%を占めます。ゴールドシェアはさらに23%増加します。残りの9パーセントは広く均等に分布しています。すべての間隔がグラフに表示されるわけではありません:スペクトルは210まで続きます(サンプル内の連続する素数の1ペアの距離は210、つまり20 831 323と20 831 533です)。



図13は、19を法とする連続した素数のパターンのほとんどを示しているようです。簡単な変更を加えることで、スケジュールをさらに有益なものにすることができます。 19の要素の各端数を、0の端数と揃うまでシフトし始め、1つの列にある列に集まります。 2番目(金色)の共有は列19が列0に揃うまで左に移動し、3番目(ピンク)の共有は列38を列0に接続します。 19を法とする素数の間隔



8桁素数の差分1000001カラースタックmod 19






図14.



明るすぎる色に注意を払わない場合、図14は図12に似ています:すべての列の高さが一致します。これは驚くべきことではありません。図12では、19を法とする素数を除算し、連続する分離された素数間の差を取ります。図14では、素数自体の差を取り、それらの差を19を法として除算しています。2つの手順は似ています。







(pmod19qmod19)mod19=(pq)mod19.







色を勉強したら、パズルのすべてのピースを所定の位置に配置できます。 mod 19の素数がなぜ6で区切られることが多いのですか?実際、mod 19はそれとはほとんど関係ありません。このサンプルの番号6自体は、素数間の最も頻繁な間隔です。その他の唯一の重要な貢献δ6mod19距離44における素数の特にいくつかのペア、第三の画分から出て



最初の部分の優位性は、また、偶数と奇数の間隔の不一致を説明しています。最初のビートのすべての間隔は必然的に偶数であり、奇数の間隔(mod 19)は2番目のビート(19から37までの間隔)でのみ出現し始め、この理由により頻度が少なくなります。 8桁の素数の場合、サンプルは19単位よりも近い連続したペアの3分の2以上であるため、最初の端数になります。 (素数間の距離の中央値は12です。平均間隔は16.68であり、これは16.72の理論的予測に近い値です。)



最後に、図14は間隔0 mod 19の希少性について説明します。38の距離または38の倍数で分離されない限り、2つの連続する素数が同じ合同クラスmod 19に分類されることはありません。 3拍目の開始前にステージに上がると、あまり多くのビートはありません。 100万個の素数のサンプルには、距離が38-全体の1パーセント未満の8 384個の連続したペアが含まれています。そして、これが同じ顔で2回連続して素数の骨がめったに抜け落ちない主な理由です。これが、すべてのマトリックスに青い斜めのストリップが表示される理由です。






詳細を説明することなく、また素数の特別な性質を考慮することなく、mod mの連続素数のパターンについて説明できることは非常に興味深いと思います実際、素数をまったく使用せずにパターンの重要な部分を再作成できます。



200年前、ガウスとルジャンドルは、数字の次にx素数であるすべての整数小数部はおよそ1/logx1936年に、スウェーデンの数学者Harald Kramerは、この割合を確率として解釈することを提案しました。すべての整数を順番に調べて、それぞれをx確率付き x1/logx受け入れられたセットの数は、偶然による場合を除いて素数ではありませんが、素数の分布と同じ大規模な分布になります。ランダム選択プロセスが開始される、これらの100万個の「Cramer素数」のリストの最初のいくつかの要素を次に示します。x=107



 10000007
     10000022
     10000042
     10000065
     10000068
     10000098
     10000110
     10000116
     10000119
     10000128
     10000166 


ここで、素数に適用したのと同じメカニズムを介してこれらの数値を渡すと仮定します。19を法とする各Cramer素数を除算し、その後の数の行列を作成します19×19



ヒートマップ8桁クレーマー1000007 mod 19






図15.



顕著な対角線の特徴は似ていますが、対応する素数グラフよりもはるかに単純です。どのプライムクラマーのために、pは 19、最も可能性の高い後継国防省のp + 19のmod、および劣勢1 - P +モッズ19をのみいくつかのマイナーな変動の可能性が高いことができますされて、これらの両極端の間19は、周波数や確率のスムーズな勾配であります統計ノイズを相殺します。



このマトリックスには、チェッカーボードパターンのみが欠落しています。「半単純なクラマー番号」と呼ぶ新しい番号のセットを生成することにより、その構造を部分的に復元できます。それらは同じ確率的な整数のふるい分けによって作成されますが、今回は奇数のみを候補と見なし、確率を2/logxは同じ密度を維持します



ヒートマップ8桁のセミクレーマー1000001 mod 19






図16.



それは良いことです!シーケンスから偶数を除外する場合、半単純な数字の最小間隔は2であり、これは最も可能性の高い場所でもあります。



別の変更を追加することにより、真の素数の行列のシミュレーションにさらに近づくことができます。 2の倍数であるすべての整数を削除することに加えて、3の倍数を取り除き、それに応じてサンプルの確率を変更します。結果の数字を「半準単純なクラマー番号」と呼びます。



ヒートマップ8桁demisemicramers 1000001 mod 19






図17.



6 mod 19は、半準単純なCramer数と真の素数の間で最も可能性の高い間隔であり、間隔12と18で同じエコーが存在することに注意してください 10(真の素数に対応するグラフ)は、19を法とする0に一致する数の列と行にあります。素数の中には、そのような数はありません。 Cramer数からそれらを削除すると、2つの行列はほとんど区別できなくなります。ここに両方があります:



Primes Cramers比較z






図18.



よく見ると、違いを見つけることができます-行1、列15から南東への対角線の延長を見てください-しかし、一般に、これらの変更されたCramer数は驚くほど素数を模倣しています。両方の図で、逆対角線に関する対称性でさえ顕著です。また、これらの2つのセットには合計で値の19パーセントしか含まれていないことを忘れないでください。Cramerの数値には189,794個の真の素数が含まれています。






この話に別のプロットのひねりを加えたいです。 上記の例はすべて、8桁の10進数の素数(またはそれらの類似体)、または言い換えると、 107 。 より高い値の素数でも同じ結果が有効ですか? モジュロ19で取られた100万の40ビット素数のシーケンシャルペアから作成されたテーブルを考えてみましょう。 パターンはおなじみですが、より淡いものになります。



ヒートマップ40桁の素数9166432 mod 19






図19



次に、19を法として除算された400桁の素数に進みましょう。ほとんど認識できないほど色が薄くなります。



ヒートマップ400桁の素数6567379 mod 19






図20



メインの対角線上の青いバーはほとんど区別できず、残りのフィーチャは単純なランダムスポットに変わります。



したがって、連続する素数のペアでは、サイズが問題になるようです。 この理由を理解するために、40ビットのサンプルで連続する素数の違いのグループを見てみましょう。



40桁の素数の差分9166432






図21



8桁の素数の間隔の分布(図13)と比較すると、スペクトルははるかに広く平坦です。 この形式では、グラフは240の間隔で切り捨てられます。 実際、長い「テール」は右に伸びており、連続する素数間の最大ギャップは1,328です。また、オディルコと彼の同僚が予測したように、40ビット素数の最も頻繁な間隔は6ではなく30です。



間隔の分布が広くなるため、8桁の素数間で最初の分数がシステムの動作を支配することはできません。 mod 19のシェアを互いの上に配置し始めると(下の図22)、最初の6または8のシェアが大きく貢献します。 偶奇の不均一性は依然として存在しますが、これらの振動の振幅は大幅に減少します。 グラフの左端の列は、19を法とする0に一致する間隔を表しており、成長は遅れていますが、それほど大きくありません。



40桁の素数の差分9166432スタックmod 19






図22



100万個の400ビット素数のサンプルでは、​​スペクトルの整列がさらに顕著になります。



400桁の素数の差分6567379






図23。



現在、素数間のギャップは15,080まで拡大しており、mod 800のほぼ800のシェアを作成しています(ただし、13のみが表示されています)。 そして、ここの山塊には非常に興味深い尾根構造があります。 一般に、6の倍数である数値の列は、最近傍の高さの約2倍であり、最小の素数2および3の継続的な影響を示しています。 シーケンス42、84、126、168、210、...の値も大きな貢献をします。これらの数値は、 42=2×3×7 。 また、6 30 42の倍数である210が新しいチャンピオン間隔であり、これもオドリジコの予測を裏付けています。



このすべての内部構造にもかかわらず、柱がmod 19の互いの上に配置されている場合、800ローブの混合物は非常にきれいなので、高さはほとんど同じです。 残る唯一のものは、偶奇のわずかな不均一性です。



400桁の素数の差分6567379スタックmod 19

図24。



そして、19を法とする合同0の慢性的に人気のないクラスは、最終的に同等であることがわかりました。 列の高さの大部分は、1ダースの初期ローブからではなく、228から15 080の間の間隔を表す数百のローブから得られます(それらはすべてグラフの青緑色の領域に蓄積されます)。






素数の大きい実験では、もっともらしい仮定を立てることができます:素数のサイズが無限になる傾向があるため、相関の痕跡はすべて徐々に消え、素数の連続したペアは理想的なボーンスローと同じくらいランダムになります。 しかし、そうですか? この仮説に懐疑的であるいくつかの理由があります。 第一に、素数の大きさとともにモジュールmを増やして、大きさを素数間の中央ギャップに匹敵させるようにすると、相関関係が現れ続けます。 40ビットのサンプルでは、​​素数間の中央値のギャップは66であるため、mod 61の連続するペアのマトリックスを見てみましょう(統計ノイズを制限するために、1つではなく1,000万の40ビット素数からのサンプルで計算を実行します)。



ヒートマップ40桁の素数5053744 mod61






図25。



バンドが帰ってきた! 実際、6の間隔でおなじみの明るい赤のストライプに加えて、周期30のピンクと青の周波数がより多く散らばっています。単純な400ビット数のマトリックスを見てみたいと思います。期間6、30、および210で相互作用する波を使用します。残念ながら、この写真は表示できません。 400ビット素数間のギャップの中央値は約640であるため、この間隔の素数に等しい値、たとえば641をmに割り当てる必要があります。 641×641 約10億の連続した400ビットの数字が必要になりますが、これは私が計算できる以上です。



素数が増えると相関が完全になくなることを疑う他の理由があります。 図21と23で顕著であるリッジ構造は、小さい素数への可分性の規則がmod mの大きい素数の分布に強く影響し、この効果は数が増えても消えないことを示しています。 さらに、 mが素数間の中央間隔よりはるかに小さい場合でも、青いバーはほとんど見えません。 連続する400ビットmod 3素数のペアのマトリックスは次のとおりです。



                              1 2
                     1 248291 251128
                     2 251 127 249453 


対角線上の要素と対角線の外側の要素の差は、8桁の素数の場合よりもはるかに小さくなります(図3と比較)が、偏差はランダムな変動のようには見えません。



素数のサイズの関数として相関がどのように変化するかをより明確に把握するために、1桁から400ビットの数値までの範囲全体で素数のサンプルを作成することにしました。 このプロジェクトでは、ガウスよりもうまくやることに決めました。彼は、チリド(1,000のグループ)のテーブルに素数を入れ、無数(10,000のグループ)の素数を計算しました。 mod mの素数間の相関を測定するために、マトリックスの対角要素の平均値と対角線の外側の要素の平均を計算し、対角線の外側/の比を取りました。 連続する素数がまったく相関しない場合、比率は1になる傾向があります。



図26は、797種類の素数mod 3の結果を示しています。曲線は上向きに湾曲しており、最初は急激に減少し、その後はより平坦なセグメントになります。 約100桁から開始して、比率が1未満のサンプルがあります。これは、対角線が対角線の外側の領域よりも密集していることを意味します。 しかし、400桁であっても、ほとんどの比率は1を超えています。 曲線はゆっくりと比率1に近づいていますか、それとも1よりわずかに大きい制限値がありますか? 残念ながら、計算実験では決定的な答えは得られません。



無数の診断比3






図26。






この記事では、Lemke-OliverとSounararajanが他のツールを使用しています。 彼らは数値研究を使用していますが、彼らの目標は分析的な解決策を見つけることです。 目標は、入力データが4つの正の整数である数学関数または数式です。mはモジュール、 abは素数mod mの合同クラス、 xは素数のサイズの上限です。 この式は、 x未満のすべての素数の中で aがbに続く頻度を示しています。 このような式がある場合、連続した数字のマトリックス内のすべての正方形に色を付けることができます m×m xまでの素数自体を計算する必要さえありません。



xまでのすべての素数の振る舞いを記述することは、 xの近傍で素数のサンプルを取るよりもはるかに複雑なタスクです。 分析的アプローチは他の理由で複雑です。CPU計算のサイクルだけでなく、アイデアが必要です。 しかし、報酬は潜在的にはるかに価値がある可能性があります。 たとえば、方程式を計算することにより A= pir2 、すべての円の真の値を取得します。これは、有限数の計算(  pi ) これは、厳密な決定だけでなく、洞察の出現を約束します。



残念ながら、Lemke-OliverとSundararajanの分析を読んで洞察を得ることができませんでした。 私の解析的数論の知識のギャップは大部分のせいになっていますが、記事の一部では数学が非常に素晴らしいと言っても過言ではないと思います。 以下の方程式は、基本的なLemke-OliverおよびSundararajan予想です。 (表記を少し修正し、方程式の1つの側面を簡略化しました:オリジナルは一連のr個の連続する素数に適用できますが、私のバージョンではペアのみが記述されています。 r=2







 pix;mab= frac mathrmlix phim2 left1+c1m;ab frac log logx logx+c2m;ab frac1 logx+O Big frac1 logx7/4 Big right







私の説明を提供するためにここで何が起こっているのか、私は非常によく理解しているように思えます。 等号の左側  pix;mab はカウント関数を示し、  pix 素数を数える x pix;mab 連続する素数のペアの数です m 合同クラスに分類される a そして b 。 等号の右側にある主要な係数  mathrmlix/ phim2 連続する素数間の相関なしに素数がランダムに均等に分布した場合のペアの平均数または予想数です。  mathrmlix 対数積分です x 近似  pix 、そして  phim2 \(m \)の合同可能なクラスの数の2乗をカウントするオイラー関数、つまり、連続した数値の行列内の要素の数です。



大きな括弧内の主な用語は 1 、したがって、メイン係数の値を添付します  mathrmlix/ phim2 ; したがって、ペアの平均数 ab カウント関数の最初の近似になります。 次の3つの用語は、この最初の近似の改良として使用されます。 大きいために x 彼らは小さくなる必要があります  log logx/ logx gt1/ logx gt1/ logx7/4x gtee\約15



これら3つの資格条件のオッズはどうですか? 記録 O cdot 最小の用語については、用語の大きさの程度にのみ関心があることを意味します。 x 小さくなります。 係数 c1r=2 次の形式を取ります。







c_1(m; a、b)= \ frac {1} {2}-\ frac {\ phi(m)} {2}(\#\ {a \ equiv b \ bmod m \})







表現 \#\ {a \ equiv b \ bmod m \} ケースの数を数えます a そして b 同じ合同クラスmodに属する m 。 つまり、用語の重要性は(正しく理解した場合)、行列の対角線に沿った総数を減らすことです。 a equibb bmodm



係数は c2 そして、Lemke-OliverとSounararajanは、「一般的な場合、彼は複雑に見える」と指摘している。 そして彼らは正しい。 この時点で、私はオリジナルの記事を自分で読むためにもっと知りたい読者に助言すべきです。



数学的記述の複雑さは私を困惑させますが、非常に多くの場合、単純に定式化された問題には深く複雑な解決策が必要です。 追加の作業の後、技術的な詳細の一部が破棄され、主要なアイデアがより明確になることを期待できます。 当面は、グラフィックスのドロップだけでなく、最も単純なコンピューティングツールの助けを借りて、数論の楽しさと長い隠れたコーナーをまだ探求することができます。



「神は宇宙でサイコロを振ることはできませんが、素数では奇妙なことが起こります」と、PalErdösやMark Katz がKarl Pomeranceの助けを借りて言いました。 奇妙なことは、素数の助けを借りてサイコロをプレイするときに最も奇妙に現れます。



追加。 7を法とする素数の分布は、通常の骨を投げた結果よりも平坦または均一に近いように見えることを上で述べました。 ジョン・D・クックはデータを使用してカイ二乗チェックを実行しましたが、それらが均一な分布に均等に収まりすぎて、ランダムなプロセスの妥当な結果ではないことが判明しました。 彼の最初の投稿では、7を法とする素数の具体的なケースが考慮されています。 2番目の投稿では、他のモジュールについて説明します。






参照資料



Ash、Avner、Laura Beltis、Robert Gross、およびWarren Sinnott。 2011.プライム残基の連続したペアの頻度。 実験数学 20(4):400-411。

チェビシェフ、パフヌティ・リボヴィッチ。 1853.レット・ド・M・ル・プロフェッサー・テビチェフ・ア・M.・フス・シュル・ヌ・ヌーヴォーサンペテルスブール 11:208。 Googleブックス



クラメル、ハラルド。 1936年。連続する素数間の差の大きさ。 Acta Arithmetica 2:23–46。 PDF



ダービーシャー、ジョン。 2002. チェビシェフのバイアス



アンドリュー、グランビル。 1995.ハラルドクラメルと素数の分布。 ハラルドクラメルシンポジウム、ストックホルム、1993年。 スカンジナビアアクチュアリージャーナル 1:12–28。 PDF



グランビル、アンドリュー、グレッグマーティン。 2004.素数レース。 arXiv



ハムザ、カイス、フィマ・クレバナー。 2012.プライムの統計的独立性について。 数学科学者 37:97–105。



クラライヒ、エリカ。 2016.数学者は主要な陰謀を発見します。 量子



Knapowski、S。、およびP.Turán。 1977.素数について? 1件 3 mod 4. 数論と代数:ヘンリー・B・マン、アーノルド・E・ロス、オルガ・タウスキー・トッド捧げられた論文集 、pp。 157–165。 ハンス・ザッセンハウスが編集。 ニューヨーク:アカデミックプレス。

コ、チョンミン。 2002.素数の単位桁の分布。 カオスソリトンフラクタル 13(6):1295–1302。



子羊、エブリン。 2016。「ランダムな」素数に見られる特異なパターン。 Nature doi:10.1038 / nature.2016.19550







Lemke Oliver、Robert J.、およびKannan Soundararajan。 2016プレプリント。 連続する素数の分布における予期しないバイアス。 arXiv



Odlyzko、Andrew、Michael Rubinstein、Marek Wolf。 1999年。ジャンプチャンピオン。 実験数学 8(2):107–118。



ルービンシュタイン、マイケル、ピーターサーナック。 1994.チェビシェフのバイアス。 実験数学 3:173–197。 プロジェクトユークリッド



タオ、テレンス。 素数の構造とランダム性。 PDF








All Articles