Skip to content

GeneKong/primes

Folders and files

NameName
Last commit message
Last commit date

Latest commit

69c9351 · Mar 29, 2025

History

39 Commits
Mar 24, 2025
Mar 24, 2025
Mar 26, 2025
Mar 26, 2025
Mar 23, 2025
Mar 29, 2025
Mar 29, 2025

Repository files navigation

前置说明

DOI

当前版本为知乎普及版本的内容,论文版本文章直接跳转到:论文原稿English Version

知乎原文位置:再谈素数

再谈素数

大家都知道素数是乘法世界的基础,素数奇怪和不可捉摸的性质,比如素数产生没有规律,素数的数量是无限的。

这里想和大家从素数的定义再来看看素数的性质。

明确一下文章的定义

  1. 素数:就是我们通常规则理解中的素数;
  2. 伪素数:文章中满足特定条件下的素数,素数必然会从伪素数中产生;
  3. 伪孪生素数:文章中满足特定条件下的孪生素数。
  4. 大部分伪素数最终都会变成合数。

构造素数规则

选取第一个素数

在一堆自然数列表中,我们删掉所有型为 2 n 的数会形成如下表格,其中被删掉的用灰色表示,剩余的用绿色表示,后续的 素数必然在绿色 中构造,这里称为伪素数:

t2

从素数2向后看,除了2本身之外,所有的伪素数必然可以写成: 2 m + 1 | m Z 的形式,这就是我们常见的奇数。

后续伪素数产生的概率为: 1 2

选取素数3

选取剩余的数中的第一个3,做为我们的新素数,删掉所有型为 3 n 的数,更新表格如下:

t3

剩下的所有素数均在绿色的区域产生,所以除了2、3本身,所有的伪素数必然可以写成: ( 6 m 1 ) ( 6 m + 1 )

2 k + 1 | k Z 3 j | j Z = ( 6 m ± 1 ) | m Z

后续伪素数产生的概率为: 1 3 , 对于伪孪生素数仅仅考虑其中的最小素数参数,其概率为: 1 6

在引入新的素数之前,伪素数产生的位置是有规律的,2和3过滤之后,所有的剩余的数均按照孪生素数的行为排列,这是 孪生素数产生的基础

选取素数5

继续确认素数,选取剩余的数中的第一个5,删掉 5 n 的数,更新表格如下:

t5

其实到这一步我们要说的素数生成规则已经全部展现了,这是从自然数2开始拿掉第一个绿色数的倍数数字,不断让所有的表格中的绿色变成其它颜色。

从自然数5开始引入的素数,让剩余伪素数选取规律不再那么明显,且越往后越无序

当引入素数5之后,自然数中素数存在的概率变更低,但是伪素数的出现的可能形式变得更加多了,所以除了2,3,5本身外,所有的伪素数必然可以写成:

( 6 k ± 1 ) | k Z 5 j | j Z = ( 30 m ± 13 ) ( 30 m ± 11 ) ( 30 m ± 7 ) ( 30 m ± 1 ) | m Z

后续伪素数产生的概率为: 4 15 ,伪孪生素数的概率为: 1 10

这种概率减少总类增加的性质加速了下一个素数位置的随机性,这也是素数定义本身来的的规律,但在产生随机性的同时,也有一些规律性。

在引入了7之后,所有的伪素数必然可以写成如下形式之一:

( 210 m ± 1 ) , ( 210 m ± 11 ) , ( 210 m ± 13 ) , ( 210 m ± 17 ) , ( 210 m ± 19 ) , ( 210 m ± 23 ) , ( 210 m ± 29 ) , ( 210 m ± 31 ) , ( 210 m ± 37 ) , ( 210 m ± 41 ) , ( 210 m ± 43 ) , ( 210 m ± 47 ) , ( 210 m ± 53 ) , ( 210 m ± 59 ) , ( 210 m ± 61 ) , ( 210 m ± 67 ) , ( 210 m ± 71 ) , ( 210 m ± 73 ) , ( 210 m ± 79 ) , ( 210 m ± 83 ) , ( 210 m ± 89 ) , ( 210 m ± 97 ) , ( 210 m ± 101 ) , ( 210 m ± 103 ) | m Z

后续伪素数产生的概率为: 8 35 ,伪孪生素数的概率为: 1 14

在这一步之后,我们可以得到一个明确结论:伪素数的特性传递,什么意思呢?

2 2 k + 1 | k Z 3 ( 2 3 m ± 1 ) | m Z ( 2 3 p m ± 1 ) | m Z p

这个性质不能用于寻找素数,因为特性传递的速度远远大于素数产生的速度,但在引入素数 p 之后,特性将会向前筛选,就是特性的发散的目标总是尝试规避已知素数的规律。

当表格中所有的绿色全部消失后,这个表看起来像这样:

t7+

我们总结一下素数特性传播的规律:

  1. 素数 p 的特性是所有已知的素数序列 2 3 5 p l p p l 的特性和最后素数 p 倍数的差集;
  2. 对于已知素数序列: 2 3 5 p ,特性 ( 2 3 p m ± k ) | m Z , k 1 n , n + 2 ,对区间 p ( p + 2 ) 2 ( p + 4 ) 2 之间(分别命中 6 m 1 6 m + 1 )的素数预期准确率为100%;
  3. 对于已知素数序列: 2 3 5 p ,特性 ( 2 3 p m ± k ) | m Z , k 1 n , n + 2 ,在不考虑后续素数产生的情况下,伪素数的预期准确率为100%(因为不考虑新素数必然互质);
  4. 引入新素数后,老素数产生的特性不会消失;
  5. 每引入一个新素数之后,特性交替发散叠加向后传播,速度远大于素数生成的速率;

为什么孪生素数的特性永不消失?

考虑素数序列由 2 , 3 , 5 p 扩充为 2 , 3 , 5 p p n 时,由于 p 的特性中存在 ( 2 3 p m ± 1 ) | m Z ,而 p n ( 2 3 p ) 互质,那么 ( 2 3 p m ) | m Z 0 , 1 p n 1 ( mod p n ) ,在新特性 ( 2 3 p p n m ± k ) | m Z , k 1 n , n + 2 中,除了模数为 1 , p n 1 两个位置,其余的 p n 2 个由 ( 2 3 p m ± 1 ) | m Z 产生的伪孪生素数对必然会保留下来。

举例来说明:

2 , 3 , 5 , 7 2 , 3 , 5 , 7 , 11 2 3 5 7 1 ( mod 11 ) 2 3 5 7 10 10 ( mod 11 )

孪生素数是无限的吗?

我们都知道素数是无限的,因为我们总是可以构造一个 p 1 p 2 p 3 p n + 1 , ( p 1 p 2 , p 3 , , p n ) , 那 孪生素数或者是多胞胎素数 呢?

“从直观感受上来看,孪生素数的减少是因为新产生素数的倍数规则消掉了以 2 3 预留的 可能素数产生位 , 考虑到所有素数是互质的,那么 ( 2 3 ) ( 5 7 9 11   p n ) 也互质,当数足够大之后,100% 同时命中 ( 6 m 1 ) ( 6 m + 1 ) 是矛盾的,即 g c d ( 2 3 , 5 7 9 11   p n ) > 1 , 这个结论是违背我们素数的定义的”。

上面的结论其实无法证明,当素数增加时,遮盖 ( 6 m 1 ) ( 6 m + 1 ) 的概率也越来越大,但永远达不到 100%(孪生素数出现概率趋近于0) ,暂时无法证明是不是会出现后面素数交替覆盖而达到让孪生素数不出现的情况。

能用反证法吗?

可以,在明确素数特性100%传递的基础之上,假如在达到一个非常大的素数 p 之后,不再出现新的孪生素数,那么那么我们考虑这个数列的实际情况:

  1. 如果素数 p 之后不再有孪生素数了,那么 2 , 3 , 5 , 7 p 的倍数必然命中后面所有的 6 m 1 | m Z 6 m + 1 | m Z
  2. 那么 2 , 3 , 5 , p , p m , p n , p k 必然在 p 之后不存在 ( 2 3 p m ± k ) | m Z , k 1 n , n + 2 这个特性(因为被条件1必然命中了);
  3. 而我们上面已经证明过,孪生素数的特性必然不会丢失;
  4. 这个和我们前面的证明产生了矛盾;
  5. 故不存在最大的孪生素数对

由于素数的规律,不可能出现一个规律性的公式能够绝对匹配素数,但素数特性传递的规律又像在证明一个事实: