当前版本为知乎普及版本的内容,论文版本文章直接跳转到:论文原稿,English Version 。
知乎原文位置:再谈素数 。
大家都知道素数是乘法世界的基础,素数奇怪和不可捉摸的性质,比如素数产生没有规律,素数的数量是无限的。
这里想和大家从素数的定义再来看看素数的性质。
- 素数:就是我们通常规则理解中的素数;
- 伪素数:文章中满足特定条件下的素数,素数必然会从伪素数中产生;
- 伪孪生素数:文章中满足特定条件下的孪生素数。
- 大部分伪素数最终都会变成合数。
在一堆自然数列表中,我们删掉所有型为
从素数2向后看,除了2本身之外,所有的伪素数必然可以写成:
后续伪素数产生的概率为:
选取剩余的数中的第一个3,做为我们的新素数,删掉所有型为
剩下的所有素数均在绿色的区域产生,所以除了2、3本身,所有的伪素数必然可以写成:
后续伪素数产生的概率为:
在引入新的素数之前,伪素数产生的位置是有规律的,2和3过滤之后,所有的剩余的数均按照孪生素数的行为排列,这是 孪生素数产生的基础 。
继续确认素数,选取剩余的数中的第一个5,删掉
其实到这一步我们要说的素数生成规则已经全部展现了,这是从自然数2开始拿掉第一个绿色数的倍数数字,不断让所有的表格中的绿色变成其它颜色。
从自然数5开始引入的素数,让剩余伪素数选取规律不再那么明显,且越往后越无序。
当引入素数5之后,自然数中素数存在的概率变更低,但是伪素数的出现的可能形式变得更加多了,所以除了2,3,5本身外,所有的伪素数必然可以写成:
后续伪素数产生的概率为:
这种概率减少总类增加的性质加速了下一个素数位置的随机性,这也是素数定义本身来的的规律,但在产生随机性的同时,也有一些规律性。
在引入了7之后,所有的伪素数必然可以写成如下形式之一:
后续伪素数产生的概率为:
在这一步之后,我们可以得到一个明确结论:伪素数的特性传递,什么意思呢?
这个性质不能用于寻找素数,因为特性传递的速度远远大于素数产生的速度,但在引入素数
当表格中所有的绿色全部消失后,这个表看起来像这样:
我们总结一下素数特性传播的规律:
- 素数
的特性是所有已知的素数序列 中 的特性和最后素数 倍数的差集; - 对于已知素数序列:
,特性 ,对区间 到 或 之间(分别命中 和 )的素数预期准确率为100%; - 对于已知素数序列:
,特性 ,在不考虑后续素数产生的情况下,伪素数的预期准确率为100%(因为不考虑新素数必然互质); - 引入新素数后,老素数产生的特性不会消失;
- 每引入一个新素数之后,特性交替发散叠加向后传播,速度远大于素数生成的速率;
考虑素数序列由
举例来说明:
我们都知道素数是无限的,因为我们总是可以构造一个
“从直观感受上来看,孪生素数的减少是因为新产生素数的倍数规则消掉了以
上面的结论其实无法证明,当素数增加时,遮盖
可以,在明确素数特性100%传递的基础之上,假如在达到一个非常大的素数
- 如果素数
之后不再有孪生素数了,那么 的倍数必然命中后面所有的 或 ; - 那么
必然在 之后不存在 这个特性(因为被条件1必然命中了); - 而我们上面已经证明过,孪生素数的特性必然不会丢失;
- 这个和我们前面的证明产生了矛盾;
- 故不存在最大的孪生素数对。
由于素数的规律,不可能出现一个规律性的公式能够绝对匹配素数,但素数特性传递的规律又像在证明一个事实: