质数筛(朴素、埃氏、欧拉)

质数筛(朴素、埃氏、欧拉)

介绍

作为和数学高度结合的一门学科,程序设计中经常会用到数学上的性质和概念,或者说,计算机一开始就是为了解决数学问题而发明的。在做题的过程中,我们经常遇到质数相关的题目,那么,我们如何判断一个数是不是质数呢?如何把质数全部打入表中呢?今天,我将介绍三种常见的筛取质数的方法。


朴素筛

代码实现

c 复制代码
int main()
{
	int n, c, N = 0, prime[10000];//质数数组
	scanf("%d", &n);
	for (int i = 2; i <= n; i++)//检测i是否为质数
	{
		c = 1;
		for (int j = 2; j * j <= i + 1; j++)//测试i是否能被j整除
			if (i % j == 0 && i != 2)
			{
				c = 0;
				break;
			}
		if(c) prime[N++] = i;//填入并计数
	}
	for (int i = 0; i < N; i++) printf("%d ", prime[i]);
	return 0;
}

分析

根据质数的定义,质数有且只有两个因数,即1和它本身。

朴素筛就根据这最基本的性质,从2开始遍历,直到它的平方根,依次取余,如果整除了就违反了质数有且只有两个因数的性质,可以将其排除。

之所以只需要遍历到平方根,是因为整除时,结果也是它的一个因数,故只需要遍历到平方根,便可以将所有可能是因数的数试到。

c 复制代码
for (int i = 2; i <= n; i++)//检测i是否为质数
	{
		c = 1;
		for (int j = 2; j * j <= i; j++)//测试i是否能被j整除
			if (i % j == 0 && i != 2)
			{
				c = 0;
				break;
			}
		if(c) prime[N++] = i;//填入并计数
	}

这里是朴素筛的核心部分。

值得注意的是,for循环的跳出条件设置为j*j<=i,避免了sqrt函数的使用,可以显著提升运行速度。

而变量c的设置则是为了标识i是否是质数,若是因为判断为合数而跳出,则将c赋为0,后续不做处理,反之,将其存入数组。

补充

整个算法的时间复杂度为O(nlogn)。很显然,这个算法是最基础的暴力遍历,如果题目给的数据大一点就会被T得很惨,比赛时间充裕的情况尽量不要用朴素筛,就跟尽量用快排别用冒泡一个道理。


埃氏筛

代码实现

C 复制代码
#include<stdio.h>
#include<stdbool.h>
#define maxNum 1000000001//定义最大值
bool priNum[maxNum];//质数为真,否则为假
void savePriNum()//创建预处理质数集
{
	for (int i = 0; i < maxNum; i++)
		priNum[i] = true;//默认真
	priNum[0] =priNum[1] = false;
	for (int i = 2; i * i < maxNum ; i++)//依次筛掉i的倍数,不包括i
		for (int j = 2 * i; j < maxNum; j += i)
            priNum[j] = false;
}

int main()
{
	savePriNum();
	int n;
	scanf("%d", &n);
	for (int i = 2; i <= n; i++)
		if (priNum[i])
            printf("%d\n", i);
	return 0;
}

分析

质数有且只有两个因数,那也就是说,任何数的倍数都不可能是质数,那我们只需要在遍历2到它的平方根,并标记这些数在要求范围内的倍数为合数,那剩下的数就是质数了。

C 复制代码
#include<stdbool.h>
#define maxNum 1000000001//定义最大值
bool priNum[maxNum];//质数为真,否则为假

首先,我们先创建一个布尔型数组来存放质数。因为数据范围极大,而我们只需要存放01来标记质数合数,所以我们采用值只有truefalse的布尔型变量,来节省空间。

C 复制代码
void savePriNum()//创建预处理质数集
{
	for (int i = 0; i < maxNum; i++)
		priNum[i] = true;//默认真
	priNum[0] =priNum[1] = false;
	for (int i = 2; i * i < maxNum ; i++)//依次筛掉i的倍数,不包括i
		for (int j = 2 * i; j < maxNum; j += i)
            priNum[j] = false;
}

我们将存表操作封装进函数中。

首先,我们默认每个数都为质数,接着,特判01不是质数,同时,01也不在我们遍历的过程中。

我们从2开始,遍历到范围最大值的平方根,标记这些数在要求范围内的倍数为合数。

这样,我们想判断x是不是质数,只需要查询priNum[x]的值就可以了。

补充

整个算法的时间复杂度为O(nloglogn),已经很逼近线性时间O(n)了,但是我们可以发现,埃氏筛在标记合数时,是有重复标记的。当一个合数拥有多个因数时,就会被标记多次,例如12拥有因数1234612,除去112,在遍历2346时,12都被标记了一次,所以,埃氏筛还并不是线性时间。


欧拉筛

代码实现

C 复制代码
#include<stdio.h>
#include<stdbool.h>
#define maxNum 1000000001//定义最大值
bool priNum[maxNum];//质数为真,否则为假
int  pri[maxNum], N = 0;
void savePriNum()//创建预处理质数集
{
	for (int i = 0; i < maxNum; i++)
		priNum[i] = true;//全部填入真
	priNum[0] = priNum[1] = false;
	for (int i = 2; i * i <= maxNum; i++)
		if (priNum[i])
		{
			pri[N] = i;//存入数组并计数
			N++;
			for (int j = 0; j < N; j++)//若i为质数,则标记它和其他质数的每一个乘积
				if (pri[j] * i < maxNum) priNum[pri[j] * i] = false;
				else break;//
		}
		else
			for (int j = 0; j < N; j++)
			{
				if (pri[j] * i < maxNum) priNum[pri[j] * i] = false;//若i为合数,则标记它和其他质数的乘积
				if (i % pri[j] == 0) break;//直到i整除到某质数
			}
	return 0;
}

int main()
{
	savePriNum();
	int n;
	scanf("%d", &n);
	for (int i = 1; i <= n; i++)
		if (priNum[i])
			printf("%d ", i);
	return 0;
}

分析

欧拉筛又称线性筛,在欧拉筛中每个合数都只会被标记一次,因此,算法的时间是线性的,时间复杂度到了O(n)

为了实现每个合数只被标记一次,在欧拉筛中我们规定每个合数都只会被它的最小因数标记,这里的意思是通过该数最小因数*某数=该数来标记该数。

C 复制代码
#include<stdio.h>
#include<stdbool.h>
#define maxNum 1000000001//定义最大值
bool priNum[maxNum];//质数为真,否则为假
int  pri[maxNum], N = 0;

预处理时,我们另外创建一个数组,用于即时存放筛选出的质数,同时设置变量N用于记录当前质数数量。

C 复制代码
void savePriNum()//创建预处理质数集
{
	for (int i = 0; i < maxNum; i++)
		priNum[i] = true;//全部填入真
	priNum[0] = priNum[1] = false;
	for (int i = 2; i * i <= maxNum; i++)
		;//......
	return 0;
}

我们同样将存表操作封装进函数中,默认存真,特判01,同样的遍历至平方根,不做赘述。

C 复制代码
if (priNum[i])
	{
		pri[N] = i;//存入数组并计数
		N++;
		for (int j = 0; j < N; j++)//若i为质数,则标记它和其他质数的每一个乘积
			if (pri[j] * i < maxNum) priNum[pri[j] * i] = false;
			else break;//
	}

当我们遍历到一个质数时,我们将其存入质数数组并计数,然后将其与已经存入的质数相乘,并标记相乘的积为合数。

两个不同质数相乘的积有且只有4个因数,两个相同质数相乘的积有且只有3个因数,这是分解质因数的原理。

也因此,我们通过此法标记的数,必然是通过它的最小因数来标记的。

C 复制代码
else
	for (int j = 0; j < N; j++)
	{
		if (pri[j] * i < maxNum) priNum[pri[j] * i] = false;//若i为合数,则标记它和其他质数的乘积
		if (i % pri[j] == 0) break;//直到i整除到某质数
	}

而当我们遍历到一个合数时,我们同样将其与已经存入的质数相乘,并标记相乘的积为合数。

但欧拉筛的精髓之处来了。

当该数在相乘中遍历到自己的一个因数后,就需要break跳出,终止循环。

同样以12举例,当i遍历到4j遍历到2时,4%2==0,此时需要跳出,j不能继续遍历到3,若通过4*3=12来标记12,在i遍历到6时,6*2=12便会重复遍历,也违反了合数需要被自己的最小因子标记的规则。


总结

朴素筛和埃氏筛的实现原理是比较简单的,使用的场景也比较广泛,但在个别的竞赛题中会T,必须使用欧拉筛。

欧拉筛理解的过程是有点难的,但在真正理解之后思路会非常清晰,主要就是合数需要被自己的最小因子标记的规则,需要细细体会。

以上便是质数筛三种筛法的介绍,本文由凉茶coltea撰写,转载请注明出处。