深入解析素数筛法:从埃氏筛到欧拉筛的算法思想与实现

**素数筛法是一种用于高效生成素数的算法。常见的素数筛法包括埃拉托斯特尼筛法(埃氏筛)和欧拉筛(线性筛)。**下面我们将详细讲解这两种筛法的思想:

一、 埃拉托斯特尼筛法(埃氏筛)

思想:

埃氏筛的基本思想是从2开始,将每个素数的倍数标记为合数,直到筛完所有小于等于给定范围的数。具体步骤如下:

  1. 初始化一个布尔数组 isPrime[],大小为 n+1,并将所有元素初始化为 true

  2. 从2开始遍历到 sqrt(n),如果当前数 i 是素数(即 isPrime[i]true),则将其所有倍数标记为合数(即 isPrime[j] 设为 false)。

  3. 最后,所有 isPrime[i]truei 即为素数。

时间复杂度:

埃氏筛的时间复杂度为 O(n log log n)

未优化代码实现:

cpp 复制代码
const int N = 1e7; // 定义空间大小,1e7 约 10MB
int prime[N+1]; // 存放素数,记录 visit[i] = false 的项
bool visit[N+1]; // visit[i] = true 表示 i 被筛掉,不是素数

int E_sieve(int n) { // 埃氏筛法,计算 [2,n] 内的素数
    int k = 0; // 统计素数的个数
    for(int i = 0; i <= n; i++) visit[i] = false; // 初始化
    for(int i = 2; i <= n; i++) { // 从第一个素数 2 开始
        if(!visit[i]) { // 如果 i 是素数
            prime[++k] = i; // 将 i 存入 prime 数组
            for(int j = 2*i; j <= n; j += i) // 筛掉 i 的倍数
                visit[j] = true; // 标记为非素数
        }
    }
    return k; // 返回素数的个数
}

上述代码有两处可以优化:

(1)用来做筛选的数2、3、5等,最多到sqrt(n)就可以了。例如,求n=100以内的素数,用2、3、5、7筛选就足够了。其原理和试除法一样;非素数k,必定可以被一个小于或等于sqrt(k)的素数整除,被筛掉。这个优化很大,缩短了时间复杂度。

(2)for(int j = 2*i; j <= n; j += i)中的j=2*i优化为j=i*i。例如i=5,2*5,3*5,4*5已经在前面i=2,3,4的时候筛过了。这个优化较小,形如一个正方形的数组矩阵被砍成一个三角形。

优化代码实现:

cpp 复制代码
int E_sieve(int n) {
    for(int i = 0; i <= n; i++) visit[i] = false; // 初始化
    for(int i = 2; i <= sqrt(n); i++) // 只需筛到 sqrt(n)
        if(!visit[i]) // 如果 i 是素数
            for(int j = i * i; j <= n; j += i) // 从 i^2 开始筛
                visit[j] = true; // 标记为非素数
    int k = 0;
    for(int i = 2; i <= n; i++)
        if(!visit[i]) prime[++k] = i; // 存素数
    return k; // 返回素数的个数
}

埃氏筛的计算复杂度:

2的倍数被筛掉,计算n/2次;3的倍数被掉,计算n/3次;5的倍数被筛掉,计算n/5次;......;总计算量等于n/2+n/3+n/5+n/7+n/11+...,约为O(n log log n)。其计算量很接近线性的(n),已经相当好了。

空间复杂度:

代码用到了bool visit[N+1]数组,当N=10^7时约10MB。由于埃氏筛只能用于处理约n=10^7的问题,10MB空间是够用的。

埃氏筛可以计算出[2,n]内的素数,不过更常见的应用场景是计算[L,R]区间内的素数,L、R极大,但R一L较小,此时也可以用埃氏筛。

最终C++代码实现:

cpp 复制代码
#include <iostream>  // 引入输入输出流库,用于标准输入输出(如cout)
#include <vector>    // 引入向量库,用于动态数组的实现
#include <cmath>     // 引入数学库,用于数学函数(如sqrt)

// 定义埃拉托斯特尼筛法函数,参数n表示筛选素数的范围
void sieveOfEratosthenes(int n) {
    // 创建一个大小为n+1的布尔向量isPrime,初始值为true,表示所有数默认是素数
    std::vector<bool> isPrime(n + 1, true);

    // 0和1不是素数,手动设置为false
    isPrime[0] = isPrime[1] = false;

    // 从2开始遍历到sqrt(n),因为大于sqrt(n)的数的倍数已经被更小的素数标记过了
    for (int i = 2; i <= std::sqrt(n); ++i) {
        // 如果当前数i是素数(isPrime[i]为true)
        if (isPrime[i]) {
            // 从i的平方开始,将i的所有倍数标记为合数(false)
            // 因为小于i的倍数已经被更小的素数标记过了
            for (int j = i * i; j <= n; j += i) {
                isPrime[j] = false;
            }
        }
    }

    // 输出所有素数
    for (int i = 2; i <= n; ++i) {
        // 如果isPrime[i]为true,说明i是素数,输出i
        if (isPrime[i]) {
            std::cout << i << " ";
        }
    }
    // 输出换行符,使结果更美观
    std::cout << std::endl;
}

// 主函数
int main() {
    int n = 50;  // 定义筛选范围的上限为50
    sieveOfEratosthenes(n);  // 调用埃拉托斯特尼筛法函数
    return 0;  // 程序正常结束
}

二、 欧拉筛(线性筛)

思想:

欧拉筛是一种改进的筛法,能够在 O(n) 的时间复杂度内筛出所有素数。其核心思想是让每个合数只被其最小的质因数筛掉,从而避免重复标记。具体步骤如下:

  1. 初始化一个布尔数组 isPrime[],大小为 n+1,并将所有元素初始化为 true

  2. 初始化一个数组 primes[] 用于存储素数。

  3. 从2开始遍历到 n,如果当前数 i 是素数,则将其加入 primes[]

  4. 对于每个素数 primes[j],如果 i * primes[j] 超过 n 则停止;否则将 isPrime[i * primes[j]] 设为 false。如果 i 能被 primes[j] 整除,则停止内层循环。

时间复杂度:

欧拉筛的时间复杂度为 O(n)

C++实现:

cpp 复制代码
#include <iostream>
#include <vector>

void eulerSieve(int n) {
    std::vector<bool> isPrime(n + 1, true);
    std::vector<int> primes;

    for (int i = 2; i <= n; ++i) {
        if (isPrime[i]) {
            primes.push_back(i);
        }
        for (int j = 0; j < primes.size() && i * primes[j] <= n; ++j) {
            isPrime[i * primes[j]] = false;
            if (i % primes[j] == 0) {
                break;
            }
        }
    }

    // 输出所有素数
    for (int prime : primes) {
        std::cout << prime << " ";
    }
    std::cout << std::endl;
}

int main() {
    int n = 50;
    eulerSieve(n);
    return 0;
}

总结:

  • 埃氏筛 :简单易懂,时间复杂度为 O(n log log n),适合用于较小的范围。

  • 欧拉筛 :时间复杂度为 O(n),适合用于较大的范围,且避免了重复标记。

三、 例题讲解

P1835 素数密度 - 洛谷

算法代码:

cpp 复制代码
#include<bits/stdc++.h> // 包含标准库中的所有头文件
using namespace std; // 使用标准命名空间
const int N=1e6+1; // 定义常量 N,表示数组的最大大小
int prime[50000]; // 用于存储素数的数组
bool vis[N+1]; // 用于标记是否为素数的布尔数组

int E_sieve(int n) // 埃氏筛法函数,用于找出小于等于 n 的所有素数
{
    for(int i=0;i<=n;i++) // 初始化 vis 数组
    {
        vis[i]=false; // 将所有元素初始化为 false,表示初始时都认为是素数
    }
    for(int i=2;i<=sqrt(n);i++) // 从 2 开始筛除非素数
    {
        if(!vis[i]) // 如果 i 是素数
        {
            for(int j=i*i;j<=n;j+=i) // 筛除 i 的所有倍数
            {
                vis[j]=true; // 标记为非素数
            }
        }
    }
    int k=0; // 用于统计素数的个数
    for(int i=2;i<=n;i++) // 遍历所有数
    {
        if(!vis[i]) // 如果 i 是素数
        {
            prime[++k]=i; // 将素数存入 prime 数组
        }
    }
    return k; // 返回素数的个数
}

int main() // 主函数
{
    int cnt=E_sieve(50000); // 调用埃氏筛法函数,找出小于等于 50000 的所有素数,并返回素数的个数
    int L,R; // 定义区间 [L, R]
    cin>>L>>R; // 输入区间 [L, R]
    if(L==1) // 如果 L 为 1,将其调整为 2,因为 1 不是素数
    {
        L=2;
    }
    memset(vis,0,sizeof(vis)); // 初始化 vis 数组为 0
    for(int i=1;i<=cnt;i++) // 遍历所有素数
    {
        int p=prime[i]; // 获取当前素数
        long long start; // 定义筛除的起始位置
        if((L+R-1)/p*p>2*p) // 计算起始位置
        {
            start=(L+p-1)/p*p;
        }
        else
        {
            start=2*p;
        }
        for(long long j=start;j<=R;j+=p) // 筛除当前素数的倍数
        {
            vis[j-L+1]=true; // 标记为非素数
        }
    }
    int ans=0; // 用于统计区间 [L, R] 内的素数个数
    for(int i=1;i<=R-L+1;++i) // 遍历区间 [L, R]
    {
        if(!vis[i]) // 如果当前数是素数
        {
            ans++; // 素数个数加 1
        }
    }
    cout<<ans; // 输出区间 [L, R] 内的素数个数
}

代码思路

这段代码的主要功能是使用埃氏筛法找出给定区间 [L, R] 内的所有素数,并输出该区间内素数的个数。以下是代码的思路和实现步骤:


1. 包含头文件和定义常量

  • 包含标准库头文件 <bits/stdc++.h>,以便使用所有标准库函数。

  • 定义常量 N 表示数组的最大大小,prime 数组用于存储素数,vis 数组用于标记是否为素数。


2. 埃氏筛法函数 E_sieve

  • 功能 :找出小于等于 n 的所有素数。

  • 实现步骤

    1. 初始化 vis 数组,将所有元素标记为 false,表示初始时所有数都被认为是素数。

    2. 从 2 开始遍历到 sqrt(n),筛除非素数:

      • 如果当前数 i 是素数(vis[i] == false),则筛除 i 的所有倍数(从 i*i 开始,步长为 i)。

      • 将筛除的数标记为 true,表示它们是非素数。

    3. 遍历所有数,将未被筛除的数(即素数)存入 prime 数组。

    4. 返回素数的个数。


3. 主函数 main

  • 功能 :计算区间 [L, R] 内的素数个数。

  • 实现步骤

    1. 调用 E_sieve 函数,找出小于等于 50000 的所有素数,并返回素数的个数 cnt

    2. 输入区间 [L, R]

    3. 如果 L == 1,将其调整为 2,因为 1 不是素数。

    4. 初始化 vis 数组为 0,用于标记区间 [L, R] 内的数是否为素数。

    5. 遍历所有素数 prime[i]

      • 计算当前素数 p 在区间 [L, R] 内的起始筛除位置 start

      • start 开始,筛除 p 的所有倍数,并将这些数标记为非素数。

    6. 统计区间 [L, R] 内未被标记的数(即素数)的个数 ans

    7. 输出 ans


4. 关键点

  • 埃氏筛法 :用于高效找出小于等于 n 的所有素数。

  • 区间筛法 :利用埃氏筛法找出的素数,筛除区间 [L, R] 内的非素数。

  • 起始位置计算

    • 对于每个素数 p,筛除的起始位置为 max(p * 2, (L + p - 1) / p * p)

    • 这样可以避免重复筛除已经在之前步骤中处理过的数。


5. 代码优化

  • 空间优化 :使用 vis 数组标记区间 [L, R] 内的数是否为素数,而不是整个范围 [1, N]

  • 时间优化 :只筛除区间 [L, R] 内的数,避免不必要的计算。


代码流程图

初始化

  • 定义常量、数组和变量。

  • 调用 E_sieve 函数,找出小于等于 50000 的所有素数。

输入区间 [L, R]

  • 如果 L == 1,调整为 L = 2

筛除区间 [L, R] 内的非素数

  • 遍历所有素数 prime[i]

  • 计算起始位置 start

  • 筛除 p 的所有倍数,并标记为非素数。

统计素数个数

  • 遍历区间 [L, R],统计未被标记的数的个数。

输出结果

  • 输出区间 [L, R] 内的素数个数。

定位的数学思路:(难想咯)

相关推荐
神里流~霜灭几秒前
数据结构:二叉树(一)·(重点)
数据结构·c++·算法·链表·贪心算法·二叉树·
VT.馒头1 分钟前
【力扣】2666. 只允许一次函数调用——认识高阶函数
javascript·算法·leetcode·职场和发展
糖心何包蛋爱编程12 分钟前
(四)Reactor核心-前置知识3
java·开发语言·经验分享·响应式编程·streamapi
Multiple-ji14 分钟前
深入理解Python闭包与递归:原理、应用与实践
开发语言·python
Trouvaille ~18 分钟前
【Java篇】一气化三清:类的实例化与封装的智慧之道
java·开发语言·类和对象·javase·编程规范·基础入门·软件包
郝YH是人间理想19 分钟前
Python、MATLAB和PPT完成数学建模竞赛中的地图绘制
开发语言·python·数学建模·matlab·echarts
周Echo周25 分钟前
10、STL中的unordered_map使用方法
c++·哈希算法·散列表
纠结哥_Shrek30 分钟前
Java 的 正则表达式
java·开发语言·正则表达式
Lizhihao_1 小时前
JAVA-多线程join()等待一个线程
java·开发语言
重整旗鼓~1 小时前
向量数据库milvus
人工智能·算法·机器学习·向量数据库