算法刷题笔记 字符串哈希(C++实现)

文章目录

题目描述

  • 给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2
  • 请你判断[l1,r1][l2,r2]这两个区间所包含的字符串子串是否完全相同。
  • 字符串中只包含大小写英文字母和数字。

输入格式

  • 第一行包含整数nm,表示字符串长度和询问次数。
  • 第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。
  • 接下来m行,每行包含四个整数l1,r1,l2,r2,表示一次询问所涉及的两个区间。
  • 注意,字符串的位置从1开始编号。

输出格式

  • 对于每个询问输出一个结果,如果两个字符串子串完全相同则输出Yes,否则输出No
  • 每个结果占一行。

数据范围

  • 1 ≤ n,m ≤ 10^5

基本思路

  • 字符串哈希是一种非常常用的哈希方式,很多与字符串有关的算法问题都可以通过字符串哈希得到快速解决。
  • 字符串哈希的方法被称为字符串前缀哈希法。在这种方法中,哈希表中下标为i的单元存储着字符串中前i个字符构成的子串对应的哈希值。我们可以把字符串视为一个P进制的数字(这里的P一般取13113331),不同的字符都转换为其对应的唯一的ASCII码。
  • 通过上面的方式,对于任意一个字符串,我们都可以将其转换为一个P进制的数字。这个数字一般都非常大,所以我们除了会使用最大的整型unsigned long long之外(这里使用无符号整型也可以起到溢出自动取模的作用,并且至少使用8个字节进行存储)会对该数据取模,模数为264次方。这样的取法使得发生哈希冲突的可能性最小。
  • 在字符串哈希中有两个注意事项:首先,我们不能将任意字符映射为数字0;其次,我们假设字符串哈希过程中都不会发生哈希冲突。
  • 在字符串哈希中,只需要对一个字符串构建好了哈希表,则可以求出其中任意一个子串的哈希值。当子串的左端点下标为L,右端点下标为R时,该子串对应的哈希值为:h[R]- h[L - 1] * p^(R-L+1),具体的证明过程略。

实现代码

cpp 复制代码
#include <iostream>
using namespace std;

// 分别表示字符串长度、询问次数和每一次的查询内容
int n, m;
int l1, r1, l2, r2;
// 分别表示字符串的长度上限和所采用的P值
const int N = 100010;
const int P = 131;
// 分别用于存储字符串、字符串对应的前缀哈希表以及P的幂次
char str[N];
unsigned long long hash_table[N], p_power[N];

int main(void)
{
    // 输入部分,构建哈希表
    cin >> n >> m;
    p_power[0] = 1;
    for(int i = 1; i <= n; ++ i)
    {
        cin >> str[i];
        hash_table[i] = hash_table[i - 1] * P + str[i];
        p_power[i] = P * p_power[i - 1];
    }
    // 查询部分
    for(int i = 0; i < m; ++ i)
    {
        cin >> l1 >> r1 >> l2 >> r2;
        unsigned long long hash1 = hash_table[r1] - hash_table[l1 - 1] * p_power[r1 - l1 + 1];
        unsigned long long hash2 = hash_table[r2] - hash_table[l2 - 1] * p_power[r2 - l2 + 1];
        if(hash1 == hash2) cout << "Yes" << endl;
        else cout << "No" << endl;
    }
    
    return 0;
}
相关推荐
啊阿狸不会拉杆24 分钟前
《算法导论》第 27 章 - 多线程算法
java·jvm·c++·算法·图论
Easocen24 分钟前
Mybatis学习笔记(五)
笔记·学习·mybatis
重启的码农29 分钟前
ggml介绍 (8) 图分配器 (ggml_gallocr)
c++·人工智能·神经网络
火车叨位去194930 分钟前
力扣top100(day04-05)--堆
算法·leetcode·职场和发展
数据智能老司机30 分钟前
面向企业的图学习扩展——面向图的传统机器学习
算法·机器学习
重启的码农31 分钟前
ggml介绍 (9) 后端调度器 (ggml_backend_sched)
c++·人工智能·神经网络
类球状1 小时前
顺序表 —— OJ题
算法
Miraitowa_cheems1 小时前
LeetCode算法日记 - Day 11: 寻找峰值、山脉数组的峰顶索引
java·算法·leetcode
CoovallyAIHub2 小时前
方案 | 动车底部零部件检测实时流水线检测算法改进
深度学习·算法·计算机视觉
CoovallyAIHub2 小时前
方案 | 光伏清洁机器人系统详细技术实施方案
深度学习·算法·计算机视觉