算法刷题笔记 字符串哈希(C++实现)

文章目录

题目描述

  • 给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2
  • 请你判断[l1,r1][l2,r2]这两个区间所包含的字符串子串是否完全相同。
  • 字符串中只包含大小写英文字母和数字。

输入格式

  • 第一行包含整数nm,表示字符串长度和询问次数。
  • 第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。
  • 接下来m行,每行包含四个整数l1,r1,l2,r2,表示一次询问所涉及的两个区间。
  • 注意,字符串的位置从1开始编号。

输出格式

  • 对于每个询问输出一个结果,如果两个字符串子串完全相同则输出Yes,否则输出No
  • 每个结果占一行。

数据范围

  • 1 ≤ n,m ≤ 10^5

基本思路

  • 字符串哈希是一种非常常用的哈希方式,很多与字符串有关的算法问题都可以通过字符串哈希得到快速解决。
  • 字符串哈希的方法被称为字符串前缀哈希法。在这种方法中,哈希表中下标为i的单元存储着字符串中前i个字符构成的子串对应的哈希值。我们可以把字符串视为一个P进制的数字(这里的P一般取13113331),不同的字符都转换为其对应的唯一的ASCII码。
  • 通过上面的方式,对于任意一个字符串,我们都可以将其转换为一个P进制的数字。这个数字一般都非常大,所以我们除了会使用最大的整型unsigned long long之外(这里使用无符号整型也可以起到溢出自动取模的作用,并且至少使用8个字节进行存储)会对该数据取模,模数为264次方。这样的取法使得发生哈希冲突的可能性最小。
  • 在字符串哈希中有两个注意事项:首先,我们不能将任意字符映射为数字0;其次,我们假设字符串哈希过程中都不会发生哈希冲突。
  • 在字符串哈希中,只需要对一个字符串构建好了哈希表,则可以求出其中任意一个子串的哈希值。当子串的左端点下标为L,右端点下标为R时,该子串对应的哈希值为:h[R]- h[L - 1] * p^(R-L+1),具体的证明过程略。

实现代码

cpp 复制代码
#include <iostream>
using namespace std;

// 分别表示字符串长度、询问次数和每一次的查询内容
int n, m;
int l1, r1, l2, r2;
// 分别表示字符串的长度上限和所采用的P值
const int N = 100010;
const int P = 131;
// 分别用于存储字符串、字符串对应的前缀哈希表以及P的幂次
char str[N];
unsigned long long hash_table[N], p_power[N];

int main(void)
{
    // 输入部分,构建哈希表
    cin >> n >> m;
    p_power[0] = 1;
    for(int i = 1; i <= n; ++ i)
    {
        cin >> str[i];
        hash_table[i] = hash_table[i - 1] * P + str[i];
        p_power[i] = P * p_power[i - 1];
    }
    // 查询部分
    for(int i = 0; i < m; ++ i)
    {
        cin >> l1 >> r1 >> l2 >> r2;
        unsigned long long hash1 = hash_table[r1] - hash_table[l1 - 1] * p_power[r1 - l1 + 1];
        unsigned long long hash2 = hash_table[r2] - hash_table[l2 - 1] * p_power[r2 - l2 + 1];
        if(hash1 == hash2) cout << "Yes" << endl;
        else cout << "No" << endl;
    }
    
    return 0;
}
相关推荐
向阳@向远方14 分钟前
第二章 简单程序设计
开发语言·c++·算法
zyxzyx66637 分钟前
Flyway 介绍以及与 Spring Boot 集成指南
spring boot·笔记
Mr_Xuhhh1 小时前
信号与槽的总结
java·开发语言·数据库·c++·qt·系统架构
github_czy1 小时前
RRF (Reciprocal Rank Fusion) 排序算法详解
算法·排序算法
liulilittle1 小时前
VGW 虚拟网关用户手册 (PPP PRIVATE NETWORK 基础设施)
开发语言·网络·c++·网关·智能路由器·路由器·通信
许愿与你永世安宁2 小时前
力扣343 整数拆分
数据结构·算法·leetcode
爱coding的橙子2 小时前
每日算法刷题Day42 7.5:leetcode前缀和3道题,用时2h
算法·leetcode·职场和发展
ruanjiananquan992 小时前
c,c++语言的栈内存、堆内存及任意读写内存
java·c语言·c++
西岭千秋雪_2 小时前
Redis性能优化
数据库·redis·笔记·学习·缓存·性能优化
满分观察网友z2 小时前
从一次手滑,我洞悉了用户输入的所有可能性(3330. 找到初始输入字符串 I)
算法