算法基础篇(12)Trie树

1、字典树的概念

Trie树,又称为字典树 或者前缀树,是一种能够快速插入和查询字符串的数据结构。可能有人会问:在C++中,我们可以用哈希表unordered_map<string, int>来同样实现这一效果,那么为什么要使用字典树呢?其实,Trie树可以做到哈希表做不到的事情,我们接着往后看。

它利用字符串的公共前缀,将字符串组织成一个树结构,从而大大提高了存储以及查找效率。我们可以把字典树想象成一棵多叉树,每一条边代表一个字符,从根节点到某个节点的路径就代表了一个字符串。

比如,我们现在要存储"abc"这一字符串,我们先从第一个节点开始,如果没有a这条边,我们就创建一条边,然后把字符a存储在这条边上,以此类推。接着存储"abd",我们发现,a这条边在之前已经创建过了,所以我们可以直接复用这条边即可。同理,接下来b这条边也可以继续复用,最后只需要把d这条边创建出来即可。同理,也可以存储"acde"和"cd"。最后就形成这样一颗树:

但是这样简单存储的话,会带来一个问题。比如现在我们要查询"ac"这个字符串是否存在,我们访问这棵树的话,会找到ac这条路径,但事实上,这只是acde的前缀而已,我们之前并没有存储过ac这个字符串。所以,我们需要额外创建两个变量来维护信息。一个是pass:标记当前节点一共经过了多少次 ;另一个是end:标记当前字符串是以多少个字符串为结尾。此时构建出的字典树如下:

2、字典树的作用

当我们在字典树的每一个节点位置,额外维护一些信息时,就可以做到很多事情:

·查询某个单词是否出现过,并且出现几次

·查询有多少个单词是以某个字符串为前缀(这点就是哈希表做不到的)

·查询所有以某个前缀开头的单词(这个作用可以运用到输入法中,输入拼音时可以提示可能出现的词)

当然,除了上述作用以外,字典树还可以解决别的问题,后续在做题中慢慢体会。

3、字典树的实现

实现一个能够查询单词出现次数 以及查询有多少个单词是以某个字符串为前缀的字典树,默认全是小写字母。

准备工作:

cpp 复制代码
#include <iostream>
#include <cstring>
using namespace std;

const int N = 1e6 + 10;  // N表示所有字符串中一共有多少个字符

// tree[i]表示i号节点的孩子信息
// tree[i][0]表示'a'的路径信息
// tree[i][1]表示'b'的路径信息
// tree[i][2]表示'c'的路径信息
// p[i]表示i号结点的pass信息
// e[i]表示i号结点的end信息
// idx表示新来一个字符之后,为它分配位置
int tree[N][26], p[N], e[N];
int idx; 

插入字符串:

cpp 复制代码
void insert(string& s)
{
	int cur = 0;
	p[cur]++;
	
	for(auto ch : s)
	{
		int path = ch - 'a';
		if(tree[cur][path] == 0)
			tree[cur][path] = ++idx;
			
		cur = tree[cur][path];
		p[cur]++;
	}
	e[cur]++;
}

查询字符串出现的次数:

cpp 复制代码
int find(string& s)
{
	int cur = 0;
	for(auto ch : s)
	{
		int path = ch - 'a';
		if(tree[cur][path] == 0)
			return 0;
			
		cur = tree[cur][path];
	}
	return e[cur];
}

查询有多少个单词以字符串s为前缀:

cpp 复制代码
int find_pre(string& s)
{
	int cur = 0;
	for(auto ch : s)
	{
		int path = ch - 'a';
		if(tree[cur][path] == 0)
			return 0;
			
		cur = tree[cur][path];
	}
	return p[cur];
}
相关推荐
小糯米6012 小时前
C++ 单调栈原理与模板
开发语言·c++·算法
常利兵2 小时前
Android 集合探秘:ArrayMap 与 SparseArray 的奇妙之旅
android·算法·哈希算法
滴滴答滴答答2 小时前
LeetCode Hot100 之 41 缺失的第一个正数
算法·leetcode·职场和发展
rgb2gray2 小时前
论文详解:基于POI与出租车轨迹的城市多中心结构静态-动态多重分形特征
人工智能·python·算法·机器学习·数据分析·可解释
Zarek枫煜2 小时前
[特殊字符]栈(Stack)原理详解 \+ Zig / C3 双语言实现
c语言·单片机·嵌入式硬件·算法
jz_ddk2 小时前
[实战] CIC滤波器设计与实现
人工智能·算法·机器学习·数字信号处理·cic滤波器
Sakinol#2 小时前
Leetcode Hot 100 ——多维动态规划
算法·leetcode·动态规划
XZXZZX2 小时前
ATCODER ABC 450 C题解
c++·算法·ccf csp
堕2742 小时前
JavaEE初阶——《多线程--. 多线程带来的的⻛险-线程安全 (重点)》
java·算法·java-ee