【高级数据结构】Trie树

原理

介绍

高效地存储和查询字符串的数据结构。所以其重点在于:存储、查询两个操作。

存储操作

示例和图片来自:https://blog.csdn.net/qq_42024195/article/details/88364485

假设有这么几个字符串:b,abc,abd,bcd,abcd,efg,hii。最终存储出来的Trie图如下图所示:

具体是怎么存的呢?对于每一个字符串,从树的根节点开始,依次判断当前节点的儿子节点中是否有当前字符:

  • 如果有,则进行下一个字符的判断,同时根节点更新为该儿子节点
  • 如果没有,创建一个儿子节点为当前字符,然后根节点更新为该儿子节点

如果已经到了最后一个字符,就在对应的儿子节点进行一个标记,表示从根节点到该节点的字符组成的字符串是一个单词。(对应图中的红色部分)

查询

查询和存储的操作类似。对于一个给定的字符串,从树的根节点开始,依次判断当前节点的儿子节点中是否有当前字符:

  • 如果有,则进行下一个字符的判断,同时根节点更新为该儿子节点
  • 如果没有,则说明不存在该字符串,直接返回不存在

复杂度

时间复杂度:O(max_len(s))=O(h),h为Trie树的高度,即最长字符串的长度。

空间复杂度:不超过O(N * max_len(s))。

代码实现

208. 实现 Trie (前缀树)

java 复制代码
class Trie {

    private Trie[] children; // 当前节点的所有儿子
    private boolean isEnd; // 当前节点是否为一个单词的结尾

    public Trie() {
        children = new Trie[26]; // 假设字符串中都是小写字母,那么一个节点的所有儿子最多只有26个
        isEnd = false;
    }
    
    /**
		存储操作:插入一个字符串
	*/
    public void insert(String word) {
       Trie node = this; // 从根节点开始
        for(char c : word.toCharArray()) {
            int u = c - 'a'; // [a, z] -> [0, 25]
            if (node.children[u] == null) { // 当前节点node不存在儿子节点 
                node.children[u] = new Trie(); // 创建一个节点为当前字符
            } 
            node = node.children[u]; // 更新根节点为儿子节点
        }
        node.isEnd = true;
    }
    
	/**
		查询操作:查询某个字符串是否在树中。如果在树中,可以是树中单词的前缀,也可以是完整的单词
	*/
    private Trie searchPrefix(String prefix) {
        Trie node = this; // 从根节点开始
        for(char c : prefix.toCharArray()) {
            int u = c - 'a'; // [a, z] -> [0, 25]
            if (node.children[u] == null) { // 当前节点node不存在儿子节点 
                return null;
            } 
            node = node.children[u]; // 走到儿子节点
        }
        return node;
    }
    
    public boolean search(String word) {
    	// 查询树中是否存在完整的单词
        Trie node = searchPrefix(word);
        return node != null && node.isEnd;
    }
    
    public boolean startsWith(String prefix) {
    	// 查询树中是否存在某个前缀
        return searchPrefix(prefix) != null;
    }
}

/**
 * Your Trie object will be instantiated and called as such:
 * Trie obj = new Trie();
 * obj.insert(word);
 * boolean param_2 = obj.search(word);
 * boolean param_3 = obj.startsWith(prefix);
 */

当然,Trie树也可以查询存储并查询一个单词出现了几次,只需要把isEnd改成cnt就行。当cnt为0时,表示没出现过,即不是一个完整的单词;当cnt > 0时,表示出现过,cnt的大小即为出现的次数。

相关推荐
上弦月-编程44 分钟前
C语言指针超详细教程——从入门到精通(面向初学者)
java·数据结构·算法
莫等闲-1 小时前
代码随想录一刷记录Day44——leetcode1143.最长公共子序列 53. 最大子序和
数据结构·c++·算法·leetcode·动态规划
承渊政道1 小时前
【动态规划算法】(背包问题经典模型与解题套路)
数据结构·c++·学习·算法·leetcode·动态规划·哈希算法
我头发多我先学1 小时前
C++ 红黑树:从规则到实现,手把手带你写一棵红黑树
数据结构·c++·算法
努力努力再努力wz2 小时前
【MySQL进阶系列】拒绝冗余SQL:带你透彻理解视图的底层逻辑
android·c语言·数据结构·数据库·c++·sql·mysql
m0_629494733 小时前
LeetCode 热题 100-----18.矩阵置零
数据结构·leetcode·矩阵
SunnyByte3 小时前
数据结构——算法效率
数据结构
jiushiapwojdap16 小时前
LU分解法求解线性方程组Matlab实现
数据结构·其他·算法·matlab
纽扣66717 小时前
【算法进阶之路】链表进阶:删除、合并、回文与排序全解析
数据结构·算法·链表
xvhao201319 小时前
单源、多源最短路
数据结构·c++·算法·深度优先·动态规划·图论·图搜索算法