java replaceAll 正则逐个替换字符串的效率低问题验证

2024年6月21日

问题

今天突然有个代码步骤变快了,之前要几分钟执行完成,突然十几秒就能结束,这两天只调整了用replaceAll替换字符串的地方,写了一段程序一测,还真是! 旧逻辑:近万条数据,每条可能要替换几百个字符,很耗时,每条都当做O(N) 新逻辑:每条先检查长度,要替换的字符超过6个直接换成"******",快,每条当做O(1) 艹昨天我还写正则预查哪哪好用,今天就打脸

测试代码

写代码测了下两种耗时,一万条String,每条替换中间的100个字符

java 复制代码
public class Main {
    public static void main(String[] args) {
        int size = 10000;//一万
        // 104个字符
        String s = "xx1234567890123456789012345678901234567890123456789012345678901234567890123456789012345678901234567890xx";
        List<String> list = new ArrayList<>(size);
        for (int i = 0; i < size; i++) {
            list.add(s);
        }
        {
            long begin = System.currentTimeMillis();
            List<String> res = new ArrayList<>(size);
            list.forEach(item -> {
                String str = item.replaceAll("(?<=.{2}).(?=.{2})", "*");
                res.add(str);
            });
            long end = System.currentTimeMillis();
            System.out.println("正则替换:(?<=.{2}).(?=.{2}) 替换每个字符,耗时毫秒:" + (end - begin));
        }
        {
            long begin = System.currentTimeMillis();
            List<String> res = new ArrayList<>(size);
            list.forEach(item -> {
                String str = item.substring(0,4) + "******";
                res.add(str);
            });
            long end = System.currentTimeMillis();
            System.out.println("普通替换字符,耗时毫秒:" + (end - begin));
        }
    }
}

结果,正则替换250ms,截取替换只要3ms

java 复制代码
正则替换:(?<=.{2}).(?=.{2}) 替换每个字符,耗时毫秒:250
普通替换字符,耗时毫秒:3

时间差距不大,换成一百万条数据再试,一百万条数据每条替换100个字符,好,时间差了300倍:

java 复制代码
正则替换:(?<=.{2}).(?=.{2}) 替换每个字符,耗时毫秒:8221
普通替换字符,耗时毫秒:27

又试了下一万条条数据每条替换100*100个字符,正则替换数量级相近,普通替换只要2ms

java 复制代码
正则替换:(?<=.{2}).(?=.{2}) 替换每个字符,耗时毫秒:7292
普通替换字符,耗时毫秒:2

结论,replaceAll用正则逐个替换字符效率不太乐观,一万×一万个字符耗时7-8秒;普通替换字符串方法受数据量影响,但不是很大,都比较快

相关推荐
纵横八荒11 分钟前
Java基础加强13-集合框架、Stream流
java·开发语言
稚辉君.MCA_P8_Java29 分钟前
kafka解决了什么问题?mmap 和sendfile
java·spring boot·分布式·kafka·kubernetes
乄bluefox31 分钟前
保姆级docker部署nacos集群
java·docker·容器
欣然~38 分钟前
百度地图收藏地址提取与格式转换工具 说明文档
java·开发语言·dubbo
玩毛线的包子1 小时前
Android Gradle学习(十三)- 配置读取和文件写入
java
青岛少儿编程-王老师1 小时前
CCF编程能力等级认证GESP—C++6级—20250927
java·c++·算法
一條狗2 小时前
学习日报 20251007|深度解析:基于 Guava LoadingCache 的优惠券模板缓存设计与实现
java·oracle·loadingcache
Miraitowa_cheems2 小时前
LeetCode算法日记 - Day 64: 岛屿的最大面积、被围绕的区域
java·算法·leetcode·决策树·职场和发展·深度优先·推荐算法
Lisonseekpan2 小时前
Spring Boot 中使用 Caffeine 缓存详解与案例
java·spring boot·后端·spring·缓存
为java加瓦3 小时前
Rust 的类型自动解引用:隐藏在人体工学设计中的魔法
java·服务器·rust