java遍历文件目录去除中文文件名

文章目录

一、原始需求

需要遍历文件目录及其子目录,找出包含中文字符的文件名,将中文字符去除。

二、maven依赖

pom.xml

xml 复制代码
		<dependency>
			<groupId>org.apache.commons</groupId>
			<artifactId>commons-lang3</artifactId>
			<version>3.10</version>
		</dependency>
		<dependency>
			<groupId>commons-io</groupId>
			<artifactId>commons-io</artifactId>
			<version>2.5</version>
		</dependency>
		
        <!--Test-->
		<dependency>
			<groupId>org.junit.jupiter</groupId>
			<artifactId>junit-jupiter-api</artifactId>
			<version>5.5.2</version>
			<scope>test</scope>
		</dependency>

三、核心代码

注意处理:

  • 中文路径(如:E:/test/a/测试/b)
  • 全中文文件(如:E:/test/a/测试文本.txt)
  • 无后缀文件(如:E:/test/a/b/测试文件)
java 复制代码
import java.io.File;
import java.util.List;
import java.util.stream.Collectors;

import org.apache.commons.io.FileUtils;
import org.apache.commons.lang.RandomStringUtils;
import org.apache.commons.lang3.RegExUtils;
import org.apache.commons.lang3.StringUtils;
import org.apache.commons.lang3.time.DateFormatUtils;
import org.junit.jupiter.api.Test;

import lombok.extern.slf4j.Slf4j;

@Slf4j
public class FileTest
{
    /**
     * 中文正则
     */
    private String REGEX_CHINESE = "[\u4e00-\u9fa5]";
    
    /**
     * 移除中文文件名
     */
    @Test
    public void removeChineseTest()
    {
        File dir = new File("E:\\test");
        List<File> files = FileUtils.listFiles(dir, null, true).stream().filter(f -> f.isFile()).collect(Collectors.toList());
        files.stream().forEach(file -> {
            String srcName = file.getName();
            String destName = RegExUtils.removePattern(srcName, REGEX_CHINESE);
            if (!StringUtils.equals(srcName, destName))
            {
                // 处理全中文和无后缀文件
                if (StringUtils.startsWith(destName, ".") || StringUtils.isBlank(destName))
                {
                    // 随机数防止重名
                    destName = DateFormatUtils.format(System.currentTimeMillis(), "MMddHHmmssSSS_") + RandomStringUtils.randomAlphabetic(5) + destName;
                }
                File destFile = new File(file.getParent() + File.separator + destName);
                Boolean result = file.renameTo(destFile);
                log.info("{} ---> {}, ====== result: {}", file.getAbsolutePath(), destFile.getAbsolutePath(), result);
            }
        });
    }
}

四、运行结果

bash 复制代码
2024-03-15 19:13:37.983 [main] INFO  com.fly.files.FileTest - E:\test\a\b\_内容20230676190031.jpg ---> E:\test\a\b\_20230676190031.jpg, ====== result: true
2024-03-15 19:13:37.986 [main] INFO  com.fly.files.FileTest - E:\test\a\文件_20230676190035.jpg ---> E:\test\a\_20230676190035.jpg, ====== result: true
2024-03-15 19:13:37.987 [main] INFO  com.fly.files.FileTest - E:\test\中文_20230676154641.jpg ---> E:\test\_20230676154641.jpg, ====== result: true
2024-03-15 19:13:37.988 [main] INFO  com.fly.files.FileTest - E:\test\哈哈_20230676154717.png ---> E:\test\_20230676154717.png, ====== result: true
2024-03-15 19:13:37.988 [main] INFO  com.fly.files.FileTest - E:\test\嗯嗯_20230676190039.jpg ---> E:\test\_20230676190039.jpg, ====== result: true
2024-03-15 19:13:37.989 [main] INFO  com.fly.files.FileTest - E:\test\测试_20230676154623.jpg ---> E:\test\_20230676154623.jpg, ====== result: true
2024-03-15 19:13:37.989 [main] INFO  com.fly.files.FileTest - E:\test\维修_20230676155003.jpg ---> E:\test\_20230676155003.jpg, ====== result: true

有任何问题和建议,都可以向我提问讨论,大家一起进步,谢谢!

-over-

相关推荐
tg-zm8899964 小时前
2025返利商城源码/挂机自动收益可二开多语言/自定义返利比例/三级分销理财商城
java·mysql·php·laravel·1024程序员节
X***C8624 小时前
SpringBoot:几种常用的接口日期格式化方法
java·spring boot·后端
前端达人4 小时前
你的App消息推送为什么石沉大海?看Service Worker源码我终于懂了
java·开发语言
小光学长4 小时前
基于ssm的宠物交易系统的设计与实现850mb48h(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
java·前端·数据库
编程大师哥4 小时前
vxe-table 透视表分组汇总及排序基础配置
java
8***84824 小时前
spring security 超详细使用教程(接入springboot、前后端分离)
java·spring boot·spring
9***J6284 小时前
Spring Boot项目集成Redisson 原始依赖与 Spring Boot Starter 的流程
java·spring boot·后端
M***Z2105 小时前
SQL 建表语句详解
java·数据库·sql
v***7945 小时前
Spring Boot 热部署
java·spring boot·后端
执笔论英雄5 小时前
【RL】python协程
java·网络·人工智能·python·设计模式