Java获取文件类型,FileTypeUtil、Files、MimetypesFileTypeMap、URL多种实现对比

说说需求:

工作中需要判断文件是否是音频文件,实际生产环境中,遇到用户修改文件后缀的情况,导致逻辑处理异常。

正确获取到文件的类型是核心工作了,以下是实现的方案:

  1. hutool的FileTypeUtil
  2. JDK的Files
  3. JDK的MimetypesFileTypeMap
  4. JDK的URL
  5. guava的Files

引入依赖:

xml 复制代码
<dependency>
    <groupId>cn.hutool</groupId>
    <artifactId>hutool-all</artifactId>
	<version>5.7.17</version>
</dependency>

<dependency>
    <groupId>com.google.guava</groupId>
    <artifactId>guava</artifactId>
    <version>33.1.0-jre</version>
</dependency>

代码实现:

java 复制代码
public class FileTypeUtils {
    protected final static MimetypesFileTypeMap fileTypeMap = new MimetypesFileTypeMap();
    public static void main(String[] args) throws IOException {
        List<File> files = Arrays.asList(
                new File("E:\\GPT-SoVITS\\demo\\ambor\\原音频.wav"),
                new File("E:\\GPT-SoVITS\\demo\\ambor\\原音频(修改后缀).mp3"),
                new File("E:\\GPT-SoVITS\\demo\\ambor\\3925干音_响度归一化.mp3"));
        for (File file : files) {
            System.out.println(file.getName()+"\n\tgetFileTypeByHuTool:\t"+
                    getFileTypeByHuTool(file)+"\n\tgetFileTypeByJdkFiles:\t"+
                    getFileTypeByJdkFiles(file)+"\n\tgetFileTypeByJdkMimetypesFileTypeMap:\t"+
                    getFileTypeByJdkMimetypesFileTypeMap(file)+"\n\tgetFileTypeByJdkURLs:\t"+
                    getFileTypeByJdkURLs(file)+"\n\tgetFileTypeByGuavaFiles:\t"+
                    getFileTypeByGuavaFiles(file)+"\n\t");
        }

    }

    protected static String getFileTypeByHuTool(File file){
        return FileTypeUtil.getType(file);
    }

    protected static String getFileTypeByJdkFiles(File file) throws IOException {
        return Files.probeContentType(file.toPath());
    }

    protected static String getFileTypeByJdkMimetypesFileTypeMap(File file) {
        return fileTypeMap.getContentType(file);
    }

    protected static String getFileTypeByJdkURLs(File file) throws IOException {
        URLConnection conn = file.toURL().openConnection();
        return conn.getContentType();
    }

    protected static String getFileTypeByGuavaFiles(File file) throws IOException {
        return com.google.common.io.Files.getFileExtension(file.getPath());
    }
}

输出结果:

  • ×标识的为识别失败。
原音频.wav 原音频(修改后缀).mp3 3925干音_响度归一化.mp3
getFileTypeByHuToolwav wav mp3 × mp3
getFileTypeByJdkFiles audio/wav audio/mpeg × audio/mpeg
getFileTypeByJdkMimetypesFileTypeMap audio/x-wav audio/mpeg × audio/mpeg
getFileTypeByJdkURLs audio/x-wav audio/x-wav content/unknown ×
getFileTypeByGuavaFiles wav mp3 × mp3

结论:

优先使用JDK URL的检测方式,再使用JDK Files方式,优点是无需引入额外的依赖包,也能保证正确性。

相关推荐
居然是阿宋12 分钟前
Kotlin函数体详解:表达式函数体 vs 代码块函数体——使用场景与最佳实践
java·开发语言·kotlin
小钊(求职中)15 分钟前
Java后端开发面试题(含答案)
java·开发语言·后端·面试
lllsure17 分钟前
JWT令牌
java
北漂老男孩1 小时前
Spring Boot 配置处理器深度解析:元数据驱动的工程实践
java·spring boot·后端
我在北国不背锅1 小时前
JDBC插件式数据库连接器
java·数据库·jdbc
小徐Chao努力1 小时前
【记录手贱bug日常】IDEA 配置vmoptions后打不开,重新安装,删注册表均无用
java·bug·intellij-idea
风象南1 小时前
SpringBoot中Redis的7种序列化策略
java·spring boot·后端
其实你热情似火1 小时前
Java基础第21天-正则表达式
java·开发语言·正则表达式
向哆哆2 小时前
Java 加密与解密:从算法到应用的全面解析
java·开发语言·算法
新生农民3 小时前
30分钟解决8道算法题
java·数据结构·算法