Java获取文件类型,FileTypeUtil、Files、MimetypesFileTypeMap、URL多种实现对比

说说需求:

工作中需要判断文件是否是音频文件,实际生产环境中,遇到用户修改文件后缀的情况,导致逻辑处理异常。

正确获取到文件的类型是核心工作了,以下是实现的方案:

  1. hutool的FileTypeUtil
  2. JDK的Files
  3. JDK的MimetypesFileTypeMap
  4. JDK的URL
  5. guava的Files

引入依赖:

xml 复制代码
<dependency>
    <groupId>cn.hutool</groupId>
    <artifactId>hutool-all</artifactId>
	<version>5.7.17</version>
</dependency>

<dependency>
    <groupId>com.google.guava</groupId>
    <artifactId>guava</artifactId>
    <version>33.1.0-jre</version>
</dependency>

代码实现:

java 复制代码
public class FileTypeUtils {
    protected final static MimetypesFileTypeMap fileTypeMap = new MimetypesFileTypeMap();
    public static void main(String[] args) throws IOException {
        List<File> files = Arrays.asList(
                new File("E:\\GPT-SoVITS\\demo\\ambor\\原音频.wav"),
                new File("E:\\GPT-SoVITS\\demo\\ambor\\原音频(修改后缀).mp3"),
                new File("E:\\GPT-SoVITS\\demo\\ambor\\3925干音_响度归一化.mp3"));
        for (File file : files) {
            System.out.println(file.getName()+"\n\tgetFileTypeByHuTool:\t"+
                    getFileTypeByHuTool(file)+"\n\tgetFileTypeByJdkFiles:\t"+
                    getFileTypeByJdkFiles(file)+"\n\tgetFileTypeByJdkMimetypesFileTypeMap:\t"+
                    getFileTypeByJdkMimetypesFileTypeMap(file)+"\n\tgetFileTypeByJdkURLs:\t"+
                    getFileTypeByJdkURLs(file)+"\n\tgetFileTypeByGuavaFiles:\t"+
                    getFileTypeByGuavaFiles(file)+"\n\t");
        }

    }

    protected static String getFileTypeByHuTool(File file){
        return FileTypeUtil.getType(file);
    }

    protected static String getFileTypeByJdkFiles(File file) throws IOException {
        return Files.probeContentType(file.toPath());
    }

    protected static String getFileTypeByJdkMimetypesFileTypeMap(File file) {
        return fileTypeMap.getContentType(file);
    }

    protected static String getFileTypeByJdkURLs(File file) throws IOException {
        URLConnection conn = file.toURL().openConnection();
        return conn.getContentType();
    }

    protected static String getFileTypeByGuavaFiles(File file) throws IOException {
        return com.google.common.io.Files.getFileExtension(file.getPath());
    }
}

输出结果:

  • ×标识的为识别失败。
原音频.wav 原音频(修改后缀).mp3 3925干音_响度归一化.mp3
getFileTypeByHuToolwav wav mp3 × mp3
getFileTypeByJdkFiles audio/wav audio/mpeg × audio/mpeg
getFileTypeByJdkMimetypesFileTypeMap audio/x-wav audio/mpeg × audio/mpeg
getFileTypeByJdkURLs audio/x-wav audio/x-wav content/unknown ×
getFileTypeByGuavaFiles wav mp3 × mp3

结论:

优先使用JDK URL的检测方式,再使用JDK Files方式,优点是无需引入额外的依赖包,也能保证正确性。

相关推荐
Java程序员-小白2 小时前
Spring Boot整合Sa-Token框架(入门篇)
java·spring boot·后端·sa-token
NE_STOP2 小时前
Docker--初识Dockerfile
java
码哥字节3 小时前
升到 Spring Boot 4.1,虚拟线程开了,HikariCP 连接池却崩了
java·springboot·claude code
devilnumber3 小时前
java自定义事件处理器极简版:「外卖点餐」场景
java·开发语言
J2虾虾3 小时前
Spring AI Alibaba - 智能体作为工具(Agent Tool)
java·人工智能·spring
Hesionberger3 小时前
巧用异或找出唯一数字(多解)
java·数据结构·python·算法·leetcode
铁链鞭策大师3 小时前
javaEE之多线程(2)
java·前端·java-ee
Devin~Y3 小时前
从内容社区到AIGC客服:Spring Boot、Redis、Kafka、K8s、RAG的三轮大厂Java面试对话(附标准答案)
java·spring boot·redis·spring cloud·kafka·kubernetes·micrometer
それども3 小时前
怎么理解TCP的状态
java·网络·网络协议·tcp/ip·dubbo