Java获取文件类型,FileTypeUtil、Files、MimetypesFileTypeMap、URL多种实现对比

说说需求:

工作中需要判断文件是否是音频文件,实际生产环境中,遇到用户修改文件后缀的情况,导致逻辑处理异常。

正确获取到文件的类型是核心工作了,以下是实现的方案:

  1. hutool的FileTypeUtil
  2. JDK的Files
  3. JDK的MimetypesFileTypeMap
  4. JDK的URL
  5. guava的Files

引入依赖:

xml 复制代码
<dependency>
    <groupId>cn.hutool</groupId>
    <artifactId>hutool-all</artifactId>
	<version>5.7.17</version>
</dependency>

<dependency>
    <groupId>com.google.guava</groupId>
    <artifactId>guava</artifactId>
    <version>33.1.0-jre</version>
</dependency>

代码实现:

java 复制代码
public class FileTypeUtils {
    protected final static MimetypesFileTypeMap fileTypeMap = new MimetypesFileTypeMap();
    public static void main(String[] args) throws IOException {
        List<File> files = Arrays.asList(
                new File("E:\\GPT-SoVITS\\demo\\ambor\\原音频.wav"),
                new File("E:\\GPT-SoVITS\\demo\\ambor\\原音频(修改后缀).mp3"),
                new File("E:\\GPT-SoVITS\\demo\\ambor\\3925干音_响度归一化.mp3"));
        for (File file : files) {
            System.out.println(file.getName()+"\n\tgetFileTypeByHuTool:\t"+
                    getFileTypeByHuTool(file)+"\n\tgetFileTypeByJdkFiles:\t"+
                    getFileTypeByJdkFiles(file)+"\n\tgetFileTypeByJdkMimetypesFileTypeMap:\t"+
                    getFileTypeByJdkMimetypesFileTypeMap(file)+"\n\tgetFileTypeByJdkURLs:\t"+
                    getFileTypeByJdkURLs(file)+"\n\tgetFileTypeByGuavaFiles:\t"+
                    getFileTypeByGuavaFiles(file)+"\n\t");
        }

    }

    protected static String getFileTypeByHuTool(File file){
        return FileTypeUtil.getType(file);
    }

    protected static String getFileTypeByJdkFiles(File file) throws IOException {
        return Files.probeContentType(file.toPath());
    }

    protected static String getFileTypeByJdkMimetypesFileTypeMap(File file) {
        return fileTypeMap.getContentType(file);
    }

    protected static String getFileTypeByJdkURLs(File file) throws IOException {
        URLConnection conn = file.toURL().openConnection();
        return conn.getContentType();
    }

    protected static String getFileTypeByGuavaFiles(File file) throws IOException {
        return com.google.common.io.Files.getFileExtension(file.getPath());
    }
}

输出结果:

  • ×标识的为识别失败。
原音频.wav 原音频(修改后缀).mp3 3925干音_响度归一化.mp3
getFileTypeByHuToolwav wav mp3 × mp3
getFileTypeByJdkFiles audio/wav audio/mpeg × audio/mpeg
getFileTypeByJdkMimetypesFileTypeMap audio/x-wav audio/mpeg × audio/mpeg
getFileTypeByJdkURLs audio/x-wav audio/x-wav content/unknown ×
getFileTypeByGuavaFiles wav mp3 × mp3

结论:

优先使用JDK URL的检测方式,再使用JDK Files方式,优点是无需引入额外的依赖包,也能保证正确性。

相关推荐
我的golang之路果然有问题几秒前
积累的 java 找工作资源
java·笔记
编程大师哥10 分钟前
Java 常见异常(按「运行时 / 编译时」分类)
java·开发语言
SnrtIevg14 分钟前
Vavr 用户指南
java·后端
怦怦蓝25 分钟前
IDEA 开发邮件发送功能:全流程报错解决方案汇总
java·ide·intellij-idea·发邮件
艾莉丝努力练剑31 分钟前
【优选算法必刷100题:专题五】(位运算算法)第033~38题:判断字符是否唯一、丢失的数字、两整数之和、只出现一次的数字 II、消失的两个数字
java·大数据·运维·c++·人工智能·算法·位运算
大猫和小黄32 分钟前
Java开发过程中的各种ID生成策略
java·开发语言·id
小罗和阿泽34 分钟前
java [多线程基础 二】
java·开发语言·jvm
小罗和阿泽34 分钟前
java 【多线程基础 一】线程概念
java·开发语言·jvm
悟空码字35 分钟前
SpringBoot整合Zookeeper,实现分布式集群部署
java·zookeeper·springboot·编程技术·后端开发
橘颂TA40 分钟前
线程池与线程安全:后端开发的 “性能 + 安全” 双维实践
java·开发语言·安全