416. 现代 Java I/O 最佳实践 - 高效、简洁、安全地处理文本与数据

416. 现代 Java I/O 最佳实践 - 高效、简洁、安全地处理文本与数据

1. 🎯 引言

在日常应用开发(特别是 Web 应用)中,我们经常会遇到以下 I/O 操作:

  • 读取/写入文本文件
  • 从网络读取文本、图片、JSON
  • 遍历目录下的文件
  • 读取 ZIP 压缩文件
  • 创建临时文件或目录

Java 的 I/O API 很强大,从 Java 7 引入的 java.nio.file.Files 一直到 Java 18UTF-8 默认支持,给我们带来了很多便利。

👉 需要注意的是:

  • 旧的 java.io.Filejava.io.BufferedReader 已经过时,虽然它们在搜索结果中仍然很多,但在现代 Java 中应尽量避免。
  • UTF-8 Java 18 之后已经是默认字符集(JEP 400),不用再手动指定,大大减少了编码问题。

2. 📖 读取文本文件

最简单的方式:

java 复制代码
var path = Path.of("/usr/share/dict/words");
String content = Files.readString(path);
System.out.println(content);

🔎 补充说明:

  • Files.readString(path) 会一次性把文件内容读入字符串。

  • 在 Java 18 之前,为了避免编码问题,通常需要:

    java 复制代码
    Files.readString(path, StandardCharsets.UTF_8);

    但现在默认就是 UTF-8,不需要再写。


3. 📑 按行读取文本文件

如果我们需要逐行处理:

java 复制代码
List<String> lines = Files.readAllLines(path);

但对于 大文件 ,不建议一次性读入,而是用 流式处理

java 复制代码
try (Stream<String> lines = Files.lines(path)) {
    lines.filter(line -> line.contains("Java"))
         .forEach(System.out::println);
}

✅ 注意:Files.lines 返回的是 Stream<String>,需要 try-with-resources 来确保自动关闭。

🚫 不推荐再使用 BufferedReader.readLine()


4. 🔤 使用 Scanner 进行分词读取

有时我们需要 按单词 拆分,而不是按行。可以用 Scanner

java 复制代码
try (Scanner scanner = new Scanner(path)) {
    scanner.useDelimiter("\\PL+"); // 非字母作为分隔符
    while (scanner.hasNext()) {
        System.out.println(scanner.next());
    }
}

🚀 进阶写法:直接转成 Stream<String>

java 复制代码
Stream<String> tokens = new Scanner(path)
        .useDelimiter("\\PL+")
        .tokens();

tokens.limit(10).forEach(System.out::println);

5. 🔢 读取数字与本地化问题

Scanner 也能读取数字,但要注意 本地化陷阱 。 比如文本中有 100.000

  • 在美国 (US) 本地化下,它表示 100.0
  • 在德国 (DE) 本地化下,它表示 100000.0

👉 如果涉及本地化,应该使用 NumberFormat

java 复制代码
NumberFormat nf = NumberFormat.getInstance(Locale.GERMANY);
Number num = nf.parse("100.000");
System.out.println(num); // 输出 100000

🎓 总结(课堂收尾)

  • 读取整文件Files.readString(path)
  • 逐行处理Files.lines(path) + 流式操作
  • 分词处理Scanner + useDelimiter
  • 数字处理 :注意本地化,推荐 NumberFormat

✅ 从 Java 18 开始,UTF-8 已经是默认编码,大部分时候不用再操心字符集问题。 🚫 避免使用过时的 FileBufferedReader.readLine,用 FilesStreams 来写现代化 I/O。

相关推荐
星栈10 小时前
别让 API 跳去登录页:我在 Axum 里做了认证失败双通道
前端·后端·开源
倚栏听风雨10 小时前
EdgeValue 详细分析
后端
前端繁华如梦10 小时前
three.js从盒子到链条的程序化三维实现
前端·javascript
用户7138742290010 小时前
OAuth 2.0 中的state参数:从规范到实践的深度解析
后端
倚栏听风雨10 小时前
StateGraph 详细分析
后端
用户7138742290010 小时前
Cookie 深度技术指南:从原理到安全实践
后端
用户802238477340710 小时前
Tailwind CSS 生产环境部署优化与 CDN 使用规范
前端
倚栏听风雨10 小时前
AsyncCommandAction 详细分析
后端
倚栏听风雨10 小时前
Edge 详细分析
后端