Go语言中的文件与IO:bufio 和 scanner

Go 标准库中的 bufio 包提供了带缓冲的读写功能,可以显著提高文件和数据处理效率。而 bufio.Scanner 则是读取文本文件中每一行的利器,常用于日志、配置等文本处理场景。


一、为什么使用 bufio

直接对文件进行 os.File.Read()os.File.Write() 操作是无缓冲的,每次调用都会进行系统调用,效率较低。

bufio 在内部使用内存缓冲区,减少与操作系统的交互,性能提升明显。


二、bufio.Reader:带缓冲的读取

示例:读取文件内容并逐行输出

scss 复制代码
file, err := os.Open("sample.txt")
if err != nil {
    log.Fatal(err)
}
defer file.Close()

reader := bufio.NewReader(file)

for {
    line, err := reader.ReadString('\n')
    if err == io.EOF {
        break
    }
    if err != nil {
        log.Fatal(err)
    }
    fmt.Print(line)
}

方法说明:

  • ReadString(delim byte):读到指定分隔符为止(如 \n)。
  • ReadBytes(delim byte):与 ReadString 类似,但返回字节切片。
  • ReadLine():低级函数,建议用 Scanner 替代。
  • Peek(n int):读取但不消费前 n 个字节。

三、bufio.Writer:带缓冲的写入

css 复制代码
file, _ := os.Create("output.txt")
defer file.Close()

writer := bufio.NewWriter(file)
writer.WriteString("Hello, buffered write!\n")
writer.Flush() // 必须显式刷新缓冲区

注意: 使用 bufio.Writer 写入数据后,需要调用 Flush() 将数据写入底层文件或网络连接,否则可能数据不会立即写入。


四、bufio.Scanner:按行或自定义分隔符扫描输入

1. 按行读取文本文件

css 复制代码
file, _ := os.Open("sample.txt")
defer file.Close()

scanner := bufio.NewScanner(file)
for scanner.Scan() {
    fmt.Println(scanner.Text())
}

if err := scanner.Err(); err != nil {
    log.Fatal(err)
}

2. 自定义分隔符(如按空格、逗号、段落分隔)

css 复制代码
scanner := bufio.NewScanner(strings.NewReader("go is simple. go is fast."))

// 自定义按单词分割
scanner.Split(bufio.ScanWords)

for scanner.Scan() {
    fmt.Println(scanner.Text())
}

常见分割器:

  • bufio.ScanLines(默认)
  • bufio.ScanWords
  • bufio.ScanBytes

五、Scanner 与大文件的关系

  • Scanner 默认缓冲区大小为 64K,如需处理超大行文本,可以通过 scanner.Buffer() 提高上限:
go 复制代码
scanner.Buffer(make([]byte, 1024), 10*1024*1024) // 提升最大支持到10MB

六、小结

类型 功能 适合场景
bufio.Reader 提供高效逐行或按字节读取 网络流、日志、长行文本等
bufio.Writer 高效写入并可缓冲 写文件、网络输出
bufio.Scanner 方便读取行、单词等小粒度内容 配置文件、日志文件、终端输入

七、建议实践练习

    1. 写一个程序,读取大文件并统计每一行的字符数。
    1. 模拟 tail -f,持续从文件末尾读取新增内容。
    1. 实现一个按单词频率排序的词频统计器。

相关推荐
2501_9411486114 小时前
C++实时数据处理实战:多线程与异步IO结合高性能代码解析
java·后端·struts
IT_陈寒14 小时前
Redis实战:5个高频应用场景下的性能优化技巧,让你的QPS提升50%
前端·人工智能·后端
mzlogin14 小时前
借助 Let's Encrypt 节省 SSL 证书费用
后端·devops
虎子_layor15 小时前
单机压测从百到三千:一次短链跳转服务的全链路性能优化实战
后端·性能优化
SelectDB15 小时前
Apache Doris 中的 Data Trait:性能提速 2 倍的秘密武器
数据库·后端·apache
zhengzizhe15 小时前
LangGraph4j LangChain4j JAVA 多Agent编排详解
java·后端
程序员鱼皮15 小时前
又被 Cursor 烧了 1 万块,我麻了。。。
前端·后端·ai·程序员·大模型·编程
福大大架构师每日一题15 小时前
2025-11-27:为视频标题生成标签。用go语言,给定一个字符串 caption(视频标题),按下面顺序处理并输出一个标签: 1. 将标题中的各个词合并成一
后端
程序员爱钓鱼15 小时前
Go语言 OCR 常用识别库与实战指南
后端·go·trae
tonydf15 小时前
动态表单之后:如何构建一个PDF 打印引擎?
后端