【Go语言圣经1.5】

目标

概念

要点(案例)

实现了一个简单的 HTTP 客户端程序,主要功能是:

  • 读取命令行参数:程序从命令行获取一个或多个 URL。
  • 发送 HTTP GET 请求 :使用 Go 内置的 net/http 包,通过 http.Get 函数向每个 URL 发送请求。
  • 读取并输出响应内容 :利用 io.ReadAll 读取服务器返回的响应体,将其作为字符串输出到标准输出(屏幕)。
  • 错误处理:如果请求过程中出现错误,程序会在标准错误输出(os.Stderr)中打印错误信息,并以错误状态码退出程序。

这段代码的设计思路与 Unix 下的 curl 工具有相似之处,展示了如何用 Go 编写一个最简单的 HTTP 请求工具。

  1. 包导入

    go 复制代码
    // Fetch prints the content found at a URL.
    package main
    
    import (
        "fmt"
        "io/ioutil"
        "net/http" // 实现了 HTTP 客户端和服务端的基本功能,这里主要用来发起 GET 请求。
        "os"
    )
  2. 程序入口和获取命令行参数

    go 复制代码
    func main() {
        for _, url := range os.Args[1:] {
            // ...
        }
    }
  3. 发起 HTTP GET 请求

    go 复制代码
    resp, err := http.Get(url)
    if err != nil {
        fmt.Fprintf(os.Stderr, "fetch: %v\n", err)
        os.Exit(1)
    }
    • 使用 fmt.Fprintf 将错误信息写入标准错误流,并通过 os.Exit(1) 退出程序,状态码 1 表示出现错误。
  4. 读取响应体

    go 复制代码
    b, err := io.ReadAll(resp.Body)
    resp.Body.Close()
    if err != nil {
        fmt.Fprintf(os.Stderr, "fetch: reading %s: %v\n", url, err)
        os.Exit(1)
    }
    • 服务器返回的响应体是一个流
    • 用io.ReadAll全部读取出来,并存入变量 b 中。
      • b 是由 io.ReadAll 返回的一个 []byte,它用来存储从 resp.Body 中读取到的所有数据。从这个角度看,b 就充当了一个缓冲区,其主要特点和作用如下:
        • 当你调用 io.ReadAll(resp.Body) 时,Go 语言会从网络流(resp.Body)中一次性读取所有数据,并将这些数据存储到一个新的切片 b 中。
        • 这个切片 b 就起到了"缓冲"的作用:它暂时保存了从网络中读取到的数据,方便程序后续操作(比如打印到标准输出)。
        • 为了存储数据,程序必须从操作系统申请一块内存区域,这就是"申请缓冲区"。在这里,io.ReadAll 内部会动态分配足够大小的内存来保存整个响应体的数据。
    • 关闭响应体 :调用 resp.Body.Close() 释放与响应相关的资源,防止内存或文件描述符泄露。
    • 很多程序会使用 defer resp.Body.Close() 来确保函数退出时自动关闭流,这也是 Go 中的一个重要惯用法。
      • 在更多场景下推荐使用 defer 来保证资源释放,即使函数中途发生错误也能正确关闭资源。
  5. 输出结果

    go 复制代码
    fmt.Printf("%s", b)

语言特性

  1. 检查错误:Go 语言没有异常机制,而是通过返回值来处理错误。每一步操作(如 HTTP 请求、读取流)都需要检查错误,这种显式的错误处理方式有助于写出健壮的代码。
  2. 资源管理:及时释放资源 :读取完响应体后调用 resp.Body.Close() 是非常重要的,防止资源泄露。理解这点对于编写网络或文件 I/O 程序尤为关键。
  3. 标准库的强大支持
    • net/http 包:Go 语言的标准库提供了对 HTTP 的强大支持,不仅能发起请求,还可以构建服务器,这让开发者能快速实现网络应用。
    • io 包 :提供了对 I/O 操作的统一抽象,如 io.ReadAll 能简化从流中读取数据的操作。

总结

  1. 这段代码是串行处理每个 URL,但 Go 内置的并发机制(goroutine、channel)可以很方便地改造此程序
  2. 为何在操作结束后需要关闭流(I/O流:文件流,网络流)
    • 操作系统为每个进程分配的文件描述符和网络连接数量是有限的。如果程序中频繁打开流而不关闭,长时间运行后会耗尽这些资源,导致后续无法打开新的文件或建立新的网络连接。
    • 不及时关闭流会导致资源泄露(Resource Leak),即占用的内存和其他系统资源不能被其他部分程序或其他程序使用。这种泄露会降低程序的性能,甚至引发系统崩溃或不稳定。
    • 某些流在写操作时会进行缓冲,如果不调用关闭操作,缓冲区中的数据可能没有及时刷新到磁盘或发送到网络端,可能破坏数据完整性。通过关闭流,系统会自动刷新缓冲区,确保所有数据都已经正确写入或传输。
    • 文件在打开时可能被操作系统或其他程序加锁,防止数据被同时修改。关闭文件流可以释放这些锁定,使其他进程能够正常访问文件,保障系统的安全性和数据的一致性。
  3. 缓冲区
    • 定义:在程序设计中,缓冲区是一个抽象概念,用来描述数据暂存的位置。它帮助平滑数据流的传输,比如在从磁盘读取数据或向网络发送数据时,不必每次都进行低效的逐字节操作,而是先把数据存入缓冲区,再统一处理。

题目

练习 1.7: 函数调用io.Copy(dst, src)会从src中读取内容,并将读到的结果写入到dst中,使用这个函数替代掉例子中的ioutil.ReadAll来拷贝响应结构体到os.Stdout,避免申请一个缓冲区(例子中的b)来存储。记得处理io.Copy返回结果中的错误。

go 复制代码
// 使用 io.Copy 将响应体直接写入标准输出,避免申请额外的缓冲区
_, err = io.Copy(os.Stdout, resp.Body)
  • 调用 io.Copy 函数,将数据从 src(这里是 resp.Body)流式复制到 dst(这里是 os.Stdout
    • io.Copy 的工作原理是创建一个固定大小(比如32KB)的缓冲区,在循环中不断地从源(src)读取一块数据,然后立即写入目标(dst)。这样,只需要维持这块缓冲区的内存,而不必为整个数据内容分配一大块连续内存区域。
    • 分块,chunk
  • 对于大文件或长响应数据,直接拷贝可以减少内存占用。流式处理:不需要一次性把所有数据加载到内存中,有助于处理大数据流。

练习 1.8: 修改fetch这个范例,如果输入的url参数没有 http:// 前缀的话,为这个url加上该前缀。你可能会用到strings.HasPrefix这个函数。

go 复制代码
  	// 如果 URL 没有 "http://" 前缀,则自动添加
		if !strings.HasPrefix(url, "http://") {
			url = "http://" + url
		}

练习 1.9: 修改fetch打印出HTTP协议的状态码,可以从resp.Status变量得到该状态码。

go 复制代码
// 打印出 HTTP 协议的状态码
fmt.Fprintf(os.Stdout, "HTTP status: %s\n", resp.Status)
相关推荐
钢铁男儿11 分钟前
C# 实战_RichTextBox选中某一行条目高亮,离开恢复
开发语言·c#
依旧阳光的老码农25 分钟前
Windows下使用 VS Code + g++ 开发 Qt GUI 项目的完整指南
开发语言·windows·qt
等什么君!28 分钟前
SpringMVC处理请求映射路径和接收参数
java·开发语言·spring
曹牧36 分钟前
Java:XML被自动转义
xml·java·开发语言
愚润求学38 分钟前
【专题刷题】二分查找(一):深度解刨二分思想和二分模板
开发语言·c++·笔记·leetcode·刷题
EnigmaCoder40 分钟前
java面向对象编程【基础篇】之基础语法
java·开发语言
tanyongxi6640 分钟前
手撕C++STL list:深入理解双向链表的实现
开发语言·c++·链表
草海桐1 小时前
go 的 net 包
网络·golang·net
沙尘暴炒饭1 小时前
vuex持久化vuex-persistedstate,存储的数据刷新页面后导致数据丢失
开发语言·前端·javascript
Msshu1231 小时前
诱骗协议芯片支持PD2.0/3.0/3.1/PPS协议,支持使用一个Type-C与电脑传输数据和快充取电功能
c语言·开发语言·电脑