go 爬虫之 colly 简单示例

1. 背景

colly 是 Go 实现的比较有名的一款爬虫框架,而且 Go 在高并发和分布式场景的优势也正是爬虫技术所需要的。它的主要特点是轻量、快速,设计非常优雅,并且分布式的支持也非常简单,易于扩展。

2. 官方文档

https://go-colly.org/docs/

3. colly 安装

go 复制代码
go get -u github.com/gocolly/colly

4. 简单示例

go 复制代码
package main

import (
	"fmt"

	"github.com/gocolly/colly"
)

func main() {
	// 创建一个新的爬虫实例
	c := colly.NewCollector()

	// 设置回调函数来处理每个找到的链接
	c.OnHTML("title", func(e *colly.HTMLElement) {
		fmt.Println("Title:", e.Text)
	})

	// 开始爬取指定 URL
	c.Visit("https://baidu.com")
}
  • 执行后的效果:
相关推荐
minji...25 分钟前
Linux 线程同步与互斥(三) 生产者消费者模型,基于阻塞队列的生产者消费者模型的代码实现
linux·运维·服务器·开发语言·网络·c++·算法
Dxy123931021632 分钟前
Python基于BERT的上下文纠错详解
开发语言·python·bert
hrhcode2 小时前
【java工程师快速上手go】二.Go进阶特性
java·golang·go
wjs20242 小时前
JavaScript 语句
开发语言
cmpxr_3 小时前
【C】局部变量和全局变量及同名情况
c语言·开发语言
小碗羊肉4 小时前
【从零开始学Java | 第三十一篇下】Stream流
java·开发语言
Tomhex4 小时前
Go字符串拼接最佳实践
golang·go
aq55356005 小时前
Laravel10.x重磅升级,新特性一览
android·java·开发语言
zs宝来了5 小时前
Go 内存管理:三色标记 GC 与逃逸分析
golang·go·后端技术