以下是一个基于Go 1.19的站点模板爬虫的示例代码:
Go
package main
import (
"fmt"
"io/ioutil"
"net/http"
"regexp"
)
func main() {
// 站点URL
url := "http://example.com"
// 发起HTTP GET请求
resp, err := http.Get(url)
if err != nil {
fmt.Printf("请求失败:%v", err)
return
}
defer resp.Body.Close()
// 读取响应的HTML内容
html, err := ioutil.ReadAll(resp.Body)
if err != nil {
fmt.Printf("读取响应失败:%v", err)
return
}
// 使用正则表达式提取模板
re := regexp.MustCompile(`<title>(.*?)</title>`)
matches := re.FindSubmatch(html)
if len(matches) > 1 {
template := string(matches[1])
fmt.Printf("站点模板:%s\n", template)
} else {
fmt.Println("未找到站点模板")
}
}
这个示例代码演示了使用Go标准库进行简单的HTTP GET请求,然后使用正则表达式提取站点模板。你可以根据实际需求修改正则表达式或者使用其他的HTML解析库来提取更多内容。