【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
暮云星影5 小时前
全志linux开发屏幕适配(一)屏幕参数设置说明
linux·arm开发
Maynor9965 小时前
我用 Codex 给自己的网站上线了一个智能体客服:从 Dify 到服务器部署,全程实战复盘
运维·服务器
东风破1375 小时前
达梦数据库实战:备份恢复与数据迁移全攻略(实例初始化、服务注册、路径迁移)
数据库·chrome
聚名网5 小时前
域名net,com,cn有区别吗?有哪些不同呢?
服务器·开发语言·php
SelectDB技术团队5 小时前
2026 SelectDB AI 产品发布会:Agent Native 数据基础设施能力全景发布
数据库·人工智能·agent·apache doris·selectdb
爱吃羊的老虎5 小时前
【数据库】模块一:数据库基础与关系代数
数据库
小小小花儿5 小时前
SSH密钥配置(免密连接远程服务器)
服务器·ssh
dishugj6 小时前
iSCSI + Multipath + ASM:Oracle RAC 共享存储技术链详解
数据库·oracle
yoothey6 小时前
MySQL事务机制解析 - 面试高分知识点
数据库·mysql·面试
swordbob6 小时前
NIO 的 Channel 里有多个 BIO 吗?
linux·网络·nio