【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
名不经传的养虾人2 分钟前
从0到1:企业级AI项目迭代日记 Vol.46|三个检索源、缓存限流、深度整合——联网检索一日冲刺
数据库·人工智能·agent·ai编程·ai工作流·企业ai
LoserChaser4 分钟前
Flask 文件上传服务器 - 知识点总结
服务器·python·flask
BugShare9 分钟前
Mac 上原生开发的开源免费、尽享丝滑数据库工具
数据库·macos·开源
Java爱好狂.9 分钟前
阿里1658页2026最新Java面试题总结(含答案)
数据库·redis·程序员·java面试·java面试题·java编程·java八股文
難釋懷16 分钟前
Nginx对上游服务器使用keepalive
服务器·nginx·github
vortex518 分钟前
Linux 传统设计哲学:通过调用名区分行为的艺术
linux·运维·网络
jieyucx24 分钟前
《Go 数据库编程开篇:彻底打通 database/sql 与 MySQL 驱动的连接池调优密码》
数据库·sql·golang
白露与泡影27 分钟前
深入理解MySQL事务隔离级别:MVCC机制与Next-Key Lock如何解决幻读问题?
数据库·mysql
Gong-Yu28 分钟前
MySQL数据库运维——性能优化进阶2️⃣
运维·数据库·mysql·性能优化
深圳恒讯28 分钟前
非洲服务器延迟高吗?实测数据与场景化解读
运维·服务器·前端