【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
TDengine (老段)16 分钟前
TDengine 数据修复与迁移 — VGroup 调度、S3 外挂与运维操作
大数据·运维·数据库·物联网·时序数据库·iot·tdengine
努力努力再努力wz26 分钟前
【Qt入门系列】一文掌握 Qt 常用显示类控件:QLCDNumber、QProgressBar 与 QCalendarWidget
c语言·开发语言·数据结构·数据库·c++·git·qt
m0_7373025831 分钟前
读懂OpenClaw:新一代开源自主AI智能体的革新与价值
服务器
小白学大数据34 分钟前
爬虫优化:Python 剔除无效超时代理实操
服务器·爬虫·python
KaiwuDB34 分钟前
KaiwuDB 开源校园行扬州大学站 | 点亮开源成长之路
数据库·开源
utf8mb4安全女神35 分钟前
shell中的判断语法
linux·运维·服务器
玫幽倩1 小时前
2026盘古石取证决赛(APK取证)
数据库·python·电子取证·aes·隐藏·笔记软件·手机取证
Navicat中国1 小时前
如何在 DBA 团队中管理共享查询库
数据库·dba
mifengxing1 小时前
操作系统(五)
linux·运维·服务器·操作系统·王道考研
土星云SaturnCloud1 小时前
边缘计算赋能烟草行业数字化转型
服务器·人工智能·ai·边缘计算