【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
qq_163135752 分钟前
Linux 【04-more命令超详细教程】
linux
倔强的石头_18 分钟前
《Kingbase护城河》——深度解密数据库行锁冲突与等待事件架构
数据库
IT策士28 分钟前
Redis 从入门到精通:性能调优与多语言客户端对比
数据库·redis·缓存
sevencheng7981 小时前
【ADB】adb命令行常用按键模拟代码
linux·adb·模拟按键,返回键,音量键
暗影天帝1 小时前
BPI-R3 Mini 刷 Yuzhii DHCPD U-Boot 教程
linux
Bert.Cai1 小时前
Oracle INSTR函数详解
数据库·oracle
小赖同学啊1 小时前
智能连接器集群化高可用生产方案
linux·运维·人工智能
Cinema KI1 小时前
Linux第一个系统程序-进度条
linux·服务器
Moshow郑锴2 小时前
Ubuntu 26.04 更换阿里云源镜像
linux·运维·ubuntu
Jason_chen2 小时前
Linux 6.2 串口机制深度解析:AI驱动的自适应通信与零信任串口安全架构
linux