【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
千百元4 小时前
FreeMove 文件夹转移工具
服务器
爬山算法4 小时前
MongoDB(113)如何使用第三方工具进行MongoDB监控?
数据库·mongodb
charlie1145141915 小时前
嵌入式Linux驱动开发——新字符设备驱动 API 概览
linux·运维·驱动开发
♛识尔如昼♛5 小时前
C 进阶(2) - 文件I/O
linux·文件i/o
顺风尿一寸5 小时前
深入 Linux 内核 6.8.12:从 Futex 到 MCS 队列自旋锁的完整同步机制剖析
linux
早日退休!!!5 小时前
大模型推理瓶颈七层分析模型
java·服务器·数据库
大山同学5 小时前
claudecode精炼版-CoreCoder
数据库·人工智能·claude code·corecoder
橙子也要努力变强5 小时前
信号的保存、阻塞与递达
linux·服务器·c++
of Watermelon League5 小时前
5、使用 pgAdmin4 图形化创建和管理 PostgreSQL 数据库
数据库·postgresql
进阶的猪6 小时前
使用printk对SPI子系统全过程的追踪
linux·服务器