【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
念越18 小时前
【数据库系统概论期末复习】 绪论重点与常考题重点与常考题整理第一章
数据库·数据库系统概论
SXJR18 小时前
langchain4j是如何保证tools或者funcation call不出错的
java·网络·数据库·ai·语言模型
CairBin18 小时前
SideSail——Ubuntu 26.04(GNOME 50)侧边栏插件,支持设备信息剪贴板和米家设备简单控制
linux·ubuntu
Jempo M18 小时前
小品文:服务器并发模型深度解析:从原理到实践
服务器
howard200518 小时前
3.4 Linux目录操作
linux·目录操作
tedcloud12318 小时前
codegraph部署教程:构建代码库语义分析环境
服务器·人工智能·word·excel
AIMath~19 小时前
兼容pymongo=4.16版本如何安装mongodb
数据库·mongodb
念恒1230619 小时前
MySQL连接池原理与简易网站数据流动是如何进行的
数据库·mysql
Volunteer Technology19 小时前
Flink的DataStream分区操作
大数据·linux·flink
宇砾19 小时前
浅谈Redis(2)
数据库·redis·缓存