【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
十年编程老舅13 分钟前
Linux DRM:底层逻辑与实践架构
数据库·mysql
Qt程序员19 分钟前
Linux RCU 原理与应用
linux·c++·内核·linux内核·rcu
The Sheep 202330 分钟前
Vue复习
linux·服务器·数据库
兄台の请冷静32 分钟前
Linux 安装es
linux·elasticsearch·jenkins
云边有个稻草人43 分钟前
深度解析:KingbaseES高可用架构落地原理与生产运维实战
数据库·读写分离·数据库运维·金仓数据库·国产数据库技术·数据备份恢复
fengyehongWorld1 小时前
Linux rg命令
linux
满天星83035771 小时前
【Qt】信号和槽(二) (自定义信号和槽)
开发语言·数据库·qt
pride.li1 小时前
海思视觉Hi3516CV610--开机自动设置ip
linux·网络·网络协议·tcp/ip
我叫张小白。1 小时前
CentOS 7 安装 Docker并配置镜像加速(完整指南)
linux·docker·centos
源图客2 小时前
Minio配置HTTPS服务
服务器·网络协议·https