【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
多恩Stone5 分钟前
【系统资源监控-1】Blender批量渲染中的负载、CPU、GPU和进程管理
linux·python
莽夫搞战术7 分钟前
Linux NAS 迁移避坑指南:放弃 chown -R,ID 映射让权限配置秒完成
linux·服务器
k***459910 分钟前
C#数据库操作系列---SqlSugar完结篇
网络·数据库·c#
好好沉淀10 分钟前
IDEA如何设置以新窗口打开新项目
linux·windows·intellij-idea
大聪明-PLUS16 分钟前
C++中变量的声明和初始化
linux·嵌入式·arm·smarc
胡楚昊31 分钟前
CTF SHOW逆向
java·服务器·前端
被制作时长两年半的个人练习生37 分钟前
如何调试llama.cpp及判断是否支持RVV
linux·服务器·llama
shykevin1 小时前
Actix-Web完整项目实战:博客 API
前端·数据库·oracle
赖small强1 小时前
【音视频开发】Linux V4L2 (Video for Linux 2) 驱动框架深度解析白皮书
linux·音视频·v4l2·设备节点管理·视频缓冲队列·videobuf2