【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
zhangrelay8 分钟前
三分钟云课实践速通--大学物理--python 版
linux·开发语言·python·学习·ubuntu·lubuntu
Mr_pyx10 分钟前
Java 注解(Annotation)详解:从基础到 APT 实战
java·数据库·sqlserver
℡終嚸♂68013 分钟前
n8n 未初始化接管到读取 Flag Writeup
服务器·web安全·web·n8n
djjdjdjdjjdj30 分钟前
如何用参数解构在函数入口处直接提取对象属性
jvm·数据库·python
forEverPlume42 分钟前
mysql如何批量增加表的字段_脚本化DDL操作实践
jvm·数据库·python
风翼靓崽1 小时前
linux命令杂记 - 杂乱无章
linux·运维·服务器
精益数智工坊1 小时前
物料管理是什么?物料管理的具体工作有哪些?
大数据·前端·数据库·人工智能·精益工程
handler011 小时前
Linux 进程探索:从 PCB 管理到 fork() 的写时拷贝
linux·c语言·c++·笔记·学习
m0_596406371 小时前
CSS如何高效引入样式表_对比link标签与import指令的性能差异
jvm·数据库·python
行云的逆袭1 小时前
树莓派4B安装adminer数据库简易工具
数据库