【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
码上有光15 小时前
MySQL的基础操作——约束(上)——期末快速复习
数据库·mysql·期末复习
無限進步D15 小时前
MySQL 运算符
数据库·mysql
銳昊城15 小时前
项目九:活动目录和域的组建(1) C1
运维·服务器
2401_8676239815 小时前
JavaScript中Number-isSafeInteger的校验逻辑
jvm·数据库·python
oddsand115 小时前
原理篇-Redis数据结构
数据库·redis·缓存
risc12345615 小时前
所有“能调用大模型”的框架分类
java·服务器·前端
昆曲之源_娄江河畔15 小时前
SQL2000记录行锁定
数据库·sql2000·记录行锁定·更新锁定
Mortalbreeze15 小时前
理解文件和缓冲区
linux·服务器
(Charon)15 小时前
【C++/Qt】Qt 实现 UDP 测试工具:客户端发送、服务器监听与消息收发
服务器·qt·udp
艾莉丝努力练剑15 小时前
【Linux网络】Linux 网络编程:HTTP(一)协议初识
linux·运维·服务器·网络·tcp/ip·计算机网络·http