【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
A-刘晨阳3 小时前
AI原生时序数据库选型指南:从数据存储到智能决策的范式跃迁
数据库·时序数据库·ai-native
HalvmånEver4 小时前
MySQL的增删改查命令合集合集
数据库·sql·oracle
不剪发的Tony老师5 小时前
dblab:一款基于终端的交互式数据库客户端
数据库·sql
island13145 小时前
【C++仿Muduo库#3】Server 服务器模块实现上
服务器·开发语言·c++
xwz小王子5 小时前
Science Robotics基础模型正在改写机器人集群的“游戏规则”
数据库·人工智能·机器人
茉莉玫瑰花茶5 小时前
LangGraph 介绍
服务器·网络·数据库
倒霉蛋小马6 小时前
【Redis】利用Redis构造全局唯一ID
数据库
夕除6 小时前
springboot--06
数据库·spring boot·mybatis
mfxcyh6 小时前
如何把对象数据转化为数组
java·服务器·前端
2301_780789666 小时前
云服务器数据会泄露吗?怎么保护云服务器的数据
运维·服务器·tcp/ip·网络安全