【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
神奇椰子5 分钟前
Linux系统更换软件源说明文档
linux·运维·服务器
小猪写代码5 分钟前
壹:烧录Linux系统
linux·ubuntu
ITyunwei09878 分钟前
数字化转型与遗留系统:如何为老旧的IT系统“减负“并注入新活力?
运维·网络·数据库
SelectDB21 分钟前
强行拍平?全表扫描? AI Agent 动态 JSON 的观测分析
数据库·人工智能·数据分析
Cinema KI22 分钟前
Linux C/C++ 编译构建:GCC/G++ + Makefile 零基础完整教程
linux·c语言·c++
风曦Kisaki23 分钟前
#Linux Shell 编程入门 Day05 :awk文本数据处理基础
linux·运维
wanhengidc32 分钟前
BGP服务器的功能是什么
运维·服务器·安全·web安全·智能手机
万邦科技Lafite36 分钟前
如何通过 item_search_img API 接口获取淘宝商品信息
java·前端·数据库
雨辰AI39 分钟前
面试题:人大金仓事务隔离级别、MVCC 机制详解(与MySQL差异对比)
数据库·后端·mysql·面试·政务
Maguyusi39 分钟前
Ubuntu26.04 编译 abseil-cpp protobuf v33.6
linux·protobuf·abseil