【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
微风起皱4 小时前
Keepalived 高可用集群
运维·服务器
盖头盖4 小时前
【无参数_Rce】
服务器
嵌入式×边缘AI:打怪升级日志4 小时前
编写 Bootloader 实现烧录功能
数据库
czxyvX5 小时前
007-Linux进程概念及周边知识
linux
砚边数影6 小时前
模型持久化(二):从 KingbaseES 加载模型,实现离线预测
数据库·机器学习·kingbase·模型推理·数据库平替用金仓·金仓数据库
Eternity∞6 小时前
Linux系统下,C语言基础
linux·c语言·开发语言
LateFrames7 小时前
IIS 窗口不显示,但是任务栏状态正常
服务器·windows·microsoft
feng68_7 小时前
HAProxy算法实践
linux·运维·haproxy
Ama_tor7 小时前
Navicat学习01|初步应用实践
数据库·navicat
山岚的运维笔记7 小时前
SQL Server笔记 -- 第65章:迁移 第66章:表值参数
数据库·笔记·sql·microsoft·sqlserver