【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
2401_8920709811 小时前
【Linux C++ 日志系统实战】LogFile 日志文件管理核心:滚动策略、线程安全与方法全解析
linux·c++·日志系统·日志滚动
XDHCOM11 小时前
ORA-32484重复列名错误,ORACLE数据库CYCLE子句故障修复与远程处理方案
数据库·oracle
lwx91485211 小时前
Linux-Shell算术运算
linux·运维·服务器
翻斗包菜11 小时前
PostgreSQL 日常维护完全指南:从基础操作到高级运维
运维·数据库·postgresql
somi711 小时前
ARM-驱动-02-Linux 内核开发环境搭建与编译
linux·运维·arm开发
呆瑜nuage11 小时前
MySQL表约束详解:8大核心约束实战指南
数据库·mysql
liliangcsdn12 小时前
Agent Memory智能体记忆系统的示例分析
数据库·人工智能·全文检索
双份浓缩馥芮白12 小时前
【Docker】Linux 迁移 docker 目录(软链接)
linux·docker
那个失眠的夜12 小时前
Mybatis延迟加载策略
xml·java·数据库·maven·mybatis
Rick199312 小时前
SQL 执行流程
数据库·sql