【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
RisunJan4 分钟前
Linux命令-nohup(使进程忽略挂起(HUP)信号并在后台继续运行)
linux·运维·服务器
kebidaixu5 分钟前
板级设备树驱动修改实战:从PWM到CAN,释放GPIO的完整指南
linux
爱喝水的鱼丶6 分钟前
SAP-ABAP:SAP 简单报表输出开发系列(共6篇)第三篇:SAP ALV 报表样式定制:字段布局与交互功能配置
服务器·开发语言·学习·交互·sap·abap
摇滚侠9 分钟前
JDBC 基础到高级一套通关!基础篇 00-15
java·开发语言·数据库
Amnesia0_011 分钟前
MYSQL操作
数据库·mysql
兆。13 分钟前
LangChain实验跟踪集成指南:面向ML研究员
数据库·langchain
一码当前14 分钟前
【全志】 OKT153(sun8iw22) 启动链全流程详解
linux
zhojiew15 分钟前
DuckLake湖仓数据格式常用操作实践以及和Iceberg的对比
数据库
万粉变现经纪人16 分钟前
2026最新CSDN博客质量分v6.0深度解读:从评分机制到80+实战提分指南
数据库·人工智能·深度学习·csdn·csdn博客·csdn博客质量分6.0·博客质量分
键盘上的猫头鹰24 分钟前
【Linux 基础教程(一)】概述、安装与网络配置:VMware + CentOS + NAT + XShell 远程连接
linux·网络·centos