【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
爱睡觉1113 分钟前
在 Android 模拟器 Shell 下运行 ncnn 推理的性能排查记录
linux·shell
weixin_5206498710 分钟前
通信与TCP核心知识
服务器·网络·tcp/ip
倔强的石头_12 分钟前
kingbase备份与恢复实战(七)—— 恢复演练与验收:从“能恢复”到“可交付预案”
数据库
满昕欢喜15 分钟前
第2章 SQL Server 2019服务器管理
数据库·sqlserver
开开心心_Every17 分钟前
多连接方式的屏幕共享工具推荐
运维·服务器·pdf·电脑·excel·tornado·dash
giaz14n9X18 分钟前
Redis 分布式锁进阶第五十一篇
数据库·redis·分布式
AskHarries22 分钟前
Workspace:文件系统、项目上下文和执行边界
java·服务器·前端
落羽的落羽33 分钟前
【项目】JsonRpc框架——开发实现1(细节功能、字段定义、抽象层、具象层)
linux·服务器·网络·c++·人工智能·算法·机器学习
念越1 小时前
【数据库系统概论期末复习】第四章 数据库安全性重点与常考题整理
数据库·数据库系统概论
shixuzhimeng1 小时前
FTP服务器项目
linux·网络·ftp