【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
wgzrmlrm745 小时前
如何加固SQL环境部署_删除默认安装的示例数据库
jvm·数据库·python
无忧.芙桃6 小时前
进程控制(上)
linux·运维·服务器
十年编程老舅6 小时前
深入 Linux 中断:原理详解 + 实战落地
linux·网络·linux内核·c/c++·中断
Bert.Cai6 小时前
Linux rm命令详解
linux·运维
航Hang*6 小时前
Windows Server 配置与管理——第8章:配置Web服务器
运维·服务器·windows·学习·vmware
雨墨✘6 小时前
golang如何实现设备指纹识别_golang设备指纹识别实现详解
jvm·数据库·python
程序员大辉6 小时前
没想到!一直要开会员的Navicat 终于有免费版了
数据库
数厘7 小时前
2.15 sql基础查询(SELECT、FROM、字段别名、常量与表达式)
数据库·sql·oracle
知识浅谈7 小时前
OpenClaw保姆级安装教程:基于ubuntu系统
linux·ubuntu·node.js
hweiyu007 小时前
Linux命令:suspend
linux·运维·服务器