【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
cui_ruicheng6 小时前
MySQL(四):数据类型与字段设计
数据库·mysql
Full Stack Developme6 小时前
JVM 与 Linux 交互的核心原理
linux·运维·jvm
皮皮学姐分享-ppx6 小时前
政府绿色采购数据库(2015-2024.3)
大数据·网络·数据库·人工智能·制造
HackTwoHub7 小时前
最新Nessus2026.6.8版本主机漏洞扫描/探测工具Windows/Linux
linux·运维·服务器·安全·web安全·网络安全·安全架构
qq_163135757 小时前
Linux 【04-mkdir命令超详细教程】
linux
qq_163135757 小时前
Linux 【08-mv命令超详细教程】
linux
QWEDDRFTG7 小时前
C13/C19怎么选?服务器电源线电流与接口选型技巧
服务器
闪电悠米8 小时前
黑马点评-Redis 消息队列-03_stream_consumer_group
开发语言·数据库·redis·分布式·缓存·junit·lua
DIY源码阁9 小时前
JavaSwing航班订票管理系统 - MySQL版
数据库·mysql
QWEDDRFTG9 小时前
服务器电源线怎么选?接口、电流、线径、认证一次讲清
服务器