【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
墨染天姬19 分钟前
【AI】linux-windows即将消亡,未来模型即系统
linux·人工智能·windows
我不听你讲话1 小时前
关系型与非关系型数据库视角下的 MySQL:特性解析与 Linux 部署实践
linux·mysql·nosql
Fcy6482 小时前
Linux下 进程控制(一) —— 进程的创建、终止和等待
linux·运维·elasticsearch·进程控制·进程创建、终止、等待
prince055 小时前
用户积分系统怎么设计
java·大数据·数据库
原来是猿7 小时前
MySQL【内置函数】
数据库·mysql
難釋懷7 小时前
Redis分片集群插槽原理
数据库·redis·缓存
万象.7 小时前
Linux传输层TCP,UDP相关内容
linux·tcp/ip·udp
冷小鱼7 小时前
pgvector 向量数据库完全指南:PostgreSQL 生态的 AI 增强
数据库·人工智能·postgresql
陈天伟教授8 小时前
人工智能应用- 天文学家的助手:08. 星系定位与分类
前端·javascript·数据库·人工智能·机器学习
MaximusCoder8 小时前
等保测评命令——Centos Linux
linux·运维·经验分享·python·安全·centos