【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
xcbeyond3 分钟前
Linux 磁盘挂载
linux·运维·服务器
正在走向自律6 分钟前
企业级数据库行标识技术深度解析:OID与ROWID的双轨架构实战
数据库·oracle·oid·rowid
LoneEon10 分钟前
Kubernetes高可用集群部署教程
linux·docker·kubernetes
PD我是你的真爱粉10 分钟前
向量数据库原理与检索算法入门:ANN、HNSW、LSH、PQ 与相似度计算
数据库·人工智能·算法
不爱吃大饼12 分钟前
redis主从节点
数据库·redis·bootstrap
Wyawsl14 分钟前
Python操作MySQL数据库
数据库·python·mysql
水彩橘子18 分钟前
PostgreSQL Streaming Replication 主从
数据库·postgresql
亚马逊云开发者36 分钟前
Amazon Aurora PostgreSQL 快速配置实战:两次点击秒级创建无服务器数据库,告别 VPC 子网安全组配置噩梦
数据库·postgresql·serverless
晴天sir39 分钟前
Redis 在业务中的几种典型用法
java·数据库·redis
小羽网安39 分钟前
Linux 服务器如何进行安全加固?
linux·服务器·安全