【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
雷工笔记6 小时前
数据库|SQLServer2025安装教程
数据库·sqlserver
一只自律的鸡6 小时前
【MySQL】第六章 子查询
数据库·mysql
Knight_AL7 小时前
Spring Boot 事件机制详解:原理 + Demo
java·数据库·spring boot
野人李小白7 小时前
DBeaver 界面友好,支持多种数据库,具备强大的 SQL 编辑、可视化查询、数据迁移及插件扩展功能,是开发者首选的数据库管理工具。
数据库·sql
山峰哥7 小时前
SQL索引优化实战:3000字深度解析查询提速密码
大数据·数据库·sql·编辑器·深度优先
RisunJan8 小时前
Linux命令-ldd(查看可执行程序或共享库所依赖的动态链接库)
linux·运维·服务器
实心儿儿8 小时前
Linux —— 进程概念 - 进程运行、阻塞、挂起状态
linux·运维·服务器
观音山保我别报错8 小时前
消息队列项目基础知识总结
linux·服务器·数据库
历程里程碑8 小时前
Linux 5 目录权限与粘滞位详解
linux·运维·服务器·数据结构·python·算法·tornado
酉鬼女又兒8 小时前
SQL113+114 更新记录(一)(二)+更新数据知识总结
java·服务器·前端