【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
vortex57 小时前
XFCE 桌面环境组件详解:从面板到剪贴板管理
linux·xfce·桌面环境
星马梦缘8 小时前
数据库作战记录 实验7、8
数据库·sql·oracle
勇闯逆流河8 小时前
【Linux】linux进程控制(进程池的详解与实现)
linux·运维·服务器
安逸sgr8 小时前
Hermes Agent + Obsidian 打造第二大脑(六):分层记忆系统的设计逻辑——L0/L1/L2/L3 四层记忆详解
数据库·agent·知识库·hermes·hermesagent
zhangfeng11338 小时前
部署到服务器上 宝塔系统 使用宝塔在线编辑器 FTP 批量上传 Git 部署 打包上传 codebudyy 编程程序开发
服务器·git·编辑器
苍煜8 小时前
一篇讲懂分库分表:概念、spirngboot实战
数据库·oracle
梦想画家9 小时前
PostgreSQL 物化视图实战:从数据固化到智能刷新的全链路指南
数据库·postgresql·物化视图
weoptions9 小时前
简单sql注入中如何通过简单语句判断注入类型&注入方法
数据库·sql
WJ.Polar9 小时前
Scapy基本应用
linux·运维·网络·python
小短腿的代码世界9 小时前
Qt数据库编程深度解析:从SQL基础到ORM架构设计
数据库·sql·qt