【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
jiayong236 分钟前
Claude Code 常见操作实战指南
linux·服务器·网络·ai·claude·claude code
醇氧23 分钟前
【Linux 】sudo、sudo -i、su、su - 完整区别总结
linux·运维·服务器
网易CodeWave-小码哥24 分钟前
AI Coding沙龙杭州站回顾,共探ISV效能利润双增长
数据库·人工智能
xiaoye-duck38 分钟前
《Linux系统编程》System V IPC 进阶:消息队列与信号量从入门到内核
linux
代码熬夜敲Q1 小时前
网络工程相关
linux·服务器·网络
我先去打把游戏先1 小时前
VMware NAT 模式 Ubuntu 虚拟机「宿主机能上网、虚拟机 ping 不通外网 + apt 更新卡死」全故障复盘
linux·运维·vscode·单片机·嵌入式硬件·ubuntu·keil5
开压路机1 小时前
基础IO
linux·运维·服务器
gstl1 小时前
sql执行顺序
数据库·sql
本地化文档1 小时前
psycopg3-docs-l10n
数据库·python·postgresql·github·gitcode·sphinx
Safeploy安策数据1 小时前
从算法到架构:构建企业级数据库加密与密钥防护体系的实战手册
数据库·安全·架构