【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
AllData公司负责人2 分钟前
亲测丝滑,体验跃迁|AllData通过集成开源项目Cube-Studio,降低机器学习落地门槛
java·大数据·数据库·人工智能·机器学习·开源·cube-studio
hyunbar3 分钟前
Ollama 本地安装 C盘太小怎么办
服务器·人工智能
Ms_lan12 分钟前
同方工业携手桂花网:广州某养老院智慧健康监测实践案例
运维·服务器·网络
sailing-data15 分钟前
【OS zephyr】make与cmake
linux·运维·服务器
❀搜不到17 分钟前
ubuntu 更新cmake
linux·运维·ubuntu
Mr_pyx17 分钟前
TypeScript 完全入门指南:从基础到项目配置
linux·运维·ubuntu
KaMeidebaby21 分钟前
卡梅德生物技术快报|抗体的制备与纯化:分子实验实操:番茄 sHSP 重组表达与抗体的制备与纯化工艺
前端·数据库·人工智能·其他·算法·百度·新浪微博
LinuxRos24 分钟前
从 MCU 到 Linux:机器人嵌入式OTA升级原理解密
linux·单片机·嵌入式硬件·物联网·iot
幻灭行度26 分钟前
Redis ACL 实现多账号权限隔离
数据库·redis·oracle
Kurisu57527 分钟前
深度解析:Go 语言 GMP 调度器模型与内核线程探测
java·数据库·golang