技术栈

【Shell】模拟爬虫下载天龙八部小说

因缘而起12025-04-08 11:21

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

上一篇:在Kotlin中编写依赖于时间的可测试协程代码
下一篇:使用 LLaMA-Factory 微调 llama3 模型(二)
相关推荐
Lee川
5 小时前
Milvus 实战:当 RAG 遇上向量数据库,从"玩具 Demo"到"生产可用的"那一步
前端·数据库·人工智能
t5y22
5 小时前
【Linux】定时任务调度
linux·服务器
HY小海
6 小时前
【Linux】进程概念
linux·运维·服务器
王八八。
6 小时前
linux后台java、postSQL部署命令
java·linux·运维
瑞熙贝通实验室综合管理平台
6 小时前
实验动物管理系统|以痛点为核心 构建动物房数字化管理新体系
linux
网管NO.1
7 小时前
SQL 排序分页精讲!ORDER BY+LIMIT 全套用法,报表分页
数据库·sql
MRSM_01
7 小时前
InfluxDB vs TimescaleDB,谁更适合你的场景
数据库
CAE虚拟与现实
8 小时前
Redis如何保证存和读的过程中数据的一致性?
数据库·redis·缓存
热门推荐
01GitHub 镜像站点02Codex 接入 DeepSeek API 完整配置文档03【踩坑记录 | 第一篇】微软商店无法使用时,如何手动安装 OpenAI Codex?附`.msix`文件系统错误解决方法04裂开!ChatGPT 居然开始要手机号验证,附详细解决方法05CC-Switch & Claude 基于 Linux 服务器安装使用指南06【AI】2026 年具身智能模型和世界模型总结07几个好用的ip纯净度检测网站08Codegraph 实战:用知识图谱让 AI 编程效率翻倍09装上就回不去了:CodeGraph 让 AI 编程效率飙升 92%,它到底做了什么?10Codex使用DeepSeek API的方法(cc switch + codex bridge方案)