【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
镜舟科技几秒前
如何高效使用 Text to SQL 提升数据分析效率?四个关键应用场景解析
数据库·sql·数据分析
道长没有道观9 分钟前
ubuntu学习day2
服务器·学习·ubuntu
庸子22 分钟前
Active Directory域服务管理与高级应用技术白皮书
运维·服务器·网络·windows·ad
奔驰的小野码25 分钟前
本地实现Rtsp视频流推送
java·linux·后端·ffmpeg
King.62432 分钟前
数据服务化 VS 数据中台:战略演进中的价值重构
大数据·数据库·sql·oracle·重构
Elastic 中国社区官方博客33 分钟前
Elasticsearch:AI 助理 - 从通才到专才
大数据·数据库·人工智能·神经网络·elasticsearch·搜索引擎·全文检索
正点原子36 分钟前
【正点原子STM32MP257连载】第四章 ATK-DLMP257B功能测试——USB测试 #USB HOST #USB 鼠标
linux·功能测试·stm32·嵌入式硬件·计算机外设·usb
淋过很多场雨39 分钟前
现代c++获取linux系统版本号
linux·开发语言·c++
运维老司机1 小时前
FRP内网穿透代理两个web页面(多端口内网穿透)
linux·frp·内网穿透
花千树-0101 小时前
MySQL 数据库备份和恢复全指南
数据库·mysql