【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
阿伟实验室2 小时前
debian10部署简易web服务器
运维·服务器·前端
2501_941112142 小时前
Python Web爬虫入门:使用Requests和BeautifulSoup
jvm·数据库·python
Linux技术芯2 小时前
金刚经修心课 你的生活指南
linux
d***9353 小时前
Redis五种用途
数据库·redis·缓存
Armyyyyy丶3 小时前
MySQL系列之数据读取与存储核心机制
数据库·mysql·架构分析
TDengine (老段)3 小时前
TDengine 字符串函数 Replace 用户手册
java·大数据·数据库·物联网·时序数据库·tdengine·涛思数据
Kathleen1003 小时前
计算机网络——应用层
运维·服务器·计算机网络
workflower3 小时前
软件压力测试
数据库·压力测试·需求分析·个人开发·极限编程·结对编程
Mr.H01274 小时前
多线程文件拷贝:从原理到实现的完整指南
linux·运维
2501_941111824 小时前
使用Scikit-learn进行机器学习模型评估
jvm·数据库·python