【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
Lzc77424 分钟前
Linux的基础开发工具
linux·linux的基础开发工具
搬码临时工38 分钟前
内网和外网怎么互通?外网访问内网的几种简单方式
服务器·网络·智能路由器·外网访问
等雨季1 小时前
电商双11美妆数据分析(二)
数据库
Web极客码1 小时前
如何修复WordPress数据库
服务器·数据库·wordpress
火龙谷1 小时前
【hadoop】Sqoop数据迁移工具的安装部署
数据库·hadoop·sqoop
jarreyer2 小时前
Vim 编辑器常用快捷键速查表
linux·编辑器·vim
冰激凌zz2 小时前
ubuntu nobel + qt5.15.2 设置qss语法识别正确
linux·qt·ubuntu
JhonKI2 小时前
【MySQL】存储引擎 - MyISAM详解
数据库·mysql
ikun·2 小时前
MySQL 数据库
数据库·mysql
编码雪人3 小时前
CentOS算法部署
linux·运维·centos