【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
Codefengfeng5 小时前
CTF工具篇
linux·运维·服务器
上海合宙LuatOS5 小时前
LuatOS核心库API——【i2c】I2C 操作
linux·运维·单片机·嵌入式硬件·物联网·计算机外设·硬件工程
t***44236 小时前
MySQL 导出数据
数据库·mysql·adb
Zach_yuan6 小时前
数据链路层核心技术解析:以太网与ARP协议
服务器·网络·网络协议
翔云1234566 小时前
MySQL主从库复制中,主库如何查找对应日志文件位置
数据库·mysql
一文解千机7 小时前
wine 优化配置及显卡加速,完美运行Electron 编译的程序(新榜小豆芽、作家助手、小V猫等)
linux·ubuntu·electron·wine·wine优化配置·wine显卡加速·wine大型游戏
Mr_star_galaxy8 小时前
【MySQL基础】视图和权限管理
数据库·mysql
2401_858286118 小时前
OS53.【Linux】System V 共享内存(2)
linux·运维·服务器·共享内存
lipiaoshuigood9 小时前
MySQL 数据出海之数据同步方案
数据库·mysql
笨蛋不要掉眼泪9 小时前
Nacos配置中心详解:核心用法、动态刷新与经典面试题解析
java·数据库·后端