【Shell】模拟爬虫下载天龙八部小说

Shell脚本:

bash 复制代码
#curl https://tianlong.5000yan.com/ -o tianlong.html
grep "href=" tianlong.html | grep html | awk -F"\"" '{ print $6 }' >> urls.txt
grep "href=" tianlong.html | grep html | awk -F">" '{ print $3 }' | awk -F"<" '{ print $1 }' >>titles.txt

exec 3<urls.txt
exec 4<titles.txt

while read -u 3 url && read -u 4 title
do
	echo "$title : $url"
	curl "$url" -o "${title}.html"
done

exec 3<&-
exec 4<&-

下载后的文件:

下载后的效果:

相关推荐
2401_873479408 分钟前
企业安全运营中,如何用IP离线库提前发现失陷主机?三步实现风险画像
网络·数据库·python·tcp/ip·ip
周末也要写八哥1 小时前
数据库安装 | SQL Server2022安装教程及网盘下载地址
数据库
三千里1 小时前
ZSH的简单配置
linux·zsh·terminal
李燚1 小时前
erlang_migrate 架构拆解:behaviour 驱动的多数据库迁移引擎
数据库·postgresql·架构·erlang·migrate·behaviour·erlang_migrate
Jinkxs1 小时前
PostgreSQL - 全文检索的开启与基础使用
数据库·postgresql·全文检索
Jinkxs1 小时前
Python基础 - 文件的写入操作 write与writelines方法
android·服务器·python
提伯斯6462 小时前
解决Fast-Drone-250编译相关错误
linux·ros·无人机·fast-drone
情绪总是阴雨天~2 小时前
检索增强生成 (RAG) 四大检索策略详解
数据库·prompt·检索增强
学Linux的语莫2 小时前
redis的数据类型和使用
数据库·redis·缓存
liulilittle2 小时前
过冲:拥塞控制的呼吸与盲行
linux·网络·c++·tcp/ip·计算机网络·tcp·通信