【LINUX】shell中模拟爬虫

url_home="http://localhost:8080"

curl ${url_home} -o 1.html

cat 1.html | grep 'href="' | awk -F"\"" '{ print $2 }' >urls.txt

cat 1.html | grep 'href="' | awk -F"\"" '{ print 3 }' \| awk -F"\<" '{ print 1 }' | sed "s:>::g"|sed "s: :_:g" > titles.txt

打开文件1

exec 3< urls.txt

打开文件2

exec 4< titles.txt

读取文件1和文件2的内容

while read -u 3 url && read -u 4 title

do

echo "url: $url"

echo "title: $title"

curl "{url_home}/url" -o "${title}.html"

done

关闭文件

exec 3<&-

exec 4<&-

相关推荐
AI小小怪24 分钟前
在Linux服务器上安装CVAT (Docker 28.5.1)
运维·docker·容器·数据标注·cvat
KYGALYX4 小时前
在Linux中备份msyql数据库和表的详细操作
linux·运维·数据库
余—笙4 小时前
Linux(docker)安装搭建CuteHttpFileServer/chfs文件共享服务器
linux·服务器·docker
lang201509284 小时前
Linux高效备份:tar与gzip完全指南
linux·运维·服务器
IDOlaoluo4 小时前
OceanBase all-in-one 4.2.0.0 安装教程(CentOS 7/EL7 一键部署详细步骤)
linux·centos·oceanbase
wanhengidc5 小时前
云手机的基本原理
运维·服务器·游戏·智能手机·云计算
篙芷5 小时前
两台服务器 NFS 共享目录实战
运维·服务器
catoop5 小时前
在 WSL 的 Ubuntu 中安装和配置 SSH 服务
linux·ubuntu·ssh
Hard but lovely5 小时前
linux: centos 软件包管理 yum源
linux·运维·centos
悲伤小伞6 小时前
Linux_Socket_UDP
linux·服务器·网络·c++·网络协议·udp