深度优先搜索是一种在开发爬虫的早期使用较多的方法。它的目的是达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件)。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索一条单独的链。深度优先搜索沿着HTML文件上的超链走到不能再深入为止,然后返回到某一个HTML文件,再继续选择该HTML文件中的其他超链。当不再有其他超链可选择时,说明搜索已经结束。优点是能遍历一个Web站点或深层嵌套的文档集合;缺点是因为Web结构相当深,有可能出现一旦进去便再也出不来的情况。
相关推荐
2501_9160074721 小时前
提升 iOS 26 系统流畅度的实战指南,多工具组合监控wangxiaosu21 小时前
macos安装、更新、使用homebrew心灵宝贝1 天前
Mac版PDF Squeezer v4.5.1安装教程(DMG文件下载+详细步骤)前端架构师-老李1 天前
Java开发—JDK的安装和版本管理(macOS)Digitally1 天前
如何将 Android 联系人备份到 Mac 的 4 种简单一勺菠萝丶1 天前
在 macOS 上用 Docker 为 Java 后端 & 常见开发需求搭建完整服务(详尽教程)woshihonghonga1 天前
PyTorch矩阵乘法函数区别解析与矩阵高级索引说明——《动手学深度学习》3.6.3、3.6.4和3.6.5 (P79)猿小猴子2 天前
在 MacOS Tahoe 上使用VMware虚拟机安装 ARM版 Windows11feiyangqingyun2 天前
Qt项目作品在苹果macos上编译运行效果/视频监控系统/物联网平台等