深度优先遍历策略

深度优先搜索是一种在开发爬虫的早期使用较多的方法。它的目的是达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件)。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索一条单独的链。深度优先搜索沿着HTML文件上的超链走到不能再深入为止,然后返回到某一个HTML文件,再继续选择该HTML文件中的其他超链。当不再有其他超链可选择时,说明搜索已经结束。优点是能遍历一个Web站点或深层嵌套的文档集合;缺点是因为Web结构相当深,有可能出现一旦进去便再也出不来的情况。

相关推荐
Wpa.wk8 小时前
接口测试 - 接口测试工具 Postman-基础使用
经验分享·测试工具·lua·postman
Zfox_12 小时前
无缝穿越系统边界:节点小宝4.0如何让我的Mac/iOS像访问本地盘一样操控Windows
windows·macos·ios·节点小宝
syt_biancheng13 小时前
大规模考试系统性能优化与风险评估
python·功能测试·selenium·性能优化·postman
liliangcsdn15 小时前
如何在jupyter-lab显示http链接的图片
python·jupyter
MicJordan15 小时前
macos安装Claude提示command not found
macos
坠金15 小时前
mac电脑网络卡顿解决方法
macos
写点啥呢16 小时前
MacOS远程桌面报错0x207解决方法
macos
CrankZ17 小时前
幕译 1.7--本地字幕生成与翻译--支持macOS,Windows
macos·whisper
ashcn200118 小时前
autohotkey模拟mac中英文切换和ESC切成英文(适配vim)
macos·autohotkey
大猫熊猫18 小时前
【ios】xcode运行项目时报错 Showing All Errors Only Framework ‘Pods_Runner‘ not found
macos·ios·xcode