深度优先遍历策略

深度优先搜索是一种在开发爬虫的早期使用较多的方法。它的目的是达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件)。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索一条单独的链。深度优先搜索沿着HTML文件上的超链走到不能再深入为止,然后返回到某一个HTML文件,再继续选择该HTML文件中的其他超链。当不再有其他超链可选择时,说明搜索已经结束。优点是能遍历一个Web站点或深层嵌套的文档集合;缺点是因为Web结构相当深,有可能出现一旦进去便再也出不来的情况。

相关推荐
qq_448011161 分钟前
Mac手动删除应用
macos
张小凡vip1 小时前
数据挖掘(三) ----- JupyterHub与Jupyter Notebook的区别和安装JupyterHub
人工智能·jupyter·数据挖掘
小鹿软件办公1 小时前
Google Chrome 151 版本将停止 macOS 12 Monterey 支持
chrome·macos
cypking1 小时前
一、Mac 下 JDK + Maven 安装配置文档(Bash 终端 / Source 生效)
java·macos·maven
张小凡vip1 小时前
数据挖掘(二) ----- Jupyter Notebook使用示例和常见问题
人工智能·jupyter·数据挖掘
玉梅小洋2 小时前
macOS 安装 Claude Code 完整教程
vscode·macos·ai编程
weixin_462446232 小时前
JupyterLab 禁用 Terminal 的三种方法(安装记录,仅供参考)
python·jupyter·jupyterlab
DYS_房东的猫2 小时前
macOS 上 C++ 开发完整指南(2026 年版)
开发语言·c++·macos
海上飞猪2 小时前
【Redis】Redis基础与测试环境搭建(Mac版)入门
数据库·redis·macos
软件小滔2 小时前
沉浸式Mac写作利器 Ulysses 深度体验
macos·mac·ulysses·应用推荐