深度优先遍历策略

深度优先搜索是一种在开发爬虫的早期使用较多的方法。它的目的是达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件)。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索一条单独的链。深度优先搜索沿着HTML文件上的超链走到不能再深入为止,然后返回到某一个HTML文件,再继续选择该HTML文件中的其他超链。当不再有其他超链可选择时,说明搜索已经结束。优点是能遍历一个Web站点或深层嵌套的文档集合;缺点是因为Web结构相当深,有可能出现一旦进去便再也出不来的情况。

相关推荐
白玉cfc3 小时前
【iOS】UICollectionView
macos·ios·cocoa
fukai77223 小时前
BetterDisplay Pro for Mac显示器增强工具
macos·计算机外设
ajassi20005 小时前
开源 Objective-C IOS 应用开发(一)macOS 的使用
macos·ios
MonkeyKing_sunyuhua6 小时前
mac怎么卸载office Powerpoint
macos·powerpoint
lichong9516 小时前
【macOS 版】Android studio jdk 1.8 gradle 一键打包成 release 包的脚本
android·java·前端·macos·android studio·大前端·大前端++
fukai77227 小时前
优雅与极简:将你的屏幕变成复古翻页钟——Fliqlo for Mac 完全指南
macos
Hcoco_me9 小时前
YOLOv5(三):Jupyter
ide·yolo·jupyter
BianHuanShiZhe1 天前
ios 26的tabbar 背景透明
macos·objective-c·cocoa
ai_xiaogui1 天前
AIStarter跨平台完工:Win/Mac/Linux一键部署Stable Diffusion
linux·macos·stable diffusion·aistarter·kritaai·跨平台部署
让世界再也没有bug1 天前
JMeter与Postman的区别
测试工具·jmeter·postman